1 of 197

2 of 197

Числовые представления текстовых данных

3 of 197

В предыдущих сериях…

4 of 197

Картинки состоят из пикселей

Источники картинок:�https://kartinkin.net/32094-piksel-art-cherno-belyj.html

= 0

= 255

= 100

= 200

5 of 197

Данные

Ядро свертки

Выходные данные

6 of 197

Гауссово размытие

Гауссово размытие (сильнее)

«Четкость»

Поиск краев

Ядра (фильтры)

Результат

7 of 197

8 of 197

11

22

33

11

22

33

11

22

33

9 of 197

10 of 197

Основные типы задач в компьютерном зрении

Классификация

Детекцирование

Семантическая сегментация

Сегментация�(Instance segmentation)

11 of 197

Разберемся с основными понятиями

1

1

0

2

Скаляр

12 of 197

Вектор на плоскости

1

[-2,3]

Скаляр

Вектор

[-2,3]

-2

3

13 of 197

Вектор в 3D

1

[1,2,3]

Скаляр

Вектор

14 of 197

1

[1,2,3]

[1,2,3],

[4,5,6],

[7,8,9]

Скаляр

Вектор

Матрица

15 of 197

Сложение векторов

[1,2,3]

Вектор

16 of 197

Умножение вектора на скаляр

[1,2,3]

Вектор

2

17 of 197

Можем их сравнивать

[1,2,3]

Вектор

18 of 197

x0

x1

x2

Линейный слой (линейная модель)

19 of 197

А как преобразовать текст в числа?

20 of 197

Оценка тональности отзыва на фильм

Фильм отличный, я в восторге!

Ужасное кино, зря потратил время.

Фильм так себе, можно посмотреть, но не шедевр.

21 of 197

Оценка тональности отзыва на фильм

Отзыв

Тональность

Фильм отличный, я в восторге!

Ужасное кино, зря потратил время.

Фильм так себе, можно посмотреть, но не шедевр.

22 of 197

Оценка тональности отзыва на фильм

Отзыв

Тональность

Фильм отличный, я в восторге!

2

Ужасное кино, зря потратил время.

0

Фильм так себе, можно посмотреть, но не шедевр.

1

23 of 197

Фильм отличный, я в восторге!

Ужасное кино, зря потратил время.

Фильм так себе, можно посмотреть, но не шедевр.

24 of 197

Фильм отличный, я в восторге!

Ужасное кино, зря потратил время.

Фильм так себе, можно посмотреть, но не шедевр.

Фильм:

Отличный:

Я:

В:

Восторге:

Ужасное:

Кино:

Потратил:

Время:

Так:

Себе:

0

1

2

3

4

5

6

7

8

9

10

25 of 197

[0 1 2 3 4]

[5 6 7 8 9]

Фильм так себе, можно посмотреть, но не шедевр.

Фильм:

Отличный:

Я:

В:

Восторге:

Ужасное:

Кино:

Зря:

Потратил:

Время:

Так:

Себе:

0

1

2

3

4

5

6

7

8

9

10

11

26 of 197

Фильм:

Отличный:

Я:

В:

Восторге:

Ужасное:

Кино:

Зря:

Потратил:

Время:

Так:

Себе:

0

1

2

3

4

5

6

7

8

9

10

11

4 + 5 = 9

27 of 197

Фильм:

Отличный:

Я:

В:

Восторге:

Ужасное:

Кино:

Зря:

Потратил:

Время:

Так:

Себе:

0

1

2

3

4

5

6

7

8

9

10

11

4 + 5 = 9

Восторге + Ужасное = Время

28 of 197

Фильм:

Отличный:

Я:

В:

Восторге:

Ужасное:

Кино:

Зря:

Потратил:

Время:

Так:

Себе:

0

1

2

3

4

5

6

7

8

9

10

11

4 + 5 = 9

Восторге + Ужасное = Время

Кино - Я = Восторге

29 of 197

Фильм:

Отличный:

Я:

В:

Восторге:

Ужасное:

Кино:

Зря:

Потратил:

Время:

Так:

Себе:

[1 0 0 0 0 0 0 0 0 0 0 … ]

One-hot-encoding:

30 of 197

Фильм:

Отличный:

Я:

В:

Восторге:

Ужасное:

Кино:

Зря:

Потратил:

Время:

Так:

Себе:

One-hot-encoding:

[1 0 0 0 0 0 0 0 0 0 0 … ]

[0 1 0 0 0 0 0 0 0 0 0 … ]

[0 0 1 0 0 0 0 0 0 0 0 … ]

31 of 197

Фильм:

Отличный:

Я:

В:

Восторге:

Ужасное:

Кино:

Зря:

Потратил:

Время:

Так:

Себе:

One-hot-encoding:

[1 0 0 0 0 0 0 0 0 0 0 … ]

[0 1 0 0 0 0 0 0 0 0 0 … ]

[0 0 1 0 0 0 0 0 0 0 0 … ]

Много слов = большой словарь

32 of 197

Фильм:

Отличный:

Я:

В:

Восторге:

Ужасное:

Кино:

Зря:

Потратил:

Время:

Так:

Себе:

One-hot-encoding:

[1 0 0 0 0 0 0 0 0 0 0 … ]

[0 1 0 0 0 0 0 0 0 0 0 … ]

[0 0 1 0 0 0 0 0 0 0 0 … ]

Много слов = большой словарь

“Ужасное” в отрицательных отзывах важнее чем “Фильм”

33 of 197

Bag of words

Фильм отличный

Ужасное кино, зря потратил время

Фильм так себе

34 of 197

Bag of words

Словарь: [фильм, отличный, ужасное, зря, восторге, время ….]

Фильм отличный

Ужасное кино, зря потратил время

Фильм так себе

35 of 197

Bag of words

Отзыв

фильм

отличный

ужасное

зря

восторге

время

Фильм отличный

Ужасное кино, зря потратил время

Фильм так себе

Словарь: [фильм, отличный, ужасное, зря, восторге, время ….]

36 of 197

Bag of words

Отзыв

фильм

отличный

ужасное

зря

восторге

время

Фильм отличный

1

1

0

0

0

0

Ужасное кино, зря потратил время

Фильм так себе

Словарь: [фильм, отличный, ужасное, зря, восторге, время ….]

37 of 197

Bag of words

Отзыв

фильм

отличный

ужасное

зря

восторге

время

Фильм отличный

1

1

0

0

0

0

Ужасное кино, зря потратил время

0

0

1

1

0

1

Фильм так себе

1

0

0

0

0

0

Словарь: [фильм, отличный, ужасное, зря, восторге, время ….]

38 of 197

Bag of words

Отзыв

фильм

отличный

ужасное

зря

восторге

время

Фильм отличный

1

1

0

0

0

0

Ужасное кино, зря потратил время

0

0

1

1

0

1

Фильм так себе

1

0

0

0

0

0

Не учитывает порядок слов

39 of 197

Bag of words

Отзыв

фильм

отличный

ужасное

зря

восторге

время

Фильм отличный

1

1

0

0

0

0

Ужасное кино, зря потратил время

0

0

1

1

0

1

Фильм так себе

1

0

0

0

0

0

Не учитывает порядок слов

Не учитывает контекст

40 of 197

Собака __ на стуле

Кошка __ на диване

Данные

41 of 197

Собака __ на стуле

Кошка __ на диване

сидит

лежит

Данные

Предсказание

42 of 197

Собака __ на стуле

Кошка __ на диване

сидит

лежит

Данные

Предсказание

Словарь:

Собака

На

Стул

Кошка

Диван

Сидит�Лежит

43 of 197

Класс:

1

2

3

4

5

6

7

Собака __ на стуле

Кошка __ на диване

сидит

лежит

Данные

Предсказание

Словарь:

Собака

На

Стул

Кошка

Диван

Сидит

Лежит

44 of 197

One-hot-encoding:

Собака __ на стуле

Кошка __ на диване

сидит

лежит

Данные

Предсказание

Словарь:

Собака

На

Стул

Кошка

Диван

Сидит

Лежит

45 of 197

Собака __ на стуле

Кошка __ на диване

сидит

лежит

Данные

Предсказание

Словарь:

Собака

На

Стул

Кошка

Диван

Сидит

Лежит

One-hot-encoding:

46 of 197

1

0

0

0

0

0

1

0

0

0

0

0

1

0

0

0

0

0

1

0

0

0

0

0

1

Собака __ на стуле

Кошка __ на диване

сидит

лежит

Данные

Предсказание

Словарь:

Собака

На

Стул

Кошка

Диван

Сидит

Лежит

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

1

0

0

1

0

One-hot-encoding:

47 of 197

Собака __ на стуле

Кошка __ на диване

сидит

лежит

Данные

Предсказание

Словарь:

Собака

На

Стул

Кошка

Диван

Сидит

Лежит

[1,0,0,0,0,0,0]

[0,1,0,0,0,0,0]

[0,0,1,0,0,0,0]

[0,0,0,1,0,0,0]

[0,0,0,0,1,0,0]

[0,0,0,0,0,1,0]�[0,0,0,0,0,0,1]�

One-hot-encoding:

вектор

48 of 197

Собака __ на стуле

Кошка __ на диване

сидит

лежит

Данные

Предсказание

[1,0,0,0,0,0,0], ______________, [0,1,0,0,0,0,0], [0,0,1,0,0,0,0]

Словарь:

Собака

На

Стул

Кошка

Диван

Сидит

Лежит

Собака , ______________, на , стуле

[1,0,0,0,0,0,0]

[0,1,0,0,0,0,0]

[0,0,1,0,0,0,0]

[0,0,0,1,0,0,0]

[0,0,0,0,1,0,0]

[0,0,0,0,0,1,0]�[0,0,0,0,0,0,1]�

One-hot-encoding:

49 of 197

Кошка __ на диване

сидит

лежит

[0,0,0,1,0,0,0], ____________, [0,1,0,0,0,0,0], [0,0,0,0,1,0,0]

Кошка , ___________ , на , диване

Предсказание

Словарь:

Собака

На

Стул

Кошка

Диван

Сидит

Лежит

1,0,0,0,0,0,0�___________

0,1,0,0,0,0,0

0,0,1,0,0,0,0

[1,0,0,0,0,0,0]

[0,1,0,0,0,0,0]

[0,0,1,0,0,0,0]

[0,0,0,1,0,0,0]

[0,0,0,0,1,0,0]

[0,0,0,0,0,1,0]�[0,0,0,0,0,0,1]�

One-hot-encoding:

50 of 197

Предсказание

Словарь:

Собака

На

Стул

Кошка

Диван

Сидит

Лежит

[0,0,0,1,0,0,0], ____________, [0,1,0,0,0,0,0], [0,0,0,0,1,0,0]

Кошка , ___________ , на , диване

1,0,0,0,0,0,0�___________

0,1,0,0,0,0,0

0,0,1,0,0,0,0

0,0,0,1,0,0,0�___________

0,1,0,0,0,0,0

0,0,0,0,1,0,0

[1,0,0,0,0,0,0]

[0,1,0,0,0,0,0]

[0,0,1,0,0,0,0]

[0,0,0,1,0,0,0]

[0,0,0,0,1,0,0]

[0,0,0,0,0,1,0]�[0,0,0,0,0,0,1]�

One-hot-encoding:

51 of 197

Машинное обучение это сложно и весело

Рассмотрим пример

52 of 197

Машинное обучение это сложно и весело

Машинное _ это

Данные:

53 of 197

Машинное обучение это сложно и весело

Машинное _ это

Обучение _ сложно

Данные:

54 of 197

Машинное обучение это сложно и весело

Машинное _ это

обучение _ сложно

это _ и

Данные:

55 of 197

Машинное обучение это сложно и весело

Машинное _ это

обучение _ сложно

это _ и

Сложно _ весело

Данные:

56 of 197

Машинное обучение это сложно и весело

Машинное _ это

обучение _ сложно

это _ и

сложно _ весело

Данные:

Словарь:

Машинное [1,0,0,0,0,0]

Обучение [0,1,0,0,0,0]

Это [0,0,1,0,0,0]

Сложно [0,0,0,1,0,0]

И [0,0,0,0,1,0]

Весело [0,0,0,0,0,1]

[1,0,0,0,0,0] [0,1,0,0,0,0] [0,0,1,0,0,0] [0,0,0,1,0,0] [0,0,0,0,1,0] [0,0,0,0,0,1]

57 of 197

Данные:

Машинное _ это

обучение _ сложно

это _ и

сложно _ весело

58 of 197

Машинное _ это

обучение _ сложно

это _ и

сложно _ весело

Данные:

Предсказание:

Обучение

Это

Сложно

И

59 of 197

Вход

Выход

Машинное

Обучение

это

Обучение

обучение

Это

сложно

Это

это

сложно

И

сложно

Машинное _ это

обучение _ сложно

это _ и

Обучение

Это

Сложно

60 of 197

Данные:

Машинное _

61 of 197

Данные:

Машинное _

Сложно

Предсказание:

62 of 197

Данные:

Машинное _

Сложно

Предсказание:

Обучение

63 of 197

Данные:

Машинное _

Сложно

Предсказание:

Обучение

Обучение

64 of 197

Данные:

Машинное _

0.2 Обучение

0.1 Это

0.6 Сложно

0.1 И

Предсказание:

65 of 197

Данные:

Машинное _

0.2 Обучение

0.1 Это

0.6 Сложно

0.1 И

Предсказание:

66 of 197

Данные:

Машинное _

0.5 Обучение

0.3 Это

0.1 Сложно

0.1 И

Предсказание:

67 of 197

Данные:

Предсказание:

Машинное _

обучение _

это _

сложно _

Обучение

Это

Сложно

И

68 of 197

Король

Слово:

69 of 197

Король

Слово:

word2vec

70 of 197

Король

Слово:

[2.1,1.9,2.1,...,1.2,1.1,2.2]

2.1

1.9

2.1

1.2

1.1

71 of 197

WORD

[2,1,3,1,1]

word2vec

72 of 197

Король

Слово:

[2.1,1.9,2.1,...,1.2,1.1,2.2]

Как можно интерпретировать эти цифры?

73 of 197

[2.1,1.9,2.1,...,1.2,1.1,2.2]

Допустим, у нас есть кандидат на вакансию, и мы хотим что-то о ней узнать

74 of 197

[2.1,1.9,2.1,...,1.2,1.1,2.2]

Мы можем оценить ее инициативность

3

-3

инициативная

безинициативная

Признак #1

75 of 197

[2.1,1.9,2.1,...,1.2,1.1,2.2]

Мы можем оценить ее инициативность

3

-3

инициативная

безинициативная

Признак #1

76 of 197

[2.1,1.9,2.1,...,1.2,1.1,2.2]

Или внимательность

3

-3

инициативная

безинициативная

Признак #1

3

-3

внимательная

невнимательная

Признак #2

77 of 197

[2.1,1.9,2.1,...,1.2,1.1,2.2]

То есть эти цифры можно рассматривать в качестве описывающих признаков

78 of 197

Король

Слово:

[2.1,1.9,2.1,...,1.2,1.1,2.2]

Эмбеддинг слова

79 of 197

Король

Слово:

[2.1,1.9,2.1,...,1.2,1.1,2.2]

[2.1,1.9,2.1,...,1.2,1.1,2.2]

 Размерность N

x

y

 Размерность 2

80 of 197

Король

Слово:

[2.1,1.9,2.1,...,1.2,1.1,2.2]

Король

[2.1,1.9,2.1,...,1.2,1.1,2.2]

 Размерность N

x

y

 Размерность 2

81 of 197

Мужчина

Слово:

Король

82 of 197

Мужчина

Слово:

[1.9,1.7,2.0,...,2.1,1.3,1.2]

Король

Мужчина

83 of 197

Женщина

Слово:

Король

Мужчина

Женщина

[1.9,1.7,2.0,...,2.1,1.3,1.2]

84 of 197

Король

Мужчина

Женщина

[2.1,...,2.2]

Король

[1.9,...,1.2]

Мужчина

-

[1.1,...,2.2]

Женщина

+

=

85 of 197

Король

Мужчина

Королева

Женщина

[2.1,...,2.2]

Король

[1.9,...,1.2]

Мужчина

=

[1.1,...,2.2]

Женщина

[0.2,0.2,0.1,...,-0.9,-0.2.,1.]

Королева

-

+

86 of 197

King to man as queen to woman

87 of 197

88 of 197

Король

Мужчина

Королева

Женщина

89 of 197

Король

Мужчина

Королева

Женщина

King

Man

Queen

Woman

90 of 197

Король

Мужчина

Королева

Женщина

King

Man

Queen

Woman

Новая парадигма для машинного перевода

91 of 197

92 of 197

Но что нам мешает делать эмбеддинги чего-то кроме слов?

93 of 197

Эмбеддинги эмодзи

94 of 197

[1.9,1.7,2.0,...,2.1,1.3,1.2]

wav2vec

95 of 197

96 of 197

Машинное обучение это сложно и весело

Словарь:

Машинное [1,0,0,0,0,0]

Обучение [0,1,0,0,0,0]

Это [0,0,1,0,0,0]

Сложно [0,0,0,1,0,0]

И [0,0,0,0,1,0]

Весело [0,0,0,0,0,1]

С этим подходом есть проблемы

97 of 197

Машинное обучение это сложно и весело

Словарь:

Машинное [1,0,0,0,0,0]

Обучение [0,1,0,0,0,0]

Это [0,0,1,0,0,0]

Сложно [0,0,0,1,0,0]

И [0,0,0,0,1,0]

Весело [0,0,0,0,0,1]

Кошка

98 of 197

Машинное обучение это сложно и весело

Словарь:

Машинное [1,0,0,0,0,0]

Обучение [0,1,0,0,0,0]

Это [0,0,1,0,0,0]

Сложно [0,0,0,1,0,0]

И [0,0,0,0,1,0]

Весело [0,0,0,0,0,1]

Кошка ???????????????

Кошка

???

99 of 197

Машинное обучение это сложно и весело

Словарь:

Машинное [1,0,0,0,0,0]

Обучение [0,1,0,0,0,0]

Это [0,0,1,0,0,0]

Сложно [0,0,0,1,0,0]

И [0,0,0,0,1,0]

Весело [0,0,0,0,0,1]

Кошка ???????????????

Кошка

???

Если слово отсутствует в словаре (который составляется из всех слов в обучающей выборке), то для него нельзя сделать эмбеддинг

100 of 197

mol2vec

101 of 197

Эмбеддинги выявляют кластеры генов с тканевой специфичностью. Кровь и селезенка имеют четкие паттерны тканеспецифических генов. В репродуктивной системе (например, в яичнике) также обнаружены гены, отличающиеся от других. Гены, недоступные в данных GTEx, окрашены в серый цвет

gene2vec

102 of 197

Геометрия культуры

103 of 197

Составные стереотипные гендерные предубеждения, измеренные с течением времени. Каждая точка данных представляет собой среднее значение абсолютных значений гендерных предубеждений мужчин по четырем областям: семья, карьера, наука и искусство.

Стереотипы

104 of 197

Еще стереотипы

105 of 197

Идеалогия в парламенте

106 of 197

Интерсекциональность - это аналитическая основа для понимания того, как аспекты социальной и политической идентичности человека в совокупности создают различные формы дискриминации и привилегий.

107 of 197

108 of 197

1 3 5 7 …

Последовательности

109 of 197

1 3 5 7 9 …

110 of 197

Акции Tesla

Источники картинок:�https://invest.yandex.ru/catalog/stock/tsla

График акции

111 of 197

20:11

Аудио

112 of 197

Музыка

113 of 197

Я опять тебе подсунул ровно то, что ты хотел

Прям тогда, когда хотел, — свежим ветром в духоте

Через форточку в башке прошелестел и улетел

Гоняя бабочек в твоём вечно голодном животе

И. Алексеев

Текст

114 of 197

И даже изображения

115 of 197

116 of 197

При желании, что угодно можно представить в виде последовательности

1 3 5 7 9 …

20:11

Последовательности

117 of 197

1D

0

1

0

-1

0

1

118 of 197

1D

0

1

-1

0

1

0

0

1

0

1

2

1

1

2

1

119 of 197

1D

0

1

-1

0

1

0

0

1

0

0

2

0

2

=

2

1

2

1

1

2

1

120 of 197

1D

0

1

0

1

0

1

0

-1

1

0

-1

0

=

2

-1

0

1

2

1

1

2

1

121 of 197

1D

0

1

1

0

0

-1

0

0

-2

0

-2

=

2

-1

0

0

-2

1

2

1

1

2

1

122 of 197

1D

0

1

1

0

-1

0

1

-1

0

1

0

=

2

-1

0

0

-2

0

1

2

1

1

2

1

123 of 197

1D

0

1

1

0

-1

0

1

0

-1

0

1

2

1

1

2

1

2

0

-2

0

-1

0

1

=

По сути эта информация уже не релевантна для сети.

124 of 197

1D

0

1

1

0

-1

0

1

0

-1

0

1

2

1

1

2

1

-1

0

1

=

Но если бы это был, например, график акций, то эту информацию хорошо бы учитывать

125 of 197

1D

0

1

1

0

-1

0

1

0

-1

0

1

2

1

1

2

1

-1

0

1

=

Но если бы это был, например, график акций, то эту информацию хорошо бы учитывать

Что можно сделать?

126 of 197

Через форточку в башке

Рассмотрим пример:

127 of 197

Через форточку в башке

ВОПРОС: где форточка?

128 of 197

Через форточку в башке

x0

x0

129 of 197

Через форточку в башке

A

x0

x0

130 of 197

Через форточку в башке

A

X

1

2

1

3

...

b

Баес (смещние)

Веса

Данные

Нейрон!

w0

w1

w2

w3

x0

x0

131 of 197

Через форточку в башке

A

h0

x0

x0

Получили состояние (state) сети

(его еще называют скрытым состоянием - hidden state).

Никакой магии, просто вектор

132 of 197

Через форточку в башке

A

h0

x1

x0

x0

x1

133 of 197

A

h0

A

x1

x0

Через форточку в башке

x0

x1

134 of 197

A

h0

A

x1

x0

Через форточку в башке

x0

x1

Память о прошлом

135 of 197

A

h0

A

x1

x0

Через форточку в башке

x0

x1

136 of 197

A

h0

A

h1

x1

x0

Через форточку в башке

x0

x1

137 of 197

A

h0

A

h1

x1

A

x2

x0

Через форточку в башке

x0

x1

x2

138 of 197

A

h0

A

h1

x1

A

h2

x2

x0

Через форточку в башке

x0

x1

x2

139 of 197

A

h0

A

h1

x1

A

h2

x2

A

h3

x3

x0

Через форточку в башке

x0

x1

x2

x3

140 of 197

A

h0

A

h1

x1

A

h2

x2

A

h3

x3

x0

Через форточку в башке

x0

x1

x2

x3

141 of 197

A

h0

A

h1

x1

A

h2

x2

A

h3

x3

x0

Через форточку в башке

x0

x1

x2

x3

A

xt

=

ht

142 of 197

A

h0

A

h1

x1

A

h2

x2

A

h3

x3

A

xt

=

x0

Через форточку в башке

x0

x1

x2

x3

Рекуррентная нейронная сеть

(Recurrent Neural Network - RNN)

ht

143 of 197

A

h0

A

h1

x1

A

h2

x2

A

h3

x3

x0

Через форточку в башке

x0

x1

x2

x3

ВОПРОС: где форточка?

144 of 197

A

h0

A

h1

x1

A

h2

x2

A

y

x3

x0

Через форточку в башке

x0

x1

x2

x3

ОТВЕТ: в башке

145 of 197

Many to one

(примеры: семантическая классификация, оценка эмоции и т.д.)

Что-то я устал. Негативная эмоция

Конфигурации RNN

146 of 197

Many to many

(примеры: понимание текста, машинный перевод)

I would like to see the baby. Мне бы хотелось увидеть ребенка

Конфигурации RNN

147 of 197

One to many

(примеры: генерация музыки, генерация текста)

*Звуки нейромузыки*

Конфигурации RNN

148 of 197

Потрясающе! У нас появилась еще одна суперспособность для науки!

149 of 197

Many to many. Text-to-Speech (TTS)

150 of 197

?

Speech-to-text (STT)

151 of 197

Many to many. Forecasting

152 of 197

One to Many. Musics generation

Основанна на ImprovRNN

153 of 197

А можно и порисовать (Sketch RNN)

154 of 197

А можно совместить CNN и RNN.

Что с их помощью можно будет сделать?

155 of 197

CNN + RNN = Image Captioning

Картинка

Март 2020

Март 2021

Март 2022

156 of 197

Сверточная сеть

Картинка

Март 2020

Март 2021

Март 2022

157 of 197

Сверточная сеть

MLP

Картинка

Март 2020

Март 2021

Март 2022

158 of 197

Сверточная сеть

MLP

Картинка

Рекуррентная сеть

Март 2020

Март 2021

Март 2022

159 of 197

Сверточная сеть

MLP

Картинка

«Влияние пандемии на здоровье населения»

Март 2020

Март 2021

Март 2022

Рекуррентная сеть

160 of 197

К этому моменту стоит задуматься: а что происходит с весами в длинных последовательностях?

Правильно, с ними все довольно грустно

161 of 197

A

A

A

A

A

A

A

A

0.9

162 of 197

A

A

A

A

A

A

A

A

0.9

163 of 197

A

A

A

A

A

A

A

A

0.9

0.6

164 of 197

A

A

A

A

A

A

A

A

0.9

0.6

0.3

165 of 197

A

A

A

A

A

A

A

A

0.9

0.6

0.3

0.1

0.0

0.0

0.0

0.0

Проблема затухающего градиента (vanishing gradient)

166 of 197

A

A

A

A

A

A

A

A

0.9

0.6

0.3

0.1

0.0

0.0

0.0

0.0

Проблема затухающего градиента (vanishing gradient)

A

A

A

A

A

A

A

A

167 of 197

A

h0

A

h1

x1

A

h3

xn

x0

x0

xn

………………………..

Можно ли что-то сделать?

168 of 197

A

h0

A

h1

x1

A

h3

xn

x0

x0

xn

………………………..

А что если последовательность очень длинная?

169 of 197

A

h0

A

h1

x1

A

h3

xn

x0

x0

xn

………………………..

Такие сети называются Bidirectional RNN (BiRNN)

170 of 197

A

A

A

A

A

A

A

A

1.1

По аналогии, что еще может произойти?

171 of 197

A

A

A

A

A

A

A

A

1.1

Проблема взрывающегося градиента (exploding gradient)

11

111

1111

1e5

1e10

1e20

1e99

172 of 197

Рекуррентная нейронная сеть

(Recurrent Neural Network - RNN)

По сути мы придумали кратковременную память

(в первую очередь мы учитываем ближайшее прошлое).

Но вспомните что-нибудь из школы?

A

xt

ht

173 of 197

Рекуррентная нейронная сеть

(Recurrent Neural Network - RNN)

А что если у нас будет еще и долговременная память?

A

h

xt

Долговременная память

Кратковременная память

с

ht

174 of 197

Long-Short Term Memory

(LSTM)

Теперь мы можем учитывать долгосрочный контекст. Например, главу в книге

A

h

xt

Долговременная память

Кратковременная память

с

ht

175 of 197

Long-Short Term Memory

(LSTM)

Но мы же не можем помнить

«бесконечное количество информации»

A

h

xt

Долговременная память

Кратковременная память

с

ht

176 of 197

Long-Short Term Memory

(LSTM)

Но мы же не можем помнить

«бесконечное количество информации»

A

h

xt

Долговременная память

Кратковременная память

с

ht

Механизм забвения

(forget gate)

177 of 197

Long-Short Term Memory

(LSTM)

Вот мы и пришли к идее LSTM

LSTM

h

xt

Долговременная память

Кратковременная память

с

ht

178 of 197

Веселый

Определение эмоций по ЭЭГ

A

xt

ht

179 of 197

В России — разруха.

Транспорт сломан.

Ты должен подумать, как выйти из этого положения.

Делай предложения!

Маяковский

Определение поэта по поэзии

A

xt

ht

180 of 197

Определение идентификатора молекулы по структуре

181 of 197

Разделение сигналов

182 of 197

Разделение сигналов

183 of 197

Разделение сигналов землетрясений

184 of 197

Классификация переменных звезд

185 of 197

Многомерные временные ряды с пропущенными значениями

186 of 197

Сейчас ливанет над физфаком!

Предсказание осадков (Nowcasting)

187 of 197

Долгосрочное прогнозирование характеристик стока рек Арктической зоны на примере реки Колыма

188 of 197

Введение в тему

Исследование Арктики имеет огромное значение для понимания природных процессов в этом регионе и разработки стратегий адаптации к изменяющимся климатическим условиям. Арктические реки, очень чувствительны к изменению климата, которое приводит к деградации вечной мерзлоты, сильно влияет на режимы стока и гидрологические процессы.

Долгосрочное прогнозирование характеристик стока необходимо для эффективного управления водными ресурсами и предотвращения опасных явлений, связанных с водным режимом.

Основная цель: разработать методику долгосрочного прогнозирования уровня воды заблаговременностью 1 месяц

189 of 197

Среднемесячные уровни воды

Гидрологические данные

190 of 197

Исходные данные, предоставленные ВНИИГМИ МЦД (Всероссийский научно-исследовательский институт гидрометеорологической информации - мировой центр данных)

Разные периоды – разная структура данных

Метеорологические данные

191 of 197

Суммарные месячные осадки

Метеорологические данные

192 of 197

Результаты

193 of 197

Неужели лекция по рекуррентным сетям уже закончилась?

Источники картинок:https://www.wallpaperbetter.com/ru/hd-wallpaper-akveu

194 of 197

Спасибо!

Канал в телеграм:

Написать отзыв:

Похлопайте как вам понравилось

195 of 197

Научные примеры из лекции

Биология:�Willett, Francis R., et al. "High-performance brain-to-text communication via handwriting." Nature 593.7858 (2021): 249-254.Spampinato, C., Palazzo, S., Kavasidis, I., Giordano, D., Souly, N., & Shah, M. (2017). Deep learning human mind for automated visual classification. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 6809-6817).

Gannouni, Sofien, et al. "Emotion detection using electroencephalography signals and a zero-time windowing-based epoch estimation and relevant electrode identification." Scientific Reports 11.1 (2021): 1-17.

Общество:�Zhang, Han, and Jennifer Pan. "Casm: A deep-learning approach for identifying collective action events with text and image data from social media." Sociological Methodology 49.1 (2019): 1-57.

Науки о Земле:

Novoselov, Artemii, Peter Balazs, and Götz Bokelmann. "Separating and denoising seismic signals with dual-path recurrent neural network architecture." (2020).

Klocek, Sylwester, et al. "MS-nowcasting: Operational Precipitation Nowcasting with Convolutional LSTMs at Microsoft Weather." arXiv preprint arXiv:2111.09954 (2021).

Гуманитарные науки:

Assael, Yannis, Thea Sommerschield, and Jonathan Prag. "Restoring ancient text using deep learning: a case study on Greek epigraphy." arXiv preprint arXiv:1910.06262 (2019).

Salami, Dariush, and Saeedeh Momtazi. "Recurrent convolutional neural networks for poet identification." Digital Scholarship in the Humanities 36.2 (2021): 472-481.

История:

Tikhonov, Aleksej, and Klaus Müller. "Scribe versus authorship attribution and clustering in historic Czech manuscripts: a case study with visual and linguistic features." Digital Scholarship in the Humanities (2021).

Междисциплинарные исследования:

Che, Zhengping, et al. "Recurrent neural networks for multivariate time series with missing values." Scientific reports 8.1 (2018):1-12.

196 of 197

Демонстрации из лекции

197 of 197

Материалы для углубленного изучения

[Видео] Очень дружелюбное объяснение RNN от Serrano.Academy

[Видео] Объяснение RNN и LSTM от Brandon Rohrer