Лекция
Полносвязная нейронная сеть
План лекции
Задача: распознавание рукописных цифр
Описание модели
Обучение модели
Описание модели
Обучение модели
Один нейрон
Модель нейрона
Модель нейрона
входы нейрона:
Модель нейрона
входы нейрона:
веса нейрона:
Модель нейрона
входы нейрона:
веса нейрона:
скалярное произведение векторов x, w:
Модель нейрона
функция активации
f(12.3)
f(t)
входы нейрона:
веса нейрона:
скалярное произведение векторов x, w:
Функция сигмоиды
Многослойный перцептрон
Многослойный перцептрон
Многослойный перцептрон
Многослойный перцептрон
wi — вектор весов
i-ого нейрона
bi — свободный член
Преобразование вектора в перцептроне
Преобразование вектора в перцептроне
линейное преобразование вектора x
Параметры нейронной сети
W1
W2
W3
Последний слой в задаче классификации
Последний слой в задаче классификации
�
Последний слой в задаче классификации
�
Последний слой в задаче классификации
�
Последний слой в задаче классификации
�
Последний слой в задаче классификации
�
Последний слой в задаче классификации
W1
W2
W3
Описание модели
Обучение модели
Обучение MLP (Multilayer Perceptron) �для задачи классификации
Обучение перцептрона
W1
W2
W3
Обучение перцептрона
W1
W2
W3
Оптимизация функции потерь
Оптимизация функции потерь
�
Оптимизация функции потерь
Оптимизация функции потерь
Оптимизация в общем случае
Можно оптимизировать и другие функции потерь. Например, Mean Squared Error в случае задачи регрессии
Стохастический градиентный спуск
Алгоритм обратного распространения ошибки (BackProp)
Производная композиции
x1
x2
f
y1
y2
g
z
слайд В. Лемпицкого
Производная композиции
x1
x2
f
y1
y2
g
z
слайд В. Лемпицкого
Вычисление глубоких производных
x0
x1
x2
x3
f1(;w1)
f2(;w2)
f3(;w3)
f4(;w4)
z
слайд В. Лемпицкого
Вычисление глубоких производных
можно вычислить
x0
x1
x2
x3
f1(;w1)
f2(;w2)
f3(;w3)
f4(;w4)
z
слайд В. Лемпицкого
Слой нейронной сети
Чтобы определить слой, необходимо задать:
Back propagation через линейный слой
Back propagation через линейный слой
линейный слой + поэлементная сигмоида
Back propagation через линейный слой
x1
x2
f
y1
y2
L
...
Back propagation через линейный слой
x1
x2
f
y1
y2
L
...
Back propagation через линейный слой
x1
x2
f
y1
y2
L
...
Back propagation через линейный слой
x1
x2
f
y1
y2
L
...
Back propagation через линейный слой
x1
x2
f
y1
y2
L
...
Back propagation через линейный слой
x1
x2
f
y1
y2
L
...
Back propagation через линейный слой
x1
x2
f
y1
y2
L
...
Реализация полносвязного слоя
Вопрос. Как устроен back propagation через слой сигмоиды?
Recap