2 of 21

План лекции

Машинное обучение, и чем оно отличается от искусственного интеллекта
Основные типы обучения
Популярные алгоритмы машинного обучения
Как линейная регрессия и кластеризация применяются для анализа данных

3 of 21

Определение

Машинное обучение (ML) — это подраздел искусственного интеллекта (ИИ), сосредоточенный на разработке алгоритмов, которые обучаются на данных и делают прогнозы или принимают решения без явного программирования.

4 of 21

Определение (продолжение)

5 of 21

Основные отличия ML от ИИ

ИИ

Общая область, включающая всё, что связано с имитацией человеческого интеллекта.

Примеры: чат-боты, автономные автомобили, системы компьютерного зрения.

Фокусируется на обучении моделей на основе данных для выполнения конкретных задач.

Примеры: прогнозирование цен, анализ биологических данных, сегментация изображений.

6 of 21

Основные типы обучения

Обучение с учителем (Supervised Learning)
Обучение без учителя (Unsupervised Learning)
Обучение с подкреплением (Reinforcement Learning)

7 of 21

1. Обучение с учителем (Supervised Learning)

Обучение на размеченных данных, где известен правильный ответ.

Цель: предсказать метки для новых данных.

Примеры алгоритмов: линейная регрессия, деревья решений, нейронные сети.

Примеры применения: предсказание цены квартиры по характеристикам, определить, уйдет ли клиент от �компании, поиск преступников по камерам �наблюдения

8 of 21

2. Обучение без учителя (Unsupervised Learning)

Обучение на неразмеченных данных.

Цель: обнаружение скрытых структур или паттернов.

Примеры алгоритмов: кластеризация (K-Means), понижение размерности (PCA).

Примеры применения: рекомендации фильмов и музыки, кластеризация клиентов в маркетинге, анализ ДНК, выявление подозрительных транзакций

9 of 21

3. Обучение с подкреплением (Reinforcement Learning)

Модель обучается на основе наград и штрафов, взаимодействуя с окружающей средой.

Цель: оптимизация поведения модели для достижения максимального вознаграждения.

Примеры применения: игры, робототехника, автопилот, финансы

10 of 21

Примеры алгоритмов машинного обучения

Линейная регрессия
Кластеризация (K-Means)
Деревья решений

11 of 21

Алгоритм 1. Линейная регрессия

Простая модель, использующая линейную зависимость между входными и выходными данными.

Применение: прогнозирование (медицина, недвижимость и т.д.)

y = w₁x₁ + w₂x₂ + … + w_nx_n + b

x₁,x₂,...,x_n — входные данные (например, характеристики состояния человека: уровень глюкозы, железа, кофеина и т. д.).

w₁,w₂,...,w_n — веса (показывают, насколько важен каждый признак).

b — смещение (bias), учитывает базовый уровень результата.

y — предсказание (например, ТТГ или уровень активности человека.

12 of 21

Линейная регрессия. Пример. Цена квартиры

Входные признаки: площадь (x₁), этаж (x₂), район (x₃)

Результат: цена квартиры

Формула с весами w₁,w₂,w₃:

Цена = 5000хПлощадь + 300хЭтаж + 10000хРайон + 20000

Пример для квартиры 50 м², на 10-м этаже, в хорошем районе (1 — хороший, 0 — плохой):

Цена = 5000×50 + 300×10 + 10000×1 + 20000 = 280 000 у.е.

13 of 21

Линейная регрессия. Пример. Уровень гормонов

Входные признаки: возраст (x₁), индекс массы тела (ИМТ) (x₂), уровень железа в крови (x₃), глюкоза натощак (x₄)

Результат: уровень ТТГ

Формула линейной регрессии:

ТТГ = w1×Возраст + w2×ИМТ + w3×Железо + w4×Глюкоза + b

Формула с весами w₁,w₂,w₃:

ТТГ = 0.02×Возраст + 0.1×ИМТ − 0.05×Железо + 0.3×Глюкоза + 0.8

Пример для пациента с параметрами: возраст = 45 лет, ИМТ = 26, железо = 15 мкг/дл, глюкоза = 5.6 ммоль/л:

ТТГ = 0.02×45 + 0.1×26 − 0.05×15 + 0.3×5.6 + 0.8 = 2.76

14 of 21

Алгоритм 2. Кластеризация (K-Means)

Метод группировки объектов в кластеры, основанный на схожести.

Применение: разделение данных на категории (например, кластеризация типов нейронов).

Основной принцип: минимизация расстояния между объектами внутри одного кластера.

Примеры: разделение ДНК-последовательностей по типам, группировка пациентов по симптомам в медицине, классификация клеток в биологии.

15 of 21

Кластеризация (K-Means). Группировка пациентов по симптомам

Параметры:

Температура тела (°C)
Усталость (оценка по шкале от 0 до 10)
Кашель (оценка по шкале от 0 до 10)
Боль в горле (оценка по шкале от 0 до 10)
Одышка (оценка по шкале от 0 до 10)

Шаги выполнения:

Подготовка данных
Выбор числа кластеров
Запуск K-means

16 of 21

Кластеризация (K-Means). Группировка пациентов по симптомам

17 of 21

Кластеризация (K-Means). Группировка пациентов по симптомам

18 of 21

Алгоритм 3. Деревья решений

Алгоритм классификации, где данные разделяются на основе условий.

Применение: определение принадлежности биологического объекта к определенной группе

Шаги выполнения:

Разделение данных
Рекурсивное построение
Прогнозирование

Примеры: диагностика заболеваний разной сложности, контроль качества продукции.

19 of 21

Деревья решений. Определение состояния пациента

20 of 21

Заключение

Если ИИ включает всё, что связано с имитацией человеческого интеллекта, то ML фокусируется на обучении моделей на основе данных для выполнения конкретных задач
Основные типы обучения:

Обучение с учителем (Supervised Learning),
Обучение без учителя (Unsupervised Learning),
Обучение с подкреплением (Reinforcement Learning)

Популярные алгоритмы ML:

Линейная регрессия
Кластеризация (K-Means)
Деревья решений

Линейная регрессия ищет зависимость между входными данными и результатом
Кластеризация разделяет данные на группы (кластеры), основываясь на их схожести

1 of 21

2 of 21

3 of 21

4 of 21

5 of 21

6 of 21

7 of 21

8 of 21

9 of 21

10 of 21

11 of 21

12 of 21

13 of 21

14 of 21

15 of 21

16 of 21

17 of 21

18 of 21

19 of 21

20 of 21

21 of 21