1 of 21

Основы машинного обучения

Лекция 3

2 of 21

План лекции

  1. Машинное обучение, и чем оно отличается от искусственного интеллекта
  2. Основные типы обучения
  3. Популярные алгоритмы машинного обучения
  4. Как линейная регрессия и кластеризация применяются для анализа данных

3 of 21

Определение

Машинное обучение (ML) — это подраздел искусственного интеллекта (ИИ), сосредоточенный на разработке алгоритмов, которые обучаются на данных и делают прогнозы или принимают решения без явного программирования.

4 of 21

Определение (продолжение)

5 of 21

Основные отличия ML от ИИ

ИИ

Общая область, включающая всё, что связано с имитацией человеческого интеллекта.

Примеры: чат-боты, автономные автомобили, системы компьютерного зрения.

ML

Фокусируется на обучении моделей на основе данных для выполнения конкретных задач.

Примеры: прогнозирование цен, анализ биологических данных, сегментация изображений.

6 of 21

Основные типы обучения

  1. Обучение с учителем (Supervised Learning)
  2. Обучение без учителя (Unsupervised Learning)
  3. Обучение с подкреплением (Reinforcement Learning)

7 of 21

1. Обучение с учителем (Supervised Learning)

Обучение на размеченных данных, где известен правильный ответ.

Цель: предсказать метки для новых данных.

Примеры алгоритмов: линейная регрессия, деревья решений, нейронные сети.

Примеры применения: предсказание цены квартиры по характеристикам, определить, уйдет ли клиент от �компании, поиск преступников по камерам �наблюдения

8 of 21

2. Обучение без учителя (Unsupervised Learning)

Обучение на неразмеченных данных.

Цель: обнаружение скрытых структур или паттернов.

Примеры алгоритмов: кластеризация (K-Means), понижение размерности (PCA).

Примеры применения: рекомендации фильмов и музыки, кластеризация клиентов в маркетинге, анализ ДНК, выявление подозрительных транзакций

9 of 21

3. Обучение с подкреплением (Reinforcement Learning)

Модель обучается на основе наград и штрафов, взаимодействуя с окружающей средой.

Цель: оптимизация поведения модели для достижения максимального вознаграждения.

Примеры применения: игры, робототехника, автопилот, финансы

10 of 21

Примеры алгоритмов машинного обучения

  1. Линейная регрессия
  2. Кластеризация (K-Means)
  3. Деревья решений

11 of 21

Алгоритм 1. Линейная регрессия

Простая модель, использующая линейную зависимость между входными и выходными данными.

Применение: прогнозирование (медицина, недвижимость и т.д.)

y = w1x1 + w2x2 + … + wnxn + b

x1​,x2​,...,xn — входные данные (например, характеристики состояния человека: уровень глюкозы, железа, кофеина и т. д.).

w1,w2,...,wn— веса (показывают, насколько важен каждый признак).

b — смещение (bias), учитывает базовый уровень результата.

y — предсказание (например, ТТГ или уровень активности человека.

12 of 21

Линейная регрессия. Пример. Цена квартиры

Входные признаки: площадь (x1), этаж (x2), район (x3)

Результат: цена квартиры

Формула с весами w1​,w2​,w3:

Цена = 5000хПлощадь + 300хЭтаж + 10000хРайон + 20000

Пример для квартиры 50 м², на 10-м этаже, в хорошем районе (1 — хороший, 0 — плохой):

Цена = 5000×50 + 300×10 + 10000×1 + 20000 = 280 000 у.е.

13 of 21

Линейная регрессия. Пример. Уровень гормонов

Входные признаки: возраст (x1), индекс массы тела (ИМТ) (x2​), уровень железа в крови (x3​), глюкоза натощак (x4​)

Результат: уровень ТТГ

Формула линейной регрессии:

ТТГ = w1×Возраст + w2×ИМТ + w3×Железо + w4×Глюкоза + b

Формула с весами w1​,w2​,w3:

ТТГ = 0.02×Возраст + 0.1×ИМТ − 0.05×Железо + 0.3×Глюкоза + 0.8

Пример для пациента с параметрами: возраст = 45 лет, ИМТ = 26, железо = 15 мкг/дл, глюкоза = 5.6 ммоль/л:

ТТГ = 0.02×45 + 0.1×26 − 0.05×15 + 0.3×5.6 + 0.8 = 2.76

14 of 21

Алгоритм 2. Кластеризация (K-Means)

Метод группировки объектов в кластеры, основанный на схожести.

Применение: разделение данных на категории (например, кластеризация типов нейронов).

Основной принцип: минимизация расстояния между объектами внутри одного кластера.

Примеры: разделение ДНК-последовательностей по типам, группировка пациентов по симптомам в медицине, классификация клеток в биологии.

15 of 21

Кластеризация (K-Means). Группировка пациентов по симптомам

Параметры:

  • Температура тела (°C)
  • Усталость (оценка по шкале от 0 до 10)
  • Кашель (оценка по шкале от 0 до 10)
  • Боль в горле (оценка по шкале от 0 до 10)
  • Одышка (оценка по шкале от 0 до 10)

Шаги выполнения:

  1. Подготовка данных
  2. Выбор числа кластеров
  3. Запуск K-means

16 of 21

Кластеризация (K-Means). Группировка пациентов по симптомам

17 of 21

Кластеризация (K-Means). Группировка пациентов по симптомам

18 of 21

Алгоритм 3. Деревья решений

Алгоритм классификации, где данные разделяются на основе условий.

Применение: определение принадлежности биологического объекта к определенной группе

Шаги выполнения:

  1. Разделение данных
  2. Рекурсивное построение
  3. Прогнозирование

Примеры: диагностика заболеваний разной сложности, контроль качества продукции.

19 of 21

Деревья решений. Определение состояния пациента

20 of 21

Заключение

  • Если ИИ включает всё, что связано с имитацией человеческого интеллекта, то ML фокусируется на обучении моделей на основе данных для выполнения конкретных задач
  • Основные типы обучения:
    • Обучение с учителем (Supervised Learning),
    • Обучение без учителя (Unsupervised Learning),
    • Обучение с подкреплением (Reinforcement Learning)
  • Популярные алгоритмы ML:
    • Линейная регрессия
    • Кластеризация (K-Means)
    • Деревья решений
  • Линейная регрессия ищет зависимость между входными данными и результатом
  • Кластеризация разделяет данные на группы (кластеры), основываясь на их схожести

21 of 21

Основы машинного обучения

Лекция 3