Основы машинного обучения
Лекция 3
План лекции
Определение
Машинное обучение (ML) — это подраздел искусственного интеллекта (ИИ), сосредоточенный на разработке алгоритмов, которые обучаются на данных и делают прогнозы или принимают решения без явного программирования.
Определение (продолжение)
Основные отличия ML от ИИ
ИИ
Общая область, включающая всё, что связано с имитацией человеческого интеллекта.
Примеры: чат-боты, автономные автомобили, системы компьютерного зрения.
ML
Фокусируется на обучении моделей на основе данных для выполнения конкретных задач.
Примеры: прогнозирование цен, анализ биологических данных, сегментация изображений.
Основные типы обучения
1. Обучение с учителем (Supervised Learning)
Обучение на размеченных данных, где известен правильный ответ.
Цель: предсказать метки для новых данных.
Примеры алгоритмов: линейная регрессия, деревья решений, нейронные сети.
Примеры применения: предсказание цены квартиры по характеристикам, определить, уйдет ли клиент от �компании, поиск преступников по камерам �наблюдения
2. Обучение без учителя (Unsupervised Learning)
Обучение на неразмеченных данных.
Цель: обнаружение скрытых структур или паттернов.
Примеры алгоритмов: кластеризация (K-Means), понижение размерности (PCA).
Примеры применения: рекомендации фильмов и музыки, кластеризация клиентов в маркетинге, анализ ДНК, выявление подозрительных транзакций
3. Обучение с подкреплением (Reinforcement Learning)
Модель обучается на основе наград и штрафов, взаимодействуя с окружающей средой.
Цель: оптимизация поведения модели для достижения максимального вознаграждения.
Примеры применения: игры, робототехника, автопилот, финансы
Примеры алгоритмов машинного обучения
Алгоритм 1. Линейная регрессия
Простая модель, использующая линейную зависимость между входными и выходными данными.
Применение: прогнозирование (медицина, недвижимость и т.д.)
y = w1x1 + w2x2 + … + wnxn + b
x1,x2,...,xn — входные данные (например, характеристики состояния человека: уровень глюкозы, железа, кофеина и т. д.).
w1,w2,...,wn — веса (показывают, насколько важен каждый признак).
b — смещение (bias), учитывает базовый уровень результата.
y — предсказание (например, ТТГ или уровень активности человека.
Линейная регрессия. Пример. Цена квартиры
Входные признаки: площадь (x1), этаж (x2), район (x3)
Результат: цена квартиры
Формула с весами w1,w2,w3:
Цена = 5000хПлощадь + 300хЭтаж + 10000хРайон + 20000
Пример для квартиры 50 м², на 10-м этаже, в хорошем районе (1 — хороший, 0 — плохой):
Цена = 5000×50 + 300×10 + 10000×1 + 20000 = 280 000 у.е.
Линейная регрессия. Пример. Уровень гормонов
Входные признаки: возраст (x1), индекс массы тела (ИМТ) (x2), уровень железа в крови (x3), глюкоза натощак (x4)
Результат: уровень ТТГ
Формула линейной регрессии:
ТТГ = w1×Возраст + w2×ИМТ + w3×Железо + w4×Глюкоза + b
Формула с весами w1,w2,w3:
ТТГ = 0.02×Возраст + 0.1×ИМТ − 0.05×Железо + 0.3×Глюкоза + 0.8
Пример для пациента с параметрами: возраст = 45 лет, ИМТ = 26, железо = 15 мкг/дл, глюкоза = 5.6 ммоль/л:
ТТГ = 0.02×45 + 0.1×26 − 0.05×15 + 0.3×5.6 + 0.8 = 2.76
Алгоритм 2. Кластеризация (K-Means)
Метод группировки объектов в кластеры, основанный на схожести.
Применение: разделение данных на категории (например, кластеризация типов нейронов).
Основной принцип: минимизация расстояния между объектами внутри одного кластера.
Примеры: разделение ДНК-последовательностей по типам, группировка пациентов по симптомам в медицине, классификация клеток в биологии.
Кластеризация (K-Means). Группировка пациентов по симптомам
Параметры:
Шаги выполнения:
Кластеризация (K-Means). Группировка пациентов по симптомам
Кластеризация (K-Means). Группировка пациентов по симптомам
Алгоритм 3. Деревья решений
Алгоритм классификации, где данные разделяются на основе условий.
Применение: определение принадлежности биологического объекта к определенной группе
Шаги выполнения:
Примеры: диагностика заболеваний разной сложности, контроль качества продукции.
Деревья решений. Определение состояния пациента
Заключение
Основы машинного обучения
Лекция 3