1 of 14

Понимание их подхода к разработке важно, потому что именно методологии определяют скорость инноваций, качество и безопасность таких систем.

Тема доклада: методологии разработки ПО в компании OpenAI на примере ChatGPT и других моделей.

Халин Иван Бпи258

2 of 14

Тема и актуальность

  • Цель : показать, как организована разработка ПО и моделей ИИ в OpenAI и чем подход отличается от конкурентов
  • Задачи:
  • Разобрать какие методологии используются (agile, scrum – принципы, собственные подходы к ИИ.
  • Показать как развивались OpenAI и ChatGPT и как это связанно с выбранными методологиями.
  • Обсудить уникальные черты OpenAI их плюсы/минусы
  • Сформулировать определенные выводы.

3 of 14

Что такое методология ? И зачем вообще она нужна?

  • Методология разработки ПО — это набор принципов, ролей, артефактов и процессов, по которым команда планирует, пишет, тестирует и выпускает программный продукт.
  • Зачем нужна:
  • снижает хаос и неопределённость в проекте;
  • помогает прогнозировать сроки и стоимость;
  • повышает качество и безопасность ПО;
  • улучшает коммуникацию между разработчиками, аналитиками, продуктом и бизнесом.
  • Примеры методологий: Waterfall, Agile, Scrum, Kanban, DevOps, MLOps — каждая по-разному балансирует скорость, гибкость и контроль.

4 of 14

Кратко об OpenAI: история и миссия

  • OpenAI основана в 2015 году как некоммерческая организация с миссией: сделать так, чтобы AGI приносил пользу всему человечеству
  • Вокруг OpenAI сформирована уникальная структура: некоммерческий фонд контролирует коммерческую компанию (Public Benefit Corporation), что должно сочетать масштабирование бизнеса и общественную миссию. 
  • Ключевые продукты: модели GPT-серии, DALL·E, Sora, ChatGPT, API-платформа для разработчиков.
  • Стратегический партнёр — Microsoft, которая инвестировала миллиарды долларов и предоставляет облачную инфраструктуру Azure для обучения и развёртывания моделей.

5 of 14

Начало OpenAI и запуск ChatGPT

  • В первые годы OpenAI занималась в основном фундаментальными исследованиями: Gym, Universe, ранние версии GPT и проекты по RL. 
  • GPT-3.5 стало базой для ChatGPT — диалоговой версии модели с дообучением на человеческой обратной связи. ChatGPT запустили 30 ноября 2022 года как бесплатный «research preview» — фактически крупный публичный бета-тест. За ~2 месяца сервис достиг 100 млн пользователей, став одним из самых быстрорастущих приложений в истории и резко усилив внимание к OpenAI. 

6 of 14

Общая схема разработки в OpenAI

  • В одном из корпоративных гайдбуков OpenAI выделяет три ключевые команды: Research, Applied, Deployment.
  • Research — создаёт новые модели и архитектуры.
  • Applied — превращает их в продукты (ChatGPT, API, enterprise-решения).
  • Deployment — внедряет продукты у клиентов, собирая обратную связь и кейсы.
  • OpenAI подчёркивает подход iterative deployment: регулярные обновления, быстрый сбор фидбека, доработка моделей на основе реального использования. 
  • То есть методология строится вокруг циклов «исследование → продукт → использование → улучшение».

7 of 14

Agile и Scrum-принципы в OpenAI

  • Прямой документации «мы используем Scrum» у OpenAI нет, но по признакам (частые релизы, research preview, быстрые улучшения) видно, что активно применяются принципы Agile. Характерные черты, похожие на Scrum / Agile:
    • короткие итерации разработки и регулярные релизы моделей и функций;
    • кросс-функциональные команды (исследователи, инженеры, продакты, специалисты по безопасности); 
    • приоритизация задач по реакции пользователей (масштабный фидбек из ChatGPT, API, enterprise-клиентов);
    • «минимально жизнеспособный продукт» (MVP) в виде research preview, который затем дорабатывается.
    • Важное отличие от классического Scrum: здесь итерации включают не только код, но и обучение моделей, сбор датасетов и RLHF.

8 of 14

Специализированные методологии OpenAI для ИИ

  • Iterative deployment — ключевой принцип: модели выпускаются постепенно, с возрастающими возможностями и всё более строгими мерами безопасности. 
  • RLHF (Reinforcement Learning from Human Feedback) и другие пост-трейнинг методы:
  • сначала модель предобучается на больших корпусах текста;
  • затем её дообучают на размеченной людьми обратной связи и с помощью RL, чтобы она стала полезной, безопасной и «послушной». 
  • System cards и технические отчёты (например, GPT-4, GPT-4o, GPT-4.5) описывают, как модель тестировалась и какие ограничения добавлены — это часть формализованной методологии разработки. 

9 of 14

Методологии безопасности: red teaming, Preparedness Framework

  • Перед выпуском крупных моделей OpenAI проводит многоэтапное red teaming — команды и внешние эксперты пытаются «сломать» модель, найти опасные сценарии и jailbreak-запросы. 
  • Для GPT-4o, o-серии и других моделей red teaming шёл в несколько фаз, с участием более сотни внешних экспертов из десятков стран. 
  • Оценка рисков проводится по Preparedness Framework — внутренней рамке, где модели классифицируются по уровням риска (убеждение, кибербезопасность, био-риски и др.). 
  • Запущен Safety Evaluations Hub с метриками по вредному контенту, jailbreak-устойчивости и т.д. — это делает часть методологии прозрачной для внешних наблюдателей. 

10 of 14

Уникальность подхода OpenAI по сравнению с конкурентами

  • Чёткий фокус на AGI и прописанные в OpenAI Charter принципы: «широко распределённые выгоды», «долгосрочная безопасность», «техническое лидерство», «кооперация». 
  • Сочетание исследовательского и продуктового подхода: компания одновременно публикует научные результаты и быстро превращает их в массовые продукты (ChatGPT, Sora, Atlas-браузер и др.). 
  • Масштабы развертывания: сотни миллионов активных пользователей ChatGPT и интеграция с продуктами Microsoft и других партнёров — это постоянный источник реального фидбека. 
  • Iterative deployment как философия, а не просто технический приём: идея, что общество должно постепенно привыкать к всё более мощным системам, а разработчики — учиться на реальном использовании.

11 of 14

Недостатки и критика подхода OpenAI

Технические ограничения моделей: галлюцинации (уверенные, но неверные ответы), остаточные предвзятости, возможность генерации вредного контента при обходе защит. 

Юридическая и этическая критика: иски по поводу использования защищённых авторским правом текстов в обучении; споры вокруг прозрачности датасетов. 

Организационные конфликты: скандалы вокруг смены статуса с некоммерческого на коммерческий, конфликт с Илоном Маском и дискуссии о том, насколько компания следует своему изначальному мандату. 

Внутренние риски для безопасности: за 2024 год значительная часть сотрудников, занимавшихся безопасностью AGI, покинула компанию, что породило вопросы, не ослабляется ли фокус на safety. 

Операционные проблемы: периодические массовые сбои сервисов (например, проблемы со звонками или голосом в ChatGPT) показывают, что высокая скорость релизов несёт и риски стабильности.

12 of 14

Преимущества методологий OpenAI

  • Высокая скорость инноваций: благодаря циклам iterative deployment и тесной связке Research → Applied → Deployment новые возможности быстро доходят до пользователей. 
  • Глубокая интеграция безопасности в жизненный цикл разработки (red teaming, system cards, Preparedness Framework, RLHF) — это более формализованный подход к рискам, чем у многих конкурентов.
  • Использование реального фидбека в огромных масштабах: поведение моделей донастраивается по сигналам от миллионов пользователей и enterprise-клиентов, что даёт богатый материал для пост-трейнинга и улучшений. 
  • Миссия и чартер задают долгосрочный вектор и ограничители для разработки: хотя их реализация критикуется, наличие чётких публичных принципов само по себе отличает OpenAI от многих чисто коммерческих игроков.

13 of 14

Итоги

  • Методологии OpenAI — это смесь классических Agile-подходов (итеративность, работа с фидбеком, кросс-функциональные команды) и специализированных практик для ИИ (RLHF, iterative deployment, red teaming, system cards). 
  • Такой подход позволил компании:
    • вывести ChatGPT и другие продукты на глобальный рынок за очень короткий срок;
    • сохранять техническое лидерство в больших языковых моделях;
    • формально встроить безопасность в процесс разработки, а не добавлять её «сверху» в конце.
  • Одновременно остаются спорные моменты: юридические риски, общественное доверие, внутренняя культура безопасности и баланс между миссией и коммерцией.
  • В целом, методологии OpenAI можно рассматривать как пример того, как современные компании вокруг ИИ уходят от чисто Waterfall-подхода к гибриду Agile + MLOps + формализованной AI-safety.

14 of 14

Использованные источники