Размышления об OpenAI

15 ИЮЛЯ 2025

Три недели назад я покинул OpenAI ^[1]. Я присоединился к компании еще в мае 2024 года.

Хочу поделиться своими размышлениями, потому что вокруг OpenAI много шума, но мало рассказов из первых рук о том, каково это — работать там изнутри. Мало кто говорит, как всё это ощущается.

У Нэбила Куреши ^[2] есть отличный пост «Размышления о Palantir» ^[3], где он рассуждает о том, что делало Palantir особенным. Хочу сделать то же самое для OpenAI, пока впечатления ^[4] еще свежи. Никаких коммерческих тайн здесь не будет — просто мысли об одной из самых интересных организаций в истории в крайне любопытное время.

Скажу сразу: никакой личной драмы в решении уйти не было — наоборот, я долго сомневался. Сложно делать прыжок от основателя стартапа ^[5] к работе в компании на 3000 человек. Хочется начать что-то новое, хочется перезагрузиться.

Вполне возможно, что меня затянет обратно. Сложно представить, что можно создать что-то более значимое, чем AGI, а LLM — это явно технологическая инновация десятилетия. Мне повезло увидеть некоторые разработки изнутри и поучаствовать в запуске Codex ^[6].

Очевидно, это не мнение компании — это мои личные наблюдения. OpenAI — большое место, а это мой маленький и скромный взгляд на него.

Культура

Первое, что нужно знать об OpenAI — это приоритет скорости роста. Когда я присоединился, в компании было чуть больше 1000 человек. Год спустя — более 3000, и я был в топ-30% по стажу. Почти все в руководстве теперь делают кардинально другую работу, чем 2-3 года назад.

Естественно, при таком масштабировании все ломается: коммуникации, структура отчетности, процессы поставки продуктов, управление людьми, найм и так далее. Команды сильно различаются по культуре: одни спринтят на пределе постоянно, другие нянчатся с большими запусками, третьи работают в более размеренном темпе. Единого UX в OpenAI не существует, а исследования, прикладные разработки и выход на рынок работают с совершенно разными временными горизонтами.

Необычная особенность OpenAI в том, что всё, и я имею в виду ВСЁ, работает через Slack. Электронной почты нет. За все время я получил примерно 10 писем. Если вы неорганизованны, это будет невероятно отвлекать. Если настроите каналы и уведомления, станет вполне рабочим способом вести дела.

OpenAI невероятно децентрализована и организационно построена «снизу вверх», особенно в исследованиях. Когда я только пришел, стал спрашивать про план на следующий квартал. Ответ был: «такого плана не существует» (хотя теперь уже существует). Хорошие идеи могут прийти откуда угодно, и часто заранее неясно, какие из них окажутся наиболее плодотворными. Вместо грандиозного «мастер-плана» прогресс итеративный и открывается по мере того, как новые исследования приносят плоды.

Благодаря этой децентрализованной и построенной «снизу вверх» культуре, OpenAI очень меритократична. Исторически, лидеры в компании продвигаются в первую очередь на основе способности генерировать хорошие идеи и воплощать их. Многие невероятно компетентные лидеры в других компаниях никуда не продвинулись, потому что не очень хорошо выступали на общих собраниях и не очень любили политические играмы. В OpenAI это менее важно, чем в других компаниях. Лучшие идеи действительно побеждают.

Есть сильный фокус на активные действия (можно сразу делать, а не торчать на совещаниях). Нередко похожие, но не связанные команды сходились на одинаковых идеях. Я начал работать над параллельным (но внутренним) проектом, похожим на ChatGPT Connectors ^[7]. Мы сделали, наверное, 3-4 разных прототипа Codex ^[6] прежде чем решить, какой из них будем запускать в прод. Эти усилия обычно предпринимают несколько человек без спроса разрешения. Команды быстро формируются вокруг перспективных идей.

Андрей (лид Codex) говорил мне, что исследователей стоит воспринимать как «мини-директоров». Благом считается склонность работать над своим проектом и смотреть, что из него получится. Следствие: большинство исследований делается через увлечение исследователя конкретной проблемой. Если что-то считается скучным или «решенным», над этим, скорее всего, работать никто не будет.

Хорошие менеджеры-исследователи безумно влиятельны и при этом крайне редки. Лучшие умеют объединять разные доселе несвязанные исследовательские направления и собирать
из них модель, обученную более большим и важным вещам. То же касается отличных менеджеров проектов (PM).

EM-ы в ChatGPT (engineering managers, менеджеры инеженеров), с которыми я работал (Акшай, Риццо, Сулман), были одними из самых хладнокровных людей, которых я видел. Такое ощущение, как будто они в жизни уже все повидали. Большинство работали довольно автономно, но нанимали хороших людей и старались обеспечить им успех.

OpenAI меняет направление молниеносно. Это то, что мы очень ценили в Segment — гораздо лучше делать правильную вещь по мере получения новой информации, чем держаться курса просто потому, что таков план. Удивительно, что такая большая компания как OpenAI сохраняет этот подход — Google явно этого не делает. Компания принимает решения быстро, и решив двигаться в каком-то направлении, идет ва-банк.

На компанию обращено огромное внимание ^[8]. Мне как человеку, привыкшему к B2B-энтерпрайзу это было шоком. Я регулярно видел новости в прессе о том, что еще не было объявлено внутри компании. Говорил людям, что работаю в OpenAI, и получал в ответ не обьективную реакцию ^[9] на свои успехи, а уже сформированное мнение о компании. Несколько пользователей Twitter прямо сейчас держат армию ботов, которые читают наши твиты и пытаются догадаться, какую фичу OpenAI запустит следующей.

Как результат, OpenAI переполнена духом секретности. Я не мог рассказать никому подробности своей работы. Есть несколько рабочих пространств Slack с разными правами доступа. Данные по выручке и затратам охраняются особенно строго.

В OpenAI к задачам относятся намного более серьезно, чем можно ожидать, частично потому, что ставки очень высоки. С одной стороны, заявленная цель — создание AGI, и много что нужно сделать правильно. С другой стороны, мы строим продукт, которым сотни миллионов пользователей пользуются для всего — от простых медицинских советов до реальной терапии. С третьей стороны, компания конкурирует на самой большой арене в мире. Мы внимательно следили за Meta, Google и Anthropic — и я уверен, они делали то же самое. Все крупнейшие правительства в мире наблюдают за этой сферой с острым интересом ^[10].

Как бы OpenAI ни поносили в прессе, все, кого я встречал там, реально стараются делать правильные вещи. Учитывая потребительский фокус, это самая заметная из больших лабораторий, и следовательно, она получает больше всего критики.

При этом не стоит воспринимать OpenAI как единый монолит. Я думаю об OpenAI как об организации, которая начиналась как Лос-Аламос. Это была группа ученых и изобретателей, исследующих передний край науки. Эта группа случайно породила самое вирусное потребительское приложение в истории. А затем выросла — с амбициями продавать свое решение и правительству, и обычным людям. Сотрудники с разным стажем и из разных частей организации имеют очень разные цели и взгляды. Чем дольше вы там работаете, тем больше смотрите на вещи через призму «исследовательской лаборатории» или «некоммерческой организации, работающей во имя общего блага».

Больше всего я ценю то, что компания «идет своим путем» в плане распределения преимуществ ИИ. Передовые модели не зарезервированы для какого-то корпоративного уровня с годовым соглашением. Любой человек в мире может зайти в ChatGPT и получить ответ, даже не авторизовавшись. Есть API, который можно использовать после регистрации — а ведь большинство API моделей (даже самых современных или проприетарных) сразу же начинают использовать стартапы. А ведь всё могло бы быть совершенно иначе. OpenAI заслуживает огромной благодарности и признания за всё это — и что эти ценности все еще в ДНК компании.

Безопасность более приоритетна для OpenAI, чем можно подумать, читая Zvi ^[11] или Lesswrong ^[12]. Большое количество людей работает над развитием систем безопасности. Но учитывая природу OpenAI, я видел больше фокуса на практических рисках (разжигание ненависти, злоупотребления, манипулирование политическими предрассудками, создание биооружия, самоповреждения, prompt injection), чем на теоретических (взрыв интеллекта ^[13], стремление к власти). Это не значит, что никто не работает над последними — определенно есть люди, сосредоточенные на теоретических рисках. Но с моей точки зрения ^[14] всё это не в фокусе. Большая часть работы не публикуется. Возможно, OpenAI действительно должна больше делать для её освещения и популяризации.

В отличие от других компаний, которые свободно раздают мерч на каждой ярмарке вакансий, OpenAI редко раздает что либо (даже новым сотрудникам). Вместо этого, иногда случаются «дропы», где можно заказать товары в наличии. Первый же такой дроп обрушил магазин Shopify, они не выдержали спроса. Был внутренний пост о том, как отправлять правильные json-запросы к сайту магазина, чтобы обойти эти проблемы.

Почти всё — погрешность по сравнению со стоимостью GPU. Чтобы дать представление: маленькая нишевая функция, построенная как часть продукта Codex, имела такие же затраты на GPU, как вся наша инфраструктура Segment ^[15] (у нее был не тот масштаб, что у ChatGPT, но сквозь нее проходила приличная часть интернет-трафика).

OpenAI — возможно, самая пугающе амбициозная организация ^[16], которую я когда-либо видел. Можно подумать, что одного из топовых потребительских приложений планеты достаточно, но нет. У компании есть желание конкурировать в десятках других областей: API как продукт, глубокие исследования, железо, агенты для программирования, генерация изображений и еще несколько неанонсированных. Плодородная почва для воплощения идей!

Компания много внимания уделяет Твиттеру. Если вы твитнете что-то связанное с OpenAI, и твит станет вирусным, велики шансы, что кто-то прочитает и серьезно рассмотрит это. Мой друг шутил: «настроения в Твиттере — основное топливо для работы компании»! Для потребительской компании, возможно, это не так уж неправильно. Конечно, все еще нужно много аналитики по использованию, росту пользователей и удержанию — но вайбы в Твиттере примерно так же важны.

Команды в OpenAI гораздо более подвижны, чем в других местах. При запуске Codex нам нужна была помощь нескольких опытных инженеров ChatGPT, чтобы успеть к дате запуска. Мы встретились с несколькими EM-ами ChatGPT, чтобы попросить помощи. На следующий день у нас было два крутых человека, готовых погрузиться и помочь. Никакого «ожидания квартального планирования» или «перетасовки headcount». Все прошло очень быстро.

Ты часто видишь руководство и оно активно вовлечено в работу. Это может быть очевидно для такой компании как OpenAI, но каждый руководитель казался довольно включенным. Мы регулярно видели gdb, sama, kw, mark, dane и других в Slack. Свадебных генералов и заочных лидеров нет.

Код

OpenAI использует гигантский монорепозиторий, который написан в основном на Python (хотя есть растущий набор Rust-сервисов и несколько Golang-сервисов для таких вещей, как сетевые прокси). Это создает много странно выглядящего кода, потому что на Python можно писать очень по-разному. Вы столкнетесь и с библиотеками, созданными для максимального масштабирования 10-летними ветеранами Google, и с одноразовыми Jupyter-ноутбуками свежеиспеченных PhD. Практически все работает вокруг FastAPI для создания API и Pydantic для валидации. Обязательных правил по стилю кода не существует.

OpenAI запускает все на Azure. Смешно, что есть ровно три сервиса, которые я считаю надежными: Azure Kubernetes Service, CosmosDB (документное хранилище Azure) и BlobStore. Нет настоящих эквивалентов Dynamo, Spanner, Bigtable, Bigquery, Kinesis или Aurora. Из-за этого, ты реже думаешь в единицах автомасштабирования. Реализации IAM обычно гораздо более ограничены, чем в AWS. И есть сильная склонность к разработке собственных решений.

Если говорить о кадрах (по крайней мере, в разработке), есть большая текучка кадров из Meta в OpenAI (Meta — запрещенная в России организация!). Во многом, OpenAI напоминает раннюю Meta: сверхпопулярное приложение для потребителей, только-только зарождающаяся инфраструктура и желание двигаться максимально быстро. Большинство талантливых инфраструктурных инженеров, которых я там видел, пришли из Meta + Instagram, и были довольно сильными.

Сложите всё это вместе, и увидите множество ключевых частей инфраструктуры, которые напоминают решения Meta. Была даже внутренняя реимплементация TAO ^[17]. Делались специальные усилия по консолидации auth identity на граничных серверах. Уверен, было множество других таких инициатив, о которых я не знаю.

Интеграция с чатом очень глубока. С тех пор как ChatGPT взлетел, много кодовой базы структурировано вокруг идеи чат-сообщений и диалогов. Эти паттерны настолько запечены в структуру и кодовую базу компании, что при попытке их игнорировать, никто вам не поможет, а проблем вы огребете знатных. Мы немного отклонились от этих механизмов в команде Codex (больше опираясь на уроки из responses API ^[18]), но использовали много предыдущих наработок.

Код побеждает. Вместо центрального архитектурного или планирующего комитета, решения обычно принимает команда, которая собирается выполнять работу. Результат — сильный приоритет на реальные действия, частенько – изобретение дублирующих друг друга велосипедов. Я видел с полдюжины библиотек для таких вещей как управление очередями или управление циклом работы агентов.

Было несколько областей, где быстро масштабированная инженерная команда и недостаток инструментов создавали проблемы. sa-server (бэкенд-монолит) был чем-то вроде свалки. CI ломался чаще, чем можно ожидать — учитывая, что этот код заливается прямо в master-ветку. Тест-кейсы, даже работающие параллельно и учитывающие подмножество зависимостей, могли занимать ~30 минут на GPU. Это не нерешаемые проблемы, но хорошее напоминание, что такие проблемы есть везде, и они, вероятно, станут хуже при быстром масштабировании. К чести внутренних команд, много усилий идет на улучшение этой ситуации.

Другие вещи, которые я изучил

Что такое большой бренд для потребителей. Я не понимал этого до работы над Codex. Все измеряется в «про-подписках». Даже для такого продукта как Codex мы думали об онбординге в первую очередь относительно индивидуального использования, а не команд. Это немного сломало мой мозг ^[19], учитывая преимущественно B2B/энтерпрайз-бэкграунд. Включаешь фиче-флаг — и получаешь трафик с первого дня.

Как обучаются большие модели (на высоком уровне). Весь спектр от «экспериментов» до «инженерии». Большинство идей начинается как мелкомасштабные эксперименты. Если результаты выглядят многообещающе, их включают в более крупный релиз. Экспериментирование — это, в равной степени, настройка основных алгоритмов и настройка микса данных с тщательным изучением результатов. В большом масштабе релиз выглядит почти как инженерия больших распределенных систем. Будут странные крайние случаи и неожиданные вещи. Вам нужно их отладить.

Как делать математику ^[20] на GPU. Нам нужно было спрогнозировать требования к пропускной способности для запуска Codex, и это был первый раз, когда я реально занимался бенчмарком GPU. Суть в том, что нужно начинать с требований к задержке (общая задержка, количество токенов, время до первого токена), а не делать анализ “снизу вверх” того, что GPU может поддерживать. Каждая новая итерация модели может кардинально изменить паттерны нагрузки.

Как работать в большой кодовой базе, написанной на Python. Segment была комбинацией микросервисов и была в основном на Golang и TypeScript. У нас не было такого спектра задач и объема кода, как у OpenAI. Я много узнал о том, как масштабировать кодовую базу вместе с ростом количества индивидуальных разработчиков. Нужно чаще подстраховываться и реализовывать идеи «работает по умолчанию», «держать master чистым» и «сложно использовать неправильно».

Запуск Codex

Большая часть моих последних трех месяцев в OpenAI была связана с запуском Codex ^[21]. Это определенно один из ярких моментов моей карьеры.

Чтобы задать контекст: в ноябре 2024 OpenAI поставила цель на 2025 год запустить кодинг-агента. К февралю 2025 у нас было несколько внутренних инструментов, которые отлично использовали модели. И мы чувствовали давление запустить агента специально для программирования. Очевидно, модели достигли точки, где стали действительно полезными для кодинга (посмотрите на взрыв инструментов для вайб-кодинга на рынке!).

Я вернулся досрочно с отпуска по уходу за ребенком, чтобы поучаствовать в запуске Codex. Через неделю после возвращения у нас было (слегка хаотичное) слияние двух команд, и начался бешеный спринт. От старта (стартом будем считать первые строки реально написанного кода) до финиша весь продукт был построен всего за 7 недель.

Этот спринт по созданию Codex был, вероятно, самым напряженным периодом работы почти за десятилетие. Большинство ночей я работал до 11 вечера или до полуночи. Дома у меня новорожденный ребенок, а значит, просыпаться нужно вместе с ним в 5:30 каждое утро. Снова в офис к 7 утра. Работали на большинстве выходных. Мы все напряглись как команда, потому что каждая неделя была на счету. Напомнило мне времена YC.

Сложно переоценить, насколько невероятным был такой темп. Я не видел организаций больших или малых, которые бы шли от идеи до полностью запущенного + свободно доступного продукта в такие сроки. Масштаб тоже был не маленький: мы построили контейнерную среду выполнения, сделали оптимизации скачивания репозиториев, дообучили кастомную модель для работы с редактированием кода, обработали все виды git-операций, ввели совершенно новую поверхность API, включили доступ к интернету и получили продукт, который в целом был приятен в использовании.

Говорите что хотите, но у OpenAI все еще есть дух дикого стартапа.

Хорошая новость в том, что правильные люди могут творить чудеса. Мы были senior-командой из ~8 инженеров, ~4 исследователей, 2 дизайнеров, 2 маркетологов и одного проджект-менеджера. Без этой команды всё бы провалились. Никому не нужно было детально рассказывать, что им нужно делать. Но нужна была хорошая координация. Если вдруг посчастливится работать с кем-то из команды Codex, знайте: каждый из них — невероятный, фантастический человек.

Ночью перед запуском пятеро из нас не спали до 4 утра, пытаясь развернуть основной монолит (это многочасовое мероприятие!). Затем снова в офис к 8 утра на объявление запуска и прямую трансляцию. Мы включили фиче-флаги и стали наблюдать, как льется трафик. Никогда не видел продукт с таким моментальным всплеском просто от появления нового пункта меню в левой боковой панели. Такова сила популярности ChatGPT.

Что касается формы продукта, мы остановились на полностью асинхронном форм-факторе. В отличие от инструментов вроде Cursor ^[22] (на тот момент, теперь поддерживает похожий режим ^[23]) или Claude Code ^[24], мы нацелились на то, чтобы пользователи могли запускать задачи и позволить агенту работать в собственной среде. Наша ставка была на то, что в конце концов, пользователи должны относиться к кодинг-агенту как к коллеге: они отправляют сообщения агенту, он получает время на работу, а затем возвращается с готовым PR (pull request, запросом на слияние).

Это было сродни азартной игре! Сейчас мир в странном состоянии, где модели уже достаточно хороши, но не идеальны. Они уже могут работать минуты подряд, но еще не часы. У пользователей сильно различающиеся степени доверия к возможностям моделей. И мы даже не уверены, каковы истинные возможности этих моделей.

В долгосрочной перспективе я верю, что большинство программирования будет похоже на Codex. Пока что, интересно посмотреть, как сложится судьба существующих сейчас в этой области продуктов.

(удивительно, но) Codex действительно хорош в работе с большой кодовой базой и понимании того, как в ней ориентироваться. Самое больше различие, которое я видел по сравнению с другими инструментами, — способность запускать множество задач одновременно и сравнивать их результат.

Недавно видел, что есть публичные цифры ^[25], сравнивающие PR (pull requests, запросы на слияние), сделанные разными LLM-агентами. Только по публичным данным, Codex создал 630 000 PR. Это около 78 тысяч публичных PR на инженера за 53 дня с запуска (можете сами догадаться о множителе приватных PR). Не уверен, что когда-либо работал над чем-то настолько масштабным и значимым в жизни.

Последние мысли

Если честно, изначально я опасался работать в OpenAI. Не был уверен, каково это — пожертвовать свободой, иметь босса, быть гораздо меньшей частью гораздо большей машины. Не рассказывал об этом публично, вдруг это окажется неуместным.

Я хотел получить три вещи от этой работы:

развить интуицию ^[26] о том, как обучаются модели и как развиваются их возможности
работать и учиться у потрясающих людей
запустить отличный продукт

Думаю, этот год работы в OpenAI — одно из лучших решений в жизни. Сложно представить, где еще можно было бы больше узнать.

Если вы основатель стартапа и чувствуете, что ваш стартап никуда не движется, вам стоит либо 1) глубоко переосмыслить, как можно делать еше больше попыток, либо 2) пойти в одну из больших лабораторий. Сейчас невероятное время для создания чего-то нового. И одновременно, невероятное время, чтобы заглянуть в будущее.

Как я вижу, путь к AGI — это гонка трех лошадей: OpenAI, Anthropic и Google. Каждая из этих организаций пойдет разным путем на основе своей ДНК (потребитель vs бизнес, vs мощной инфраструктуры + данных). Работа в любой из них будет крутым, расширяющим сознание опытом ^[27].

Автор: olegchir

Источник ^[28]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/17329

URLs in this post:

[1] OpenAI: https://openai.com/

[2] Нэбила Куреши: https://nabeelqu.co/

[3] «Размышления о Palantir»: https://nabeelqu.substack.com/p/reflections-on-palantir

[4] впечатления: http://www.braintools.ru/article/2012

[5] основателя стартапа: https://segment.com/

[6] запуске Codex: https://openai.com/index/introducing-codex/

[7] ChatGPT Connectors: https://help.openai.com/en/articles/11487775-connectors-in-chatgpt

[8] внимание: http://www.braintools.ru/article/7595

[9] реакцию: http://www.braintools.ru/article/1549

[10] интересом: http://www.braintools.ru/article/4220

[11] Zvi: https://thezvi.wordpress.com/

[12] Lesswrong: https://www.lesswrong.com/

[13] интеллекта: http://www.braintools.ru/article/7605

[14] зрения: http://www.braintools.ru/article/6238

[15] инфраструктура Segment: https://segment.com/infrastructure/

[16] пугающе амбициозная организация: https://www.paulgraham.com/ambitious.html

[17] TAO: https://engineering.fb.com/2013/06/25/core-infra/tao-the-power-of-the-graph/

[18] responses API: https://platform.openai.com/docs/api-reference/responses

[19] мозг: http://www.braintools.ru/parts-of-the-brain

[20] математику: http://www.braintools.ru/article/7620

[21] Codex: https://chatgpt.com/codex

[22] Cursor: https://cursor.com/en

[23] похожий режим: https://cursor.com/blog/agent-web

[24] Claude Code: https://docs.anthropic.com/en/docs/claude-code/cli-reference

[25] есть публичные цифры: https://github.com/aavetis/PRarena

[26] интуицию: http://www.braintools.ru/article/6929

[27] опытом: http://www.braintools.ru/article/6952

[28] Источник: https://habr.com/ru/companies/bar/articles/928214/?utm_source=habrahabr&utm_medium=rss&utm_campaign=928214

Нажмите здесь для печати.