Мира Мурати и её стратегия в Thinking Machines Lab: от универсального ИИ к специализированным решениям

В Thinking Machines Lab бывший технический директор OpenAI Мира Мурати использует более целенаправленный подход к моделям ИИ. Вместо того чтобы стремиться к созданию универсального сверхразума, она считает, что создание индивидуального ИИ для конкретных бизнес-задач более ценно.

Что такого увидела в OpenAI бывший технический директор Мира Мурати, что заставило её предпочесть пользовательские модели AGI

Согласно The Information ^[1], новая компания Мурати, Thinking Machines Lab (TML) ^[2], специализируется на разработке моделей ИИ, адаптированных к основным бизнес-показателям клиента. Цель состоит в том, чтобы предложить специализированные решения для таких отраслей, как обслуживание клиентов, инвестиционный банкинг и розничная торговля, — модели ИИ, разработанные для достижения измеримых бизнес-результатов и продаваемые по высокой цене.

Сообщается, что в основе стратегии TML лежит обучение с подкреплением, при котором модели вознаграждаются за достижение поставленных целей и наказываются за ошибки ^[3]. Инвесторы начали называть это «RL для бизнеса». Этот метод лежит в основе так называемых моделей рассуждений, таких как OpenAI o1 ^[4].

Такой акцент на обучении ^[5] с подкреплением ^[6] для специализированных приложений соответствует рекомендациям исследователя OpenAI Рохана Панди ^[7], который назвал парадигму LLM-RL особенно перспективной для стартапов в сфере вертикального ИИ. Обучение с подкреплением позволяет добиться глубокой специализации, что даже OpenAI с трудом удается масштабировать. В конце 2024 года OpenAI представила собственный интерфейс для разработчиков, позволяющий проводить тонкую настройку с подкреплением (RFT) ^[8], но доступ к этому методу ^[9] по-прежнему ограничен несколькими партнерами.

Совместное использование слоев модели и открытый исходный код

Что касается технической стороны, The Information сообщает, что TML объединяет слои нейронной сети из ряда моделей с открытым исходным кодом — процесс, аналогичный слиянию моделей, методу, представленному в марте 2024 года японским стартапом Sakana AI ^[10].

Модели с открытым исходным кодом, как правило, отстают от коммерческих систем, таких как GPT-4o, но недавние проекты, такие как Deepseek, показывают, что разрыв сокращается ^[11]. TML надеется воспользоваться этой тенденцией, чтобы быстрее выводить продукты на рынок, используя открытый исходный код в качестве основы. Инфраструктура компании основана на серверах Nvidia, арендуемых через Google Cloud.

TML не ограничивается корпоративными клиентами. По данным The Information, команда также обсуждала создание чат-бота для потребителей, который мог бы конкурировать с ChatGPT ^[12] от OpenAI, хотя подробности пока не разглашаются, и неясно, будет ли проект развиваться дальше.

В сообщении также говорится, что TML уже наняла более двух десятков ведущих исследователей и инженеров из OpenAI и Anthropic, включая соучредителя OpenAI Джона Шульмана ^[13] и бывших исследователей OpenAI Баррета Зофа и Люка Метца ^[14].

Почему Мурати покинула OpenAI?

Уход Мурати из OpenAI последовал за неспокойным периодом в компании — по слухам, она была в ссоре с генеральным директором Сэмом Альтманом ^[15], хотя она это отрицает ^[16].

Но помимо закулисного напряжения, её уход поднимает более серьёзный вопрос: почему технический директор покидает компанию, которая, предположительно, находится на грани достижения AGI или даже большего ^[17]?

Имея инсайдерский взгляд на прогресс OpenAI, Мурати выбрал другой путь. Одна из возможных причин — бизнес-модель. AGI — это смелый проект, но он сопряжён с серьёзными рисками. Специализированные модели, ориентированные на прибыль и эффективность, могут разрабатываться и масштабироваться гораздо быстрее — и с меньшим количеством неизвестных факторов.

Также есть большая вероятность, что Мурати, как и многие другие специалисты в этой области ^[18], не считает, что AGI достижим с помощью современных технологий LLM ^[19]. Её стратегия отражает это убеждение — она делает ставку на целенаправленные, практичные решения, а не на погоню за универсальным интеллектом ^[20].

Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News ^[21].

Источник ^[22]

Автор: mefdayy

Источник ^[23]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/16616

URLs in this post:

[1] The Information: https://www.theinformation.com/articles/ex-openai-cto-muratis-startup-plans-compete-openai-others

[2] Thinking Machines Lab (TML): https://the-decoder.com/thinking-machines-lab-former-openai-ctos-startup-reportedly-valued-at-10-billion/

[3] обучение с подкреплением, при котором модели вознаграждаются за достижение поставленных целей и наказываются за ошибки: https://the-decoder.com/go-read-this-to-learn-how-reinforcement-learning-makes-llms-better-at-reasoning/

[4] так называемых моделей рассуждений, таких как OpenAI o1: https://the-decoder.com/study-reinforcement-learning-via-self-play-is-key-to-reasoning-in-language-models/

[5] обучении: http://www.braintools.ru/article/5125

[6] подкреплением: http://www.braintools.ru/article/5528

[7] соответствует рекомендациям исследователя OpenAI Рохана Панди: https://the-decoder.com/openais-hunger-for-growth-puts-pressure-on-ai-startups/

[8] OpenAI представила собственный интерфейс для разработчиков, позволяющий проводить тонкую настройку с подкреплением (RFT): https://the-decoder.com/openai-adds-new-fine-tuning-options-for-o4-mini-and-gpt-4-1/

[9] этому методу: https://platform.openai.com/docs/guides/reinforcement-fine-tuning

[10] методу, представленному в марте 2024 года японским стартапом Sakana AI: https://the-decoder.com/sakana-ais-evolutionary-algorithm-creates-capable-ai-models-by-merging-existing-ones/

[11] Deepseek, показывают, что разрыв сокращается: https://the-decoder.com/deepseeks-r1-model-closes-the-gap-with-openai-and-google-after-major-update/

[12] ChatGPT: https://the-decoder.com/chatgpt-is-a-gpt-3-chatbot-from-openai-that-you-can-test-now/

[13] соучредителя OpenAI Джона Шульмана: https://the-decoder.com/openai-co-founder-john-schulmans-brief-stint-at-anthropic-comes-to-an-end/

[14] Баррета Зофа и Люка Метца: https://the-decoder.com/openai-co-founder-sutskever-raises-2-billion-for-ai-startup-with-no-product/

[15] по слухам, она была в ссоре с генеральным директором Сэмом Альтманом: https://the-decoder.com/sam-altmans-short-lived-ouster-from-openai-was-boardroom-power-struggle/

[16] хотя она это отрицает: https://the-decoder.com/openai-cto-mira-murati-says-she-was-not-involved-in-sam-altmans-firing/

[17] находится на грани достижения AGI или даже большего: https://blog.samaltman.com/the-gentle-singularity

[18] как и многие другие специалисты в этой области: https://the-decoder.com/most-ai-researchers-are-skeptical-about-language-models-achieving-agi/

[19] современных технологий LLM: https://the-decoder.com/apples-illusion-of-thinking-paper-shows-experts-deeply-divided-on-ai-reasoning/

[20] интеллектом: http://www.braintools.ru/article/7605

[21] BotHub AI News: https://t.me/bothub

[22] Источник: https://the-decoder.com/what-did-former-cto-mira-murati-see-at-openai-that-made-her-choose-custom-models-over-agi/

[23] Источник: https://habr.com/ru/companies/bothub/news/922042/?utm_source=habrahabr&utm_medium=rss&utm_campaign=922042

Нажмите здесь для печати.