- BrainTools - https://www.braintools.ru -
Кажется, что мы постепенно входим в эпоху, когда наличие продукта опция, а не обязательное условие для получения инвестиций.
Сначала был Thinking Machines Lab (https://t.me/startuphunt/667)- [1] $2 млрд на старте. Про реальные успехи пока особенно не слышно, хотя несколько человек уже вернулись обратно в OpenAI, что само по себе забавно. Потом Safe Superintelligence Inc. – тоже $2 млрд, оценка $32 млрд, продукта по сути нет, в интервью у Lex Fridman звучало красиво, но очень абстрактно. Mistral AI (https://t.me/startuphunt/838 [2]) уже что-то выкатывает и активно конкурирует.
И вот новая история. Ineffable Intelligence Ltd. поднимает $1 млрд при оценке около $4 млрд. Раунд, по слухам, ведёт Sequoia Capital, могут участвовать Alphabet Inc., Nvidia Corp. и Microsoft Corp.. Продукта нет, основан в ноябре.
И опять важен не продукт, а кто стоит за этим. Основатель Дэвид Сильвер, один из ключевых людей в Google DeepMind, человек, который фактически построил современные подходы к reinforcement learning. Это та самая история, когда модель учится не по книжке, а через опыт [3]. Сделал правильно получил “конфетку”, глупость получил “щелбан”. И постепенно начал делать что-то лучше всех.
Именно этот подход лежал в основе AlphaGo, который в 2016 году обыграл чемпиона мира по го. Потом был AlphaZero, уже шахматы и сёги. А ещё AlphaStar, который играл в StarCraft II, где информации неполная и всё сложнее, чем в настольной игре.
Почему это сейчас вдруг стало так важно? Потому что данные для обучения [4] в привычном виде заканчиваются. Интернет уже почти “съеден”. Следующий этап – модели должны учиться как человек после школы: выходить в реальный мир, пробовать, ошибаться, получать фидбек. Reinforcement learning становится центральным механизмом.
В DeepMind Сильвер не просто применял RL, они двигали саму теорию. Например, подход DiscoRL, когда функцию потерь, которая управляет обучением, заменяют нейросетью, способной самоулучшаться через агентов. Это уже мета-уровень обучения.
Что именно будет делать Ineffable пока туманно. Неясно, будут ли они строить универсальных агентов, инфраструктуру для RL или что-то совсем новое, но сам факт, что и Google, и Microsoft готовы инвестировать, намекает: это не фронтальная конкуренция с их LLM, а скорее фундаментальный слой под будущие системы.
Автор: turchan
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/25949
URLs in this post:
[1] https://t.me/startuphunt/667)-: https://t.me/startuphunt/667)-
[2] https://t.me/startuphunt/838: https://t.me/startuphunt/838
[3] опыт: http://www.braintools.ru/article/6952
[4] обучения: http://www.braintools.ru/article/5125
[5] Источник: https://habr.com/ru/articles/1001678/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1001678
Нажмите здесь для печати.