ai.
Себастьян Рашка запустил визуальный справочник архитектур LLM — от DeepSeek до GLM-5
Себастьян Рашка, автор бестселлера Build a Large Language Model (From Scratch) и рассылки Ahead of AI на 168 000 подписчиков, запустил
В поисках эмбеддинга личности или Как зарождается личность LLM
Пару месяцев назад я публиковал отчет об эксперименте по созданию языковой модели на базе модульной архитектуры с ядром на латентных представлениях. Данная статья является отчетом о новых аспектах этого эксперимента. Поэтому для тех, кто не в теме, совсем коротко: классические авторегрессивные LLM оперируют токенами, условно говоря думают на токенном уровне. В модульной архитектуре отдельно выделяется языковой интерфейс в виде энкодера и декодера, а само «думающее» ядро работает уже не с токенами напрямую, а с их сжатыми латентными представлениями. Кому интересно, вот ссылка на статью с предыдущим экспериментом:
Прорыв в робототехнике: AI2 создал роботов, обученных только в симуляции
Исследователи из AI2 разработали роботов, которые успешно работают в реальном мире без предварительного сбора данных из физической среды.
Hume AI открыла быстрый генератор речи TADA
Компания Hume AI открыла исходный код TADA - системы искусственного интеллекта для генерации речи, которая синхронно обрабатывает текст и аудио.

