ai. - страница 53

ai.

Себастьян Рашка запустил визуальный справочник архитектур LLM — от DeepSeek до GLM-5

Себастьян Рашка, автор бестселлера Build a Large Language Model (From Scratch) и рассылки Ahead of AI на 168 000 подписчиков, запустил

продолжить чтение

Gemini Embedding 2 + мультимодальный RAG: эмбеддим видео и картинки — разбор и туториал

10 марта Google выкатил Gemini Embedding 2 - embedding-модель, которая умеет превращать в векторы не только текст, но и картинки, видео, аудио и PDF. Причем всё это ложится в одно векторное пространство.

продолжить чтение

14 аварий на 800 000 миль — и это с водителем за рулём. Почему Tesla избегает тестов в Калифорнии

продолжить чтение

В поисках эмбеддинга личности или Как зарождается личность LLM

Пару месяцев назад я публиковал отчет об эксперименте по созданию языковой модели на базе модульной архитектуры с ядром на латентных представлениях. Данная статья является отчетом о новых аспектах этого эксперимента. Поэтому для тех, кто не в теме, совсем коротко: классические авторегрессивные LLM оперируют токенами, условно говоря думают на токенном уровне. В модульной архитектуре отдельно выделяется языковой интерфейс в виде энкодера и декодера, а само «думающее» ядро работает уже не с токенами напрямую, а с их сжатыми латентными представлениями. Кому интересно, вот ссылка на статью с предыдущим экспериментом:

продолжить чтение

ByteDance отложила глобальный запуск AI-модели генерации видео Seedance 2.0 из-за споров об авторском праве

продолжить чтение

Meta может сократить до 20% сотрудников на фоне роста расходов на AI

продолжить чтение

AI-диджей Spotify иногда не понимает даже простые музыкальные запросы

продолжить чтение

ИИ в образовании: заменят ли нейросети репетиторов и преподавателей

продолжить чтение

Прорыв в робототехнике: AI2 создал роботов, обученных только в симуляции

Исследователи из AI2 разработали роботов, которые успешно работают в реальном мире без предварительного сбора данных из физической среды.

продолжить чтение

Hume AI открыла быстрый генератор речи TADA

Компания Hume AI открыла исходный код TADA - системы искусственного интеллекта для генерации речи, которая синхронно обрабатывает текст и аудио. 

продолжить чтение