Как изменить формат обучения LLM: подход через фазовую когерентность
Современные LLM учатся предсказывать следующее слово. Я предлагаю дополнить эту цель: учить модель сохранять стабильность смысловых связей (когерентность). Это может уменьшить зависимость от объёма данных и ускорить появление способностей к рассуждению. Статья описывает гипотезу, метрики для проверки и возможные способы реализации.Введение
EMNLP-2025: обзор исследований жестовых языков
Всем привет! В этом году в китайском городе Суджоу проходит юбилейная тридцатая конференция EMNLP (Empirical Methods in Natural Language Processing). Это одна из ведущих международных конференций по обработке естественного языка (NLP), проводимая под эгидой ассоциации компьютерной лингвистики ACL (Association for Computational Linguistics).
Anthropic строит собственную инфраструктуру в США
Компания Anthropic объявила о масштабных инвестициях в строительство дата‑центров в Техасе и Нью‑Йорке совместно с Fluidstack. Объекты будут оптимизированы под задачи Anthropic: энергоэффективные и рассчитанные на развитие передовых моделей ИИ Claude.
Программист & LLM: как написать эмулятор ретро-компьютера за четыре вечера. Часть 1, вводная
Тон данной публикации задал товарищ @kiltum в своих статьях, начатых с этой. В самом начале был задан вопросможет ли ИИ заменить программиста?А действительно? Сколько вокруг этой темы хайпа, нет ни дня чтобы здесь на ресурсе не появилось 100500 статей на тему нейросетей, LLM, ML и прочего. Пишут много и всякое. Возникло желание проверить лично, насколько решения, предлагаемые ИИ могут быть воплощены в жизнь.
$50 млрд для Claude: Anthropic запускает строительство собственных дата-центров в США
Anthropic объявила
Rоманда WeiboAI представила компактную модель с 1.5 миллиарда параметров
Исследовательская команда WeiboAI представила VibeThinker-1.5B

