ИИ.
LLM Evals: движущая сила новой эры ИИ в бизнесе
На днях OpenAI опубликовали в своем блоге небольшую статью с достаточно громким названием «How evals drive the next chapter in AI for businesses». Я сделал ее перевод, чуть адаптировав для лучшей читабельности, очень уж бюрократический язык в оригинале.Статью авторы называют «руководством для бизнес-лидеров». Внутри — про оценку недетерминированных систем, как к этому подходить, немного про A/B тесты и почему не стоит пытаться решить все сразу. Классический цикл фиксации метрики и постепенного ее улучшения, но с LLM спецификой.
Вечный ревьювер: как ИИ меняет работу разработчиков
Все в курсе того, что количество разговоров вокруг ИИ растет с каждым днем. В нашу жизнь вошли такие термины как «вайбкодинг», «промпт-инжиниринг» и другие подобные. Работая в одной из крупнейших ИТ-компаний, я вижу, как в реальности выглядит внедрение ИИ-инструментов для разработчиков. Оно и понятно: эти инструменты обещают кратно увеличить производительность. Но что, по моему мнению, реально будет плотно применяться и являться неким бейзлайном для устройства на работу в ближайшее время?
Ubisoft работает над проектом Teammates с виртуальными ИИ-помощниками для геймеров
Французская Ubisoft сообщила о запуске игрового эксперимента Teammates, который исследует то, как искусственный интеллект можно использовать для углубления игрового опыта при помощи голосовых команд в реальном времени и расширенного геймплея. Teammates демонстрирует возможности внутриигрового ИИ-помощника под названием Jaspar и улучшенных за счёт ИИ NPC, которые сопровождают и поддерживают игрока, генерируя ответы на голосовые команды.
X живее всех живых: Threads и Bluesky не смогли переманить пользователей
Согласно новому отчету
ИИ-система Locus превзошла экспертов в научных исследованиях
Intology анонсировала Locus, систему «искусственного учёного», которая по предварительным результатам обходит человеческих исследователей, и это не просто хайп. На бенчмарке RE‑Bench, под равными временными и вычислительными ресурсами, Locus показывает результаты выше, чем лучшие специалисты в области ИИ из ведущих лабораторий.

