ИИ. - страница 133

LLM Evals: движущая сила новой эры ИИ в бизнесе

На днях OpenAI опубликовали в своем блоге небольшую статью с достаточно громким названием «How evals drive the next chapter in AI for businesses». Я сделал ее перевод, чуть адаптировав для лучшей читабельности, очень уж бюрократический язык в оригинале.Статью авторы называют «руководством для бизнес-лидеров». Внутри — про оценку недетерминированных систем, как к этому подходить, немного про A/B тесты и почему не стоит пытаться решить все сразу. Классический цикл фиксации метрики и постепенного ее улучшения, но с LLM спецификой.

продолжить чтение

Вечный ревьювер: как ИИ меняет работу разработчиков

Все в курсе того, что количество разговоров вокруг ИИ растет с каждым днем. В нашу жизнь вошли такие термины как «вайбкодинг», «промпт-инжиниринг» и другие подобные. Работая в одной из крупнейших ИТ-компаний, я вижу, как в реальности выглядит внедрение ИИ-инструментов для разработчиков. Оно и понятно: эти инструменты обещают кратно увеличить производительность. Но что, по моему мнению, реально будет плотно применяться и являться неким бейзлайном для устройства на работу в ближайшее время?

продолжить чтение

ИИ без галлюцинаций: как Lean 4 заставляет модели доказывать правду

продолжить чтение

Softbank тайно избавился от акций Nvidia, а SEC расследует деятельность OpenAI. Лопнет ли пузырь ИИ?

Фото: Richard Horvath, Unsplash

продолжить чтение

Ubisoft работает над проектом Teammates с виртуальными ИИ-помощниками для геймеров

Французская Ubisoft сообщила о запуске игрового эксперимента Teammates, который исследует то, как искусственный интеллект можно использовать для углубления игрового опыта при помощи голосовых команд в реальном времени и расширенного геймплея. Teammates демонстрирует возможности внутриигрового ИИ-помощника под названием Jaspar и улучшенных за счёт ИИ NPC, которые сопровождают и поддерживают игрока, генерируя ответы на голосовые команды.

продолжить чтение

Meta* превращает энергию в товар: новый бизнес ради масштабных ИИ‑центров

продолжить чтение

Белый дом сдаёт позиции? США переходят к десяткам разных законов об ИИ

продолжить чтение

X живее всех живых: Threads и Bluesky не смогли переманить пользователей

Согласно новому отчету

продолжить чтение

ИИ-система Locus превзошла экспертов в научных исследованиях

Intology анонсировала Locus, систему «искусственного учёного», которая по предварительным результатам обходит человеческих исследователей, и это не просто хайп. На бенчмарке RE‑Bench, под равными временными и вычислительными ресурсами, Locus показывает результаты выше, чем лучшие специалисты в области ИИ из ведущих лабораторий. 

продолжить чтение

NVIDIA раскрыла секрет ускорения биологических трансформеров — забудьте про медленные GPU

продолжить чтение

Rambler's Top100