Исследователи представили бенчмарк, в котором языковые модели проходят классические игры
Исследователи Принстонского университета представили Video Game Bench — бенчмарк, в котором языковые модели проходят классические игры для MS-DOS и Game Boy. Код бенчмарка открыт и опубликован на GitHub.
Руководство Google по промпт-инжинирингу. Заключительная часть: лучшие практики и рекомендации
От переводчикаПредставляю вашему вниманию заключительную, третью часть перевода статьи "Prompt Engineering" (Промпт-инжиниринг) авторства Lee Boonstra — Software Engineer Tech Lead, Office of the CTO в Google. Этот материал завершает цикл публикаций, посвященных эффективному взаимодействию с большими языковыми моделями.В первой части мы познакомились с основами промпт-инжиниринга и базовыми техниками промптинга. Во второй
Накорми языковую модель документами
Задача поиска ответов по внутренней документации
Оценка развития человечества на 1000 лет по версии DeepSeek и рефлексия
Я знаю сейчас очень популярно хейтить статьи сгенерированные LLM. Но как по мне это огромное поле для исследований. Ведь с точки зрения технологий это фактически новый вид баз данных, которые определенным образом обобщают тот опыт который в них закладывается разработчиками. И так меньше флуда больше пользы...Задал я тут вопрос Дипсику.Как ты оцениваешь динамику популяции человечества в следующие 1000 лет. разбери этот вопрос по вехам, каждая по 250 лет. Ответ:
Google выпустил предварительную версию улучшенной модели ИИ Gemini 2.5 Flash
Google выпустил предварительную версию Gemini 2.5 Flash — более быструю и гибкую версию своей облегчённой модели искусственного интеллекта. Разработчики могут попробовать её прямо сейчас через API Gemini с помощью Google AI Studio и Vertex AI. Модель также доступна пользователям в приложении Gemini.
OpenAI запускает гибкую обработку данных для более дешевых и медленных задач
Стремясь более агрессивно конкурировать с такими компаниями-конкурентами в сфере ИИ, как Google, OpenAI запускает гибкую обработку — вариант API, который обеспечивает более низкие цены на использование моделей ИИ в обмен на более медленную реакцию и «периодическую недоступность ресурсов».
Как мы освободили операторов от классификации текстов диалогов на 1000+ классов
Всем привет! Меня зовут Наумов Герман, я работаю в Лаборатории машинного обучения Альфа-Банка, и я расскажу, как мы автоматизировали внутренние процессы, упростили работу операторов чата с физическими лицами. Задача не особо простая и тюнингом гиперпараметров как на Kaggle не решается. Но решается.
Open Deep Research: инструмент для многоэтапных веб-исследований от Together AI
Компания Together AI представила Open Deep Research — инструмент с открытым исходным кодом, предназначенный для поиска ответов на сложные вопросы с помощью структурированных многоэтапных веб-исследований.

