ai.
LCPO меняет подход к обучению AI, снижая затраты на вычисления
Процесс рассуждения через цепочку (Chain-of-Thought, CoT) — это метод, при котором модели разбивают задачи на управляемые «мысли», прежде чем искать ответ. Этот подход стал важной частью современных больших языковых моделей (LLMs). Однако такие модели могут создавать высокие затраты на вычисления из-за большого количества генерируемых CoT-токенов. В новой работе исследователи из Университета Карнеги-Меллона предложили технику обучения языковых моделей, которая дает разработчикам больше контроля над длиной CoT.
Кто на самом деле автор контента? Определяем роль ИИ в цифровом диалоге
Впервые я заподозрил, что ИИ проник в мою жизнь глубже, чем я думал, примерно в сентябре прошлого года. Один из моих бывших коллег, назовём его Диего, опубликовал на LinkedIn трогательный пост о том, что его уволили. В последнее время подобных сообщений появилось немало, но это выделялось особенно.
OLMo 2 32B устанавливает новый стандарт для моделей LLM с открытым исходным кодом
Новая языковая модель с открытым исходным кодом достигла производительности, сопоставимой с ведущими коммерческими системами, при сохранении полной прозрачности. Институт искусственного интеллекта Аллена (Ai2) объявил , что его модель OLMo 2 32B превосходит как GPT-3 .5-Turbo, так и GPT-4o mini, а также сделал ее код, данные обучения и технические подробности общедоступными.
Cohere представляет Command A: инструмент AI для быстрого реагирования в бизнесе и науке
Канадский стартап Cohere в области искусственного интеллекта, соучредителем которого является один из авторов оригинальной статьи о трансформаторах, положившей начало революции в области больших языковых моделей (LLM) в 2017 году, представил Command A — свою новейшую генеративную модель искусственного интеллекта, разработанную для корпоративных приложений.
Практическое руководство по выбору между ChatGPT, Claude, Gemini, Grok и Perplexity
Всем привет! Меня зовут Александр, я COO в SaaS-платформе для аналитики данных. Последний год активно изучаю AI-решения в кросс-функциональные процессы. В своих переводах делюсь материалами, которые помогают:Продуктовым менеджерам — интегрировать AI без перегрузки команд;Разработчикам — выбирать инструменты под конкретные бизнес-задачи;Специалистам по данным — избегать ошибок в production-развертывании.Сегодняшний перевод Субъективный гид по выбору модели искусственного интеллекта в 2025 году
Исследование: скептицизм ученых по поводу создания AGI вырос
Новое исследование показывает, что исследователи искусственного интеллекта в значительной степени сомневаются, что существующие подходы к искусственному интеллекту приведут к созданию AGI, даже несмотря на то, что эта технология продолжает развиваться.Согласно
Концерт для Java с ИИ — разработка готовых к продакшен LLM приложений
Команда Spring АйО перевела и адаптировала доклад Томаса Витале “Concerto for Java and AI — Building Production-Ready LLM Applications”, в котором рассказывается по шагам, как усовершенствовать интерфейс приложения с помощью больших языковых моделей (LLM). В качестве примера автор доклада на глазах слушателей разрабатывает приложение-ассистент для композитора, пишущего музыку для фильмов.
Sony тестирует искусственный интеллект для управления персонажами
Как компания и платформа первой стороны, PlayStation и Sony не уклоняются от использования AI как части своего ценностного предложения для потребителей. В то время как конкурент Microsoft устроил большую демонстрацию использования AI для создания игровых идей и прототипов, Sony вместо этого сосредоточилась на использовании AI и машинного обучения для генерации кадров и использования оборудования

