o1.

o1.

Режим thinking у ИИ: что на самом деле происходит, когда модель «думает»

Когда нажимаешь кнопку Thinking и видишь, как модель несколько секунд «размышляет» перед ответом — легко решить, что она просто старается сильнее. Работает усерднее. Думает глубже. Может, перебирает больше вариантов из какой-то внутренней базы знаний.Это не так. Thinking-режим — это принципиально другой способ генерации текста, не просто «обычный режим с усилием». И понять разницу полезно не для общего развития, а чтобы знать, когда его включать, когда он даёт реальное преимущество — а когда только тратит твоё время и ресурсы.Как работает обычная генерация — и в чём её фундаментальная ловушка

продолжить чтение

OpenAI теряет ещё четырёх ведущих исследователей, которые присоединились к Meta*

Meta наняла ещё четырёх ведущих исследователей ИИ из OpenAI. Цзяхуэй Ю, Хунъю Жэнь, Шучао Би и Шэнцзя Чжао ранее работали над такими базовыми моделями, как GPT-4.1, o3, o1, и занимались мультимодальной постобработкой в OpenAI.

продолжить чтение

Некоммерческая организация использует ИИ-агентов для сбора денег на благотворительность

Такие технологические гиганты, как Microsoft, могут рекламировать «агентов» ИИ как инструменты для увеличения прибыли корпораций, но некоммерческая организация пытается доказать, что агенты могут быть и силой добра.

продолжить чтение

Gemini 2.5 Pro еще ближе к человеку, но реально рассуждать умеют только модели OpenAI

Моя первая статья на Хабре, хочу поделиться своими находками и мыслями.На этой неделе вышла новая модель Gemini 2.5 Pro от Google. Много уже было про нее сказано, но я стараюсь не обращать внимания на волны хайпа вокруг новинок, ориентируясь на свои доверенные источники. Одним из них является любительский бенчмарк SimpleBench, который тестирует здравый смысл в реальной жизни. Этот бенчмарк интересен тем, что в нем самый обычный человек набирает 83.7%, а передовые ИИ модели до сих пор не могут даже приблизиться к этому показателю. Пример вопроса (вольный перевод на русский):

продолжить чтение

O1-pro от OpenAI — самая дорогая модель искусственного интеллекта компании на сегодняшний день

Компания OpenAI выпустила более мощную версию своей модели искусственного интеллекта «разума» o1, o1-pro, в своем API для разработчиков. По данным OpenAI, o1-pro использует больше вычислений, чем o1, чтобы постоянно предоставлять лучшие ответы. В настоящее время он доступен только избранным разработчикам — тем, кто потратил не менее 5 долларов на услуги API OpenAI.

продолжить чтение

Yelp адаптирует технологии ИИ для улучшения пользовательского опыта

Во время недавнего всплеска интереса к технологиям ИИ приложение для отзывов Yelp столкнулось с препятствиями при использовании современных LLM для некоторых функций.У клиентов, особенно у тех, кто пользовался приложением лишь изредка, возникали проблемы с 

продолжить чтение

OpenAI анонсировали Deep Research — самостоятельного агента для исследований

В 16:00 по Pacific Time OpenAI запустили стрим, на котором анонсировали новый продукт компании - Deep Research, особый режим для ChatGPT, в котором он переходит в режим высокой автономности, и может проводить длительные глубокие исследования - самостоятельно вырабатывать план работ, ходить по интернету в поисках информации, агрегировать и анализировать данные при помощи Python-скриптов, и всё это полностью без участия человека.

продолжить чтение

OpenAI объявила о партнёрстве с Национальными лабораториями США для «стимулирования научных прорывов»

OpenAI объявила о заключении договора о сотрудничестве с Национальными лабораториями США, чтобы «дать толчок их научным исследованиям с помощью своих новейших моделей рассуждения». Компания назвала правительство США критически важным партнёром в вопросе обмена технологиями OpenAI с ведущими учёными страны.

продолжить чтение

DeepSeek и её модель рассуждений R1: что говорят эксперты и потребители

С тех пор как китайская компания DeepSeek, занимающаяся искусственным интеллектом, выпустила открытую версию своей модели рассуждений R1 в начале этой недели, многие представители технологической отрасли делают громкие заявления о том, чего добилась компания и что это значит для развития AI.

продолжить чтение

Разбираемся, как устроена R1 – новая бесплатная ризонинг модель ИИ из Китая, работающая на уровне o1 от OpenAI

Вчера, 20 января, китайская лаборатория DeepSeek сделала нам всем настоящий подарок, открыв доступ к новой reasoning-модели R1, которая уже штурмует вершины ML-бенчмарков. R1 – не просто еще одна рассуждающая модель: это первая бесплатная моделька с открытыми весами, которая добивается таких результатов. На математическом бенчмарке AIME 2024 она достигает 79.8%, обогнав даже обновленную версию o1 с ее 79.2%, не говоря уже об o1-mini (63.6%). В кодинге R1 тоже хороша. Например, на Codeforces ее результат – 96.3%, что практически недостижимо для большинства людей.

продолжить чтение

12