o1.

OpenAI теряет ещё четырёх ведущих исследователей, которые присоединились к Meta*

Meta наняла ещё четырёх ведущих исследователей ИИ из OpenAI. Цзяхуэй Ю, Хунъю Жэнь, Шучао Би и Шэнцзя Чжао ранее работали над такими базовыми моделями, как GPT-4.1, o3, o1, и занимались мультимодальной постобработкой в OpenAI.

продолжить чтение

Оставлено в

Некоммерческая организация использует ИИ-агентов для сбора денег на благотворительность

Такие технологические гиганты, как Microsoft, могут рекламировать «агентов» ИИ как инструменты для увеличения прибыли корпораций, но некоммерческая организация пытается доказать, что агенты могут быть и силой добра.

продолжить чтение

Оставлено в

Gemini 2.5 Pro еще ближе к человеку, но реально рассуждать умеют только модели OpenAI

Моя первая статья на Хабре, хочу поделиться своими находками и мыслями.На этой неделе вышла новая модель Gemini 2.5 Pro от Google. Много уже было про нее сказано, но я стараюсь не обращать внимания на волны хайпа вокруг новинок, ориентируясь на свои доверенные источники. Одним из них является любительский бенчмарк SimpleBench, который тестирует здравый смысл в реальной жизни. Этот бенчмарк интересен тем, что в нем самый обычный человек набирает 83.7%, а передовые ИИ модели до сих пор не могут даже приблизиться к этому показателю. Пример вопроса (вольный перевод на русский):

продолжить чтение

Оставлено в

O1-pro от OpenAI — самая дорогая модель искусственного интеллекта компании на сегодняшний день

Компания OpenAI выпустила более мощную версию своей модели искусственного интеллекта «разума» o1, o1-pro, в своем API для разработчиков. По данным OpenAI, o1-pro использует больше вычислений, чем o1, чтобы постоянно предоставлять лучшие ответы. В настоящее время он доступен только избранным разработчикам — тем, кто потратил не менее 5 долларов на услуги API OpenAI.

продолжить чтение

Оставлено в

Yelp адаптирует технологии ИИ для улучшения пользовательского опыта

Во время недавнего всплеска интереса к технологиям ИИ приложение для отзывов Yelp столкнулось с препятствиями при использовании современных LLM для некоторых функций.У клиентов, особенно у тех, кто пользовался приложением лишь изредка, возникали проблемы с

продолжить чтение

Оставлено в

OpenAI анонсировали Deep Research — самостоятельного агента для исследований

В 16:00 по Pacific Time OpenAI запустили стрим, на котором анонсировали новый продукт компании - Deep Research, особый режим для ChatGPT, в котором он переходит в режим высокой автономности, и может проводить длительные глубокие исследования - самостоятельно вырабатывать план работ, ходить по интернету в поисках информации, агрегировать и анализировать данные при помощи Python-скриптов, и всё это полностью без участия человека.

продолжить чтение

Оставлено в

OpenAI объявила о партнёрстве с Национальными лабораториями США для «стимулирования научных прорывов»

OpenAI объявила о заключении договора о сотрудничестве с Национальными лабораториями США, чтобы «дать толчок их научным исследованиям с помощью своих новейших моделей рассуждения». Компания назвала правительство США критически важным партнёром в вопросе обмена технологиями OpenAI с ведущими учёными страны.

продолжить чтение

Оставлено в

DeepSeek и её модель рассуждений R1: что говорят эксперты и потребители

С тех пор как китайская компания DeepSeek, занимающаяся искусственным интеллектом, выпустила открытую версию своей модели рассуждений R1 в начале этой недели, многие представители технологической отрасли делают громкие заявления о том, чего добилась компания и что это значит для развития AI.

продолжить чтение

Оставлено в

Разбираемся, как устроена R1 – новая бесплатная ризонинг модель ИИ из Китая, работающая на уровне o1 от OpenAI

Вчера, 20 января, китайская лаборатория DeepSeek сделала нам всем настоящий подарок, открыв доступ к новой reasoning-модели R1, которая уже штурмует вершины ML-бенчмарков. R1 – не просто еще одна рассуждающая модель: это первая бесплатная моделька с открытыми весами, которая добивается таких результатов. На математическом бенчмарке AIME 2024 она достигает 79.8%, обогнав даже обновленную версию o1 с ее 79.2%, не говоря уже об o1-mini (63.6%). В кодинге R1 тоже хороша. Например, на Codeforces ее результат – 96.3%, что практически недостижимо для большинства людей.

продолжить чтение

Оставлено в

Думающие модели o1-3: краткий обзор и чего программистам ждать дальше

Когда LLM впервые появились, они были немного похожи на детей - говорили первое, что приходило им в голову, и не особо заботились о логике. Им нужно было напоминать: «Подумай, прежде чем отвечать». Но, как и с детьми, даже тогда это не означало, что они действительно будут думать.Многие утверждали, что из-за этого у моделей нет настоящего интеллекта и что их необходимо дополнять либо человеческой помощью, либо каким-то внешним каркасом поверх самой LLM, например Chain of Thought.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

o1.

OpenAI теряет ещё четырёх ведущих исследователей, которые присоединились к Meta*

Некоммерческая организация использует ИИ-агентов для сбора денег на благотворительность

Gemini 2.5 Pro еще ближе к человеку, но реально рассуждать умеют только модели OpenAI

O1-pro от OpenAI — самая дорогая модель искусственного интеллекта компании на сегодняшний день

Yelp адаптирует технологии ИИ для улучшения пользовательского опыта

OpenAI анонсировали Deep Research — самостоятельного агента для исследований

OpenAI объявила о партнёрстве с Национальными лабораториями США для «стимулирования научных прорывов»

DeepSeek и её модель рассуждений R1: что говорят эксперты и потребители

Разбираемся, как устроена R1 – новая бесплатная ризонинг модель ИИ из Китая, работающая на уровне o1 от OpenAI

Думающие модели o1-3: краткий обзор и чего программистам ждать дальше

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

o1.