ai.
Anthropic готовит новую гибридную модель Claude, превосходящую o3-mini-high в кодинге
Как сообщает The Information, Anthropic планирует представить свою следующую крупную модель, которая сочетает традиционные языковые возможности с продвинутыми функциями логического анализа.
ByteDance представила ИИ-модель для генерации видео Goku. Наступает эра фейковых блогеров
ByteDance представила ИИ-модель для генерации видео Goku. Наступает эра фейковых блогеровСогласитесь ли вы со мной, если я скажу, что наступает эра фейковых блогеров?По правде говоря, она уже наступила.
Искусственный интеллект без угодливости: OpenAI обновляет спецификацию ChatGPT
OpenAI выпускает значительно расширенную версию Model Spec — документа, определяющего, как должны вести себя модели AI.OpenAI значительно обновила свою спецификацию модели, расширив документ, в котором описывается, как должны вести себя ее модели AI с момента ее первоначального выпуска в мае 2024 года. Новые 63-страничные руководящие принципы сосредоточены на трех основных принципах: настраиваемость, прозрачность и интеллектуальная свобода.
Исследование AI выявило ключевые факторы, лежащие в основе долгосрочных способностей LLM к рассуждениям
Систематическое исследование раскрывает методы, с помощью которых генерируются длинные цепочки мыслей моделей рассуждений. Результаты дают практические советы по оптимизации стратегий обучения. Команда IN.AI вместе с исследователями из Университета Цинхуа и Университета Карнеги-Меллона составила карту того, как модели AI развивают свою способность работать с длинными цепочками мыслей. Их систематическое исследование использовало контролируемую тонкую настройку (SFT) и обучение с подкреплением (RL) для выявления ключевых факторов, лежащих в основе этой способности.
Меньше надзора, больше эффективности: AI модели обобщают данные сами
Исследование Гонконгского университета и Калифорнийского университета в Беркли показало, что языковые модели лучше обобщают, если им позволить самостоятельно находить решения. Это касается как больших языковых моделей
OpenAI планирует выпустить GPT-4.5 в течение нескольких недель, подготавливая почву для GPT-5
OpenAI готовится выпустить GPT-4.5, разработанный внутри компании как «Orion», в ближайшие недели. Генеральный директор Сэм Альтман говорит, что это будет последняя традиционная языковая модель компании перед серьезным изменением стратегии. Впервые мы услышали об Orion в ноябре прошлого года , когда издание The Information сообщило, что модель показала меньшие улучшения по сравнению с GPT-4, чем ожидалось, что говорит о том, что масштабирование традиционной языковой модели, возможно, достигло своих пределов.
Reddit планирует улучшить поиск и интегрировать функцию Reddit Answers
Генеральный директор Reddit Стив Хаффман заявил, что сайт онлайн-форума планирует запустить улучшенный поиск в 2025 году, призванный помочь пользователям ориентироваться в социальной сети и отвечать на «субъективные, трудные и интересные вопросы».Компания планирует добиться этого, интегрировав
Феномен DeepSeek: разбираем причины шума вокруг нейросети
Понедельник, 27 января, начался с крупнейшего однодневного падения
OpenAI отменяет выпуск своей AI-модели o3 в пользу «унифицированного» релиза нового поколения
OpenAI фактически отменила выпуск o3, которая должен был стать следующей крупной моделью AI компании, в пользу того, что генеральный директор Сэм Альтман называет «упрощённым» предложением продукта.В
Генеральный директор Anthropic Дарио Амодей предупреждает о «гонке» за пониманием AI по мере его усиления
Сразу после завершения AI Action Summit в Париже соучредитель и генеральный директор Anthropic Дарио Амодей назвал это мероприятие «упущенной возможностью». Он добавил, что «необходимо уделять больше внимания и действовать быстрее по нескольким направлениям, учитывая темпы развития технологий», в заявлении, опубликованном во вторник.

