ai.

Anthropic готовит новую гибридную модель Claude, превосходящую o3-mini-high в кодинге

Как сообщает The Information, Anthropic планирует представить свою следующую крупную модель, которая сочетает традиционные языковые возможности с продвинутыми функциями логического анализа.

продолжить чтение

Оставлено в

ByteDance представила ИИ-модель для генерации видео Goku. Наступает эра фейковых блогеров

ByteDance представила ИИ-модель для генерации видео Goku. Наступает эра фейковых блогеровСогласитесь ли вы со мной, если я скажу, что наступает эра фейковых блогеров?По правде говоря, она уже наступила.

продолжить чтение

Оставлено в

Искусственный интеллект без угодливости: OpenAI обновляет спецификацию ChatGPT

OpenAI выпускает значительно расширенную версию Model Spec — документа, определяющего, как должны вести себя модели AI.OpenAI значительно обновила свою спецификацию модели, расширив документ, в котором описывается, как должны вести себя ее модели AI с момента ее первоначального выпуска в мае 2024 года. Новые 63-страничные руководящие принципы сосредоточены на трех основных принципах: настраиваемость, прозрачность и интеллектуальная свобода.

продолжить чтение

Оставлено в

Исследование AI выявило ключевые факторы, лежащие в основе долгосрочных способностей LLM к рассуждениям

Систематическое исследование раскрывает методы, с помощью которых генерируются длинные цепочки мыслей моделей рассуждений. Результаты дают практические советы по оптимизации стратегий обучения. Команда IN.AI вместе с исследователями из Университета Цинхуа и Университета Карнеги-Меллона составила карту того, как модели AI развивают свою способность работать с длинными цепочками мыслей. Их систематическое исследование использовало контролируемую тонкую настройку (SFT) и обучение с подкреплением (RL) для выявления ключевых факторов, лежащих в основе этой способности.

продолжить чтение

Оставлено в

Меньше надзора, больше эффективности: AI модели обобщают данные сами

Исследование Гонконгского университета и Калифорнийского университета в Беркли показало, что языковые модели лучше обобщают, если им позволить самостоятельно находить решения. Это касается как больших языковых моделей

продолжить чтение

Оставлено в

OpenAI планирует выпустить GPT-4.5 в течение нескольких недель, подготавливая почву для GPT-5

OpenAI готовится выпустить GPT-4.5, разработанный внутри компании как «Orion», в ближайшие недели. Генеральный директор Сэм Альтман говорит, что это будет последняя традиционная языковая модель компании перед серьезным изменением стратегии. Впервые мы услышали об Orion в ноябре прошлого года , когда издание The Information сообщило, что модель показала меньшие улучшения по сравнению с GPT-4, чем ожидалось, что говорит о том, что масштабирование традиционной языковой модели, возможно, достигло своих пределов.

продолжить чтение

Оставлено в

Reddit планирует улучшить поиск и интегрировать функцию Reddit Answers

Генеральный директор Reddit Стив Хаффман заявил, что сайт онлайн-форума планирует запустить улучшенный поиск в 2025 году, призванный помочь пользователям ориентироваться в социальной сети и отвечать на «субъективные, трудные и интересные вопросы».Компания планирует добиться этого, интегрировав

продолжить чтение

Оставлено в

Феномен DeepSeek: разбираем причины шума вокруг нейросети

Понедельник, 27 января, начался с крупнейшего однодневного падения

продолжить чтение

Оставлено в

OpenAI отменяет выпуск своей AI-модели o3 в пользу «унифицированного» релиза нового поколения

OpenAI фактически отменила выпуск o3, которая должен был стать следующей крупной моделью AI компании, в пользу того, что генеральный директор Сэм Альтман называет «упрощённым» предложением продукта.В

продолжить чтение

Оставлено в

Генеральный директор Anthropic Дарио Амодей предупреждает о «гонке» за пониманием AI по мере его усиления

Сразу после завершения AI Action Summit в Париже соучредитель и генеральный директор Anthropic Дарио Амодей назвал это мероприятие «упущенной возможностью». Он добавил, что «необходимо уделять больше внимания и действовать быстрее по нескольким направлениям, учитывая темпы развития технологий», в заявлении, опубликованном во вторник.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

ai.

Anthropic готовит новую гибридную модель Claude, превосходящую o3-mini-high в кодинге

ByteDance представила ИИ-модель для генерации видео Goku. Наступает эра фейковых блогеров

Искусственный интеллект без угодливости: OpenAI обновляет спецификацию ChatGPT

Исследование AI выявило ключевые факторы, лежащие в основе долгосрочных способностей LLM к рассуждениям

Меньше надзора, больше эффективности: AI модели обобщают данные сами

OpenAI планирует выпустить GPT-4.5 в течение нескольких недель, подготавливая почву для GPT-5

Reddit планирует улучшить поиск и интегрировать функцию Reddit Answers

Феномен DeepSeek: разбираем причины шума вокруг нейросети

OpenAI отменяет выпуск своей AI-модели o3 в пользу «унифицированного» релиза нового поколения

Генеральный директор Anthropic Дарио Амодей предупреждает о «гонке» за пониманием AI по мере его усиления

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

ai.