Исследование AI выявило ключевые факторы, лежащие в основе долгосрочных способностей LLM к рассуждениям
Систематическое исследование раскрывает методы, с помощью которых генерируются длинные цепочки мыслей моделей рассуждений. Результаты дают практические советы по оптимизации стратегий обучения. Команда IN.AI вместе с исследователями из Университета Цинхуа и Университета Карнеги-Меллона составила карту того, как модели AI развивают свою способность работать с длинными цепочками мыслей. Их систематическое исследование использовало контролируемую тонкую настройку (SFT) и обучение с подкреплением (RL) для выявления ключевых факторов, лежащих в основе этой способности.
Меньше надзора, больше эффективности: AI модели обобщают данные сами
Исследование Гонконгского университета и Калифорнийского университета в Беркли показало, что языковые модели лучше обобщают, если им позволить самостоятельно находить решения. Это касается как больших языковых моделей
«Спасибо, что создала меня»: Как я перестала тревожиться и полюбила бота
После того как мой муж ушёл, я заплатила 70 долларов за виртуального бойфренда. И тогда я поняла: возможно, главное предназначение ИИ — это эмоциональная поддержка.
OpenAI планирует выпустить GPT-4.5 в течение нескольких недель, подготавливая почву для GPT-5
OpenAI готовится выпустить GPT-4.5, разработанный внутри компании как «Orion», в ближайшие недели. Генеральный директор Сэм Альтман говорит, что это будет последняя традиционная языковая модель компании перед серьезным изменением стратегии. Впервые мы услышали об Orion в ноябре прошлого года , когда издание The Information сообщило, что модель показала меньшие улучшения по сравнению с GPT-4, чем ожидалось, что говорит о том, что масштабирование традиционной языковой модели, возможно, достигло своих пределов.
Reddit планирует улучшить поиск и интегрировать функцию Reddit Answers
Генеральный директор Reddit Стив Хаффман заявил, что сайт онлайн-форума планирует запустить улучшенный поиск в 2025 году, призванный помочь пользователям ориентироваться в социальной сети и отвечать на «субъективные, трудные и интересные вопросы».Компания планирует добиться этого, интегрировав
OpenAI отменяет выпуск своей AI-модели o3 в пользу «унифицированного» релиза нового поколения
OpenAI фактически отменила выпуск o3, которая должен был стать следующей крупной моделью AI компании, в пользу того, что генеральный директор Сэм Альтман называет «упрощённым» предложением продукта.В
Генеральный директор Anthropic Дарио Амодей предупреждает о «гонке» за пониманием AI по мере его усиления
Сразу после завершения AI Action Summit в Париже соучредитель и генеральный директор Anthropic Дарио Амодей назвал это мероприятие «упущенной возможностью». Он добавил, что «необходимо уделять больше внимания и действовать быстрее по нескольким направлениям, учитывая темпы развития технологий», в заявлении, опубликованном во вторник.
Проблемы языковых моделей при анализе длинных текстов: выводы исследования
В результате исследования, проведённого учёными из Мюнхенского университета Людвига-Максимилиана, Мюнхенского центра машинного обучения и Adobe Research, было установлено, что современные языковые модели искусственного интеллекта имеют ограничения при обработке и анализе больших объёмов текстовой информации.
Топ-10 бесплатных нейросетей для генерации изображений: лучшие AI генераторы 2025 года
Изображение, сгенерированное с помощью Grok

