Новый подход к обучению ИИ-агентов: совершенствование через анализ успешных примеров
Новое исследование Стэнфордского университета показало, что агенты с искусственным интеллектом могут гораздо лучше справляться со сложными задачами, просто учась на собственном успешном опыте.
Анализ показывает, что совершенствование «рассуждающих» моделей ИИ может вскоре замедлиться
Анализ, проведённый Epoch AI, некоммерческим исследовательским институтом в области ИИ, показывает, что индустрия ИИ, возможно, не сможет добиться значительного повышения производительности моделей ИИ, основанных на рассуждениях, в течение длительного времени. Согласно результатам исследования, уже в течение года прогресс в области моделей, основанных на рассуждениях, может замедлиться.
Ситуативные галлюцинации или системная проблема всех LLM?
Одна из ключевых тем безопасности в области ИИ снова оказалась в центре внимания после выявления двух системных методов обхода защитных механизмов в популярных генеративных сервисах.
Google обновляет Gemini 2.5 Pro для программирования и разработки приложений
Последняя предварительная версия языковой модели Google Gemini 2.5 Pro содержит значительные улучшения для разработки внешнего интерфейса и сложных задач программирования.
Anthropic расширяет возможности Claude: новые интеграции и исследовательские инструменты
Anthropic выпускает новые функции для своего ИИ-помощника Claude, в том числе расширенные исследовательские возможности и поддержку внешней интеграции с корпоративными инструментами.
Отношение жителей США к искусственному интеллекту: данные опроса EY
Глобальный опрос, проведённый компанией EY, показал, что, хотя большинство жителей Соединённых Штатов считают искусственный интеллект полезным, очень немногие тратят время на проверку или редактирование результатов его работы.
Преобразование текста с помощью анализа регистров: улучшение стилистической трансформации в ИИ
Исследователи из Мэрилендского университета разработали новый подход, который позволяет большим языковым моделям переписывать текст в определённом стиле, сохраняя при этом основной смысл. Их подход основан на «анализе регистров» — устоявшейся лингвистической концепции для анализа стилей письма — и, по-видимому, превосходит существующие методы, основанные на подсказках.
Moonshot AI представляет Kimi-VL: мощную модель ИИ для обработки текста, изображений и видео
Новая модель ИИ с открытым исходным кодом от китайского стартапа Moonshot AI обрабатывает изображения, текст и видео с удивительной эффективностью. Модель Kimi-VL отличается способностью обрабатывать длинные документы, сложные рассуждения и понимать пользовательский интерфейс.
Языковые модели ИИ тестируют на способность рассуждать в игре «Phoenix Wright: Ace Attorney»
Исследователи подвергли ведущие модели ИИ новому виду тестирования, которое показывает, насколько хорошо они могут рассуждать, чтобы одержать победу в суде. Результаты выявили некоторые явные различия как в производительности, так и в стоимости.

