Amazon запускает Nova Premier — свою самую мощную на сегодняшний день AI-модель
В среду Amazon представила Nova Premier — по словам компании, самую мощную модель искусственного интеллекта в линейке Nova. Nova Premier, который может обрабатывать текст, изображения и видео (но не аудио), доступен в Amazon Bedrock, платформе разработки моделей AI компании. Amazon утверждает, что Premier отлично справляется с «сложными задачами, которые требуют глубокого понимания контекста, многошагового планирования и точного выполнения с использованием множества инструментов и источников данных.
LM Arena обвиняют в предоставлении «избранным» AI-компаниям несправедливых преимуществ при тестировании моделей
В новом документе лаборатории искусственного интеллекта Cohere, Стэнфорда, Массачусетского технологического института и Ai2 обвиняется LM Arena, организация, стоящая за популярным краудсорсинговым бенчмарком в области искусственного интеллекта Chatbot Arena, в помощи избранной группе компаний, занимающихся разработкой искусственного интеллекта, в достижении более высоких результатов в рейтингах за счет конкурентов.
Gemini от Google получает обновленные инструменты создания изображений
Приложение чат-бота Gemini от Google теперь позволяет изменять как изображения, созданные искусственным интеллектом, так и изображения, загруженные с телефона или компьютера, сообщила компания Google в своем блоге в среду. Функция редактирования изображений в Gemini постепенно начнет внедряться сегодня, а в ближайшие недели станет доступна большему количеству пользователей на более чем 45 языках и в большинстве стран.
Бенчмарк Vals.ai: даже продвинутые AI-агенты ненадежны в финансовом анализе
Несмотря на доступ к исследовательским инструментам и высокие затраты на обработку, ведущие языковые модели не справляются со сложными финансовыми задачами. Новый бенчмарк от Vals.ai показывает, что даже самые продвинутые автономные агенты AI остаются ненадежными для финансового анализа. Самая производительная модель, o3 от OpenAI, достигла точности всего 48,3% — при средней стоимости запроса $3,69.
Gruve.ai привлек $20 млн для революции в IT-консалтинге с помощью искусственного интеллекта
Компании всех размеров осознают революционные возможности AI. Несмотря на ажиотаж вокруг новой технологии, большинство их пилотных проектов не доходят до производства. Стартап Gruve.ai, основанный командой Rahi Systems, стремится помочь предприятиям вывести решения на основе AI из стадии тестирования и внедрить их в реальный мир, используя AI для предоставления своих услуг.
JetBrains выпускает Mellum, открытую модель кодирования AI
Компания JetBrains, стоящая за рядом популярных инструментов разработки приложений, выпустила свою первую открытую модель AI для программирования. В среду JetBrains сделала Mellum, модель генерации кода, которую компания выпустила для своих различных пакетов разработки ПО в прошлом году, общедоступной на платформе разработки AI Hugging Face. Mellum, обученный на более чем 4 триллионах токенов, весит 4 миллиарда параметров и разработан специально для автодополнения кода (т. е. завершения фрагментов кода на основе окружающего контекста).
OpenAI объясняет, почему ChatGPT стал слишком льстивым
Компания OpenAI опубликовала отчет о недавних проблемах с подхалимством в стандартной модели искусственного интеллекта, лежащей в основе ChatGPT, GPT-4o, — проблемах, которые заставили компанию откатить обновление модели, выпущенное на прошлой неделе.
Duolingo запускает 148 курсов, созданных с помощью AI, после того как поделилась планами по замене подрядчиков на AI
Duolingo представляет 148 новых языковых курсов, созданных с помощью генеративного AI, объявила компания в среду. Запуск состоялся на фоне негативной реакции Duolingo на этой неделе после того, как она сообщила, что собирается заменить подрядчиков на AI и стать «AI-компанией №1».

