Проверяем качество ИИ без сложной математики
Представьте, что ваша команда только что получила доступ к новейшей AI-модели или внедрила умный чат-бот. Коллеги в восторге от точности, скорости и функциональности инструмента. Но как понять, насколько он действительно хорош?Стоит попытаться разобраться, и вы утонете в дебрях специальных терминов: F1-score, perplexity, BLEU, энтропия. Кажется, оценить качество искусственного интеллекта могут только учёные с дипломом в области data science. Но так ли это?
У моделей ИИ может развиться «инстинкт самосохранения», считают исследователи
Компания Palisade Research, занимающаяся исследованиями в области безопасности ИИ, заявила, что у моделей ИИ может развиться собственный «инстинкт самосохранения». Недавно исследователи выпустили статью, в которой говорилось, что некоторые продвинутые модели искусственного интеллекта не поддаются отключению, а иногда даже саботируют механизмы отключения. Сейчас компания опубликовала обновление, пишет The Guardian.
Baidu до конца месяца выпустит новую ризонинг-модель
The Wall Street Journal сообщил сегодня, что китайский техгигант планирует представить новую модель, ориентированную на сложные логические рассуждения, уже до конца этого месяца. Разработанная модель может успешно конкурировать с такими компаниями, как DeepSeek и OpenAI, благодаря своей способности решать более сложные задачи.
Grok 5 выйдет до конца этого года
Илон Маск заявил, что его компания xAI запустит Grok 5 «до конца этого года». Это произошло после того, как OpenAI представила GPT-5.
OpenAI выпустила GPT-5
OpenAI выпустила GPT-5 — новейшую систему искусственного интеллекта, основанную на успехах моделей o1 и o3. В GPT-5 объединены все предыдущие разработки в единую адаптивную архитектуру.
Horizon Alpha: загадочная модель, которую уже считают «младшим GPT-5»
На OpenRouter появилась загадочная нейросеть под названием Horizon Alpha. В сообществе ИИ она сразу вызвала бурю обсуждений: кто-то считает её секретной разработкой OpenAI, другие — всего лишь экспериментом. А пока одни гадают, что за модель перед ними, другие уже используют её, чтобы писать код, сочинять рассказы и запускать свои приложения.
Появилась новая опенсорсная модель FLUX.1-Krea-dev
FLUX.1-Krea-dev — это модель с 12 миллиардами параметров, основанная на архитектуре FLUX.1 . Демонстрирует хорошее понимание промптов, высокое качество и разнообразие генерируемых изображений. Цель разработчиков была создавать изображения, которые не будут перенасыщенными и неестественными в плане текстуры (это часто встречается у других моделей).
Google DeepMind представила Gemini 2.5 Deep Think — новую мультиагентную модель ИИ
Google DeepMind представила Gemini 2.5 Deep Think, которая, по словам компании, является самой продвинутой моделью искусственного интеллекта, способной отвечать на вопросы, исследуя и рассматривая несколько идей одновременно, а затем используя полученные результаты для выбора наилучшего ответа.
DeepMind показала модель для создания цифрового двойника Земли
Компания Google DeepMind представила революционную модель искусственного интеллекта под названием AlphaEarth Foundations, предназначенную для обработки огромных массивов данных наблюдений за Землёй. Этот инновационный инструмент призван улучшить понимание и мониторинг изменений на планете и работает по принципу «виртуального спутника».
Skild Brain: единая модель для управления любыми роботами
Робототехнический стартап Skild AI, поддерживаемый Amazon и SoftBank, представил фундаментальную ИИ-модель под названием Skild Brain. Эта разработка призвана решить одну из самых сложных проблем в индустрии: отсутствие универсальных данных для обучения роботов сложным физическим действиям.

