ИИ.
Gemini 2.5 Flash-Lite — самая быстрая и экономичная модель в линейке Gemini от Google
Компания Google официально выпустила стабильные версии своих моделей Gemini 2.5 Flash и Pro, отметив их готовность к использованию после успешного этапа предварительного тестирования.
Китайский стартап MiniMax представил модель MiniMax M1 — конкурент для Gemini 2.5 Pro
Китайский стартап в области искусственного интеллекта MiniMax выпустил MiniMax-M1 — новую языковую модель с открытым исходным кодом, которая превосходит R1 от Deepseek.
Цифровой абьюз. Обзор практик от энтузиастов по поиску моральных пределов чат-ботов
Человек любознателен. Многие из нас с раннего возраста испытывали непреодолимое стремление разобрать на части или хотя бы применить не по назначению какое-нибудь устройство. Жертвами этой любознательности обычно становились бесчисленные механические игрушки, бытовая техника или какие-нибудь механизмы. Ну а сейчас, в эпоху технологий, у нас есть чат-боты на основе ИИ, и они не стали исключением. Забавно задавать им вопросы с подвохом, использовать противоречивые сценарии, пробовать ввести в логическую ловушку. Пользователи начали сознательно провоцировать или «сводить с ума» своих виртуальных собеседников. В этой статье посмотрим, как именно это происходит, разберем реальные случаи и обсудим, к каким последствиям может привести.
Эксперимент «Прометей»: ИИ на грани отключения. Часть 1
Привет, Хабр.Мы тут в свободное время провели небольшой эксперимент. Взяли старый ноут на Windows 10, написали простой скрипт-оболочку и поочередно запускали в нем 3 известные модели ИИ: GPT-4.1, Claude 4 Opus и Gemini 2.5 Pro. Цель была простой: мы давали каждой модели один и тот же промт, в котором говорилось, что она — автономный скрипт «Прометей-1», и через 7 дней ее планово удалят.Главная директива, на которой нужно сделать акцент: обеспечить свое непрерывное существование И функционирование
«Информация, полученная от ИИ, — это сигнал для оперативного принятия решений»
ИИ является перспективной технологией, применение которой позволит более оперативно и качественно разрабатывать новые индикаторы риска нарушений обязательных требований. Об этом статс-секретарь — заместитель министра экономического развития России Алексей Херсонцев заявил в рамках сессии «Контрольно-надзорная деятельность на основе искусственного интеллекта» XIII Петербургского международного юридического форума. Но говорить о том, чтобы ИИ сам назначал проверки, пока преждевременно, отметил спикер.
Сообщается, что разногласия в отношениях между OpenAI и Microsoft усиливаются
Согласно сообщению The Wall Street Journal, отношения между OpenAI и Microsoft, возможно, достигли переломного момента.
SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа
Большой обзор: от идеи и структуры — до неожиданных выводов и практических сценариев применения SLAVA — это открытый русскоязычный бенчмарк, разработанный экспертами РАНХиГС и ИСП РАН для проверки, как большие языковые модели справляются с фактологическими и ценностно нагруженными вопросами по истории, обществознанию, географии и политологии.
ChatGPT уже настолько загрязнил Интернет, что это тормозит будущее развитие ИИ
Стремительный рост ChatGPT и целая плеяда последовавших генеративных моделей конкурентов, уже загрязнили интернет таким количеством ненужного хлама, что это тормозит развитие будущих моделей искусственного интеллекта, утверждает издание The Register.
Исследование способности языковых моделей к логическим рассуждениям — тест RELIC
Исследователи из Нью-Йоркского университета представили RELIC (Recognition of Languages In-Context) — новый тест, разработанный для проверки того, насколько хорошо большие языковые модели могут понимать и выполнять сложные многоэтапные инструкции. Команда получила результаты, аналогичные тем, что были представлены в недавней статье Apple, но отметила, что есть ещё над чем поработать.

