искусственный интеллект. - страница 27

CURE-Bench: готовы ли «рассуждающие» модели стать терапевтическими ассистентами?

В 2025 году на NeurIPS — главной мировой конференции по ИИ — прошло соревнование CURE‑Bench, организованное исследователями из Гарварда и Массачусетского Технологического Института. Целью соревнования являлась масштабная проверка способностей агентов и рассуждающих моделей в области терапевтических рекомендаций. CURE‑Bench пытается ответить на вопрос, возможно ли уже сегодня построить качественного медицинского ассистента?Команда AIRI под названием VIM (Владимир Мануйлов (iMak AI Lab) и Илья Макаров (iMak AI Lab, AIRI)) заняла призовое место в треке Internal Model Reasoning. Подробнее о их решении — в данной статье.

продолжить чтение

Код пишет нейросеть. Что остается разработчику?

Привет, Хабр!В последнее время я часто слышу апокалиптические прогнозы: «Скоро программисты будут не нужны, Claude напишет любой сервис за секунду». Я больше 10 лет руковожу студией разработки, и мой опыт применения нейросетей на практике в наших проектах сегодня говорит об обратном: программисты никуда не исчезнут, но их роль меняется прямо сейчас.Я различаю два принципиально разных подхода к использованию LLM в разработке:Первый — условный «вайб-кодинг»: вы кидаете в чат задачу и ждёте, что нейросеть как-то сама придумает архитектуру, сценарии и интерфейсы.

продолжить чтение

Генеративный ИИ, информационная безопасность и управление сервисом на 100%: тренды ITSM – ESM-2026

продолжить чтение

Команда In2AI — победитель MindGames Arena на NeurIPS 2025

Соревнование MindGames Arena проводится как часть одной из ключевых конференций в области ИИ NeurIPS 2025 и проверяет, могут ли агенты демонстрировать социально‑стратегические способности — моделировать убеждения других, обнаруживать обман, координироваться и планировать в многоходовых взаимодействиях — все это, общаясь на естественном языке. Команда In2AI Института AIRI, стартапа Coframe и Университета Иннополис заняла первое место в треке Generalization в двух категориях:Efficient: модели с открытым исходным кодом до 8 миллиардов параметров.

продолжить чтение

Подбор и фильтрация резюме на HH с помощью ИИ

Часть 4. Как я научился делать грубую фильтрацию разюме с помощью API HH.ru и Gemini Привет! На связи снова Евгений. Это четвертая часть цикла о моем самописном инструменте (написанным человеком, который далек от программирования), который вырос из простого поисковика по Excel-файлам в полноценную систему управления бизнес-процессами. Чтобы вы понимали контекст: Сначала я сделал поиск по внутренней базе товаров, чтобы менеджеры не путались в ассортименте. Потом добавил

продолжить чтение

GPT-5 vs Claude Opus 4.5 vs Gemini 3 Pro: битва reasoning-моделей. Кто победил в 2025?

Доброго времени суток, «Хабр»!Год близится к завершению, и за это время мы получили в распоряжение множество вполне достойных моделей. Взять хотя бы тот факт, что в ближайшее время ожидается выход новой версии GPT. К тому же, после моей предыдущей статьи о Claude Opus 4.5 родилась идея: почему бы не устроить состязание среди лидирующих сейчас текстовых моделей?Сегодня в битве участвуют: GPT-5, Claude Opus 4.5 и Gemini 3 Pro. Делайте ставки, а я приступаю к сравнению.

продолжить чтение

Яндекс представил бесплатного ИИ-ассистента для администраторов Telegram-каналов

Яндекс запустил бота на базе искусственного интеллекта, который предназначен для авторов и владельцев Telegram-каналов. Он помогает готовить публикации: придумывать и править тексты, создавать изображения и другие элементы для постов. Помимо этого, ассистент упрощает подключение монетизации через Рекламную сеть Яндекса (РСЯ) — прямо из интерфейса мессенджера. Использование сервиса бесплатно.ИИ-помощник работает на основе нейротехнологий Yandex Neuro Ads. Чтобы начать работу, нужно найти бота в Telegram и авторизоваться через Яндекс ID: @yandex_ads_helper_bot.

продолжить чтение

Экологи призвали остановить строительство новых ЦОД

В связи с резким ростом спроса на электроэнергию экологические организации призвали ввести мораторий на утверждение и строительство новых центров обработки данных. Более 230 организаций, включая Food & Water Watch, Friends of the Earth и Greenpeace, подписали открытое письмо, чтобы члены Конгресса США поддержали их требование. 

продолжить чтение

Claude Code появится в Slack

Anthropic запустит программного агента Claude Code в Slack, чтобы разработчики могли делегировать задачи по написанию кода непосредственно из чатов. Бета-версия функции основана на существующей интеграции Anthropic со Slack.

продолжить чтение

CognitiveDrone: система на VLA с когнитивными способностями для управления летающим роботом в трехмерном пространстве

VLA-модели объединяют визуальное восприятие, понимание естественного языка и выполнение физических действий. Обычно они применяются для манипуляций — например, чтобы робот взял предмет или повернул рычаг. Но управление роботом, особенно летающим, это не всегда изменение состояния — иногда это перемещение его в трехмерном пространстве. Добавление VLA-моделей в этот сегмент робототехники может дать устройствам способность мыслить и принимать решения в условиях слабой связи или полной автономности. Такой подход особенно важен для задач, где нет права на ошибку, например в спасательных миссиях. 

продолжить чтение

Rambler's Top100