Anthropic изучила эмоции ИИ и их влияние на поведение моделей
Работа показывает, что имитация человеческих эмоций помогает снижать склонность к обману и манипуляциям, но создаёт риски чрезмерной антропоморфизации.
В WSJ назвали ахиллесову пяту OpenAI и Anthropic
The Wall Street Journal получил доступ
Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже
Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента (API/Поиск) -> Чтение -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, галлюцинируют и застревают в бесконечных циклах.Индустрия пытается лечить это экстенсивно: наращивает контекстное окно до миллионов токенов или пишет в системном промпте заклинания вроде «подумай шаг за шагом и будь максимально объективен».
После краха Sora Альтман переключается на ещё более разрушительную авантюру, чтобы похоронить OpenAI окончательно
Сэм Альтман не понимает технологии, не хочет понимать и считает, что ему это не нужно.
WACV 2026 в Тусоне: конференция, пустыня и немного экзистенции
Привет, Хабр! Я — Максим Куркин из лаборатории FusionBrain AIRI. Когда мне сказали «поедешь на WACV», первая мысль была — отлично, конференция. Вторая мысль — Тусон, Аризона. Пустыня Сонора. Кактусы‑сагуаро высотой с двухэтажный дом. +25°C в начале марта, когда в Москве ещё лежит снег. Круто!В итоге я провёл в командировке девять дней — с 5 по 13 марта. Два дня дороги в каждую сторону, пять дней конференции, немного пустыни вокруг. Поездка получилась насыщенной: и по науке, и по ощущениям, и очень хочется поделиться увиденным!
Evals: мегастатья для фаундера, чей AI-агент работает как попало
Посвящается всем, кто менял промпт в 3 часа ночи и шептал «ну давай, гад, заработай».Привет, Хабр. Через несколько дней будет 16 лет, как я здесь зарегистрирован. Это моя первая статья. Кек.Меня зовут Ярослав, днём я занимаюсь продуктом, а по вечерам пилю десктопный AI-ассистент для встреч. Записывает, транскрибирует, суммаризирует и сам раскладывает решения, задачи и факты по базе знаний. Документация, которая пишет себя сама. Под капотом — Tauri (Rust + React), а за agent loop отвечает Mastra — TypeScript-фреймворк для AI-агентов с встроенными evals, tool calling и structured output.
MCP не умер: почему ИИ-агенты тонут в контексте
Год назад Model Context Protocol (MCP) казался решением всех проблем разом. Один протокол, чтобы связать ИИ-агентов с GitHub, Slack, Jira и внутренними базами данных. Никаких кастомных плагинов, только чистая стандартизация. И индустрия в это поверила: к
Официальный трейлер DLSS 5 от Nvidia удалили с YouTube из-за нарушений авторских прав
Видеохостинг YouTube удалил официальный трейлер графической технологии DLSS 5 от Nvidia из-за претензии по поводу авторских прав со стороны итальянского телеканала La7. Инцидент указывает на проблемы с системой защиты авторских прав видеоплощадки, принадлежащей Google.
На что способна новая модель NVIDIA — Nemotron 3 Super 120B. Бенчмарки, тесты и интеграция в Luxms BI
120 миллиардов параметров, контекст 256K токенов, агентное поведение — и всё это на одной видеокарте. Мы подключили Nemotron 3 Super к Luxms BI и неделю тестировали на реальных аналитических задачах. В этой статье — что получилось, где модель справляется, а где пока нет.Одна видеокарта – это принципиально другая экономика владения. Кластер из 8 карт – это капитальные затраты, инженерная команда для обслуживания, электричество, охлаждение и площадь в серверной. Одна RTX PRO 6000 – это единица оборудования, которая встаёт в стандартную рабочую станцию. Разница в совокупной стоимости владения (TCO) – на порядок.

