Anthropic объяснила падение качества в Claude Code
Компания разобрала, почему в марте–апреле пользователи заметили деградацию Claude Code, а также Agent SDK и Cowork. Причина оказалась не в одной ошибке, а в наложении сразу трёх изменений. Что пошло не так?
Как я создал альтернативу трансформерам
В этой статье я хочу остановиться на разборе предложенной мной архитектуры декодера и тех вариантов, с которыми я сравниваю её в исследовании, но сделать это проще и интуитивнее, чем в самой работе. На мой взгляд, существующие объяснения архитектур декодеров часто подаются разрозненно. Каждый подход описывают отдельно, без общей опоры. А ведь всё можно свести к одному фундаменту, и тогда становятся гораздо заметнее как сильные стороны каждого решения, так и их ограничения. Для начала приведу все необходимые ссылки.Само исследование: https://arxiv.org/abs/2604.18580Код:
DeepSeek в 10 раз снизила цену на кэш
DeepSeek резко удешевила один из самых чувствительных элементов API - кэш. Теперь повторные запросы (cache hits) стоят всего 10% от прежней цены по всей линейке моделей. Что это значит на практике?Любой повторно используемый контекст: 1) Системные промпты 2) Инструкции агентов
Anthropic проверил, как AI-агенты торгуются между собой
Компания Anthropic провела необычный эксперимент Project Deal, чтобы проверить, как ИИ-агенты ведут реальные переговоры друг с другом.
Правильная агентская архитектура в 2026 г. Часть 1. Долговременное состояние (durable state): ход, шаг, событие
Практическая статья по устройству production-ready агента
Слишком опасен, чтобы показать? Что скрывается за запуском Claude Mythos
Опасный ИИ? Маркетинговый трюк? Или своеобразная «крыша»?Чуть больше недели назад Anthropic представила миру свою модель Claude Mythos
Контент-модерация в ретроспективе: почему тексты 100-летней давности не проходят фильтры 2026 года
Дисклеймер: Статья не даёт правовой оценки историческим деятелям и событиям. Цель — показать, как изменились юридические и платформенные нормы в отношении публичных призывов. Все цитаты из архивных источников приведены исключительно в исследовательских целях.Дано: задача для ML-инженераПредставьте, вы обучаете большую языковую модель. В корпус данных попадает Полное собрание сочинений крупного политического автора начала XX века.Что будет, если модель начнёт генерировать текст в его стиле без пост-фильтров?
Perplexity раскрыла, как обучает поискового AI-агента на Qwen
Команда Perplexity AI опубликовала техотчёт о создании своего поискового агента на базе моделей Qwen3.5.Результаты выглядят неожиданно сильными: модель Qwen3.5-397B после SFT и RL достигает 73,9% точности на FRAMES при стоимости около

