машинное+обучение.

Anthropic объяснила падение качества в Claude Code

Компания разобрала, почему в марте–апреле пользователи заметили деградацию Claude Code, а также Agent SDK и Cowork. Причина оказалась не в одной ошибке, а в наложении сразу трёх изменений. Что пошло не так?

продолжить чтение

Оставлено в

Как я создал альтернативу трансформерам

В этой статье я хочу остановиться на разборе предложенной мной архитектуры декодера и тех вариантов, с которыми я сравниваю её в исследовании, но сделать это проще и интуитивнее, чем в самой работе. На мой взгляд, существующие объяснения архитектур декодеров часто подаются разрозненно. Каждый подход описывают отдельно, без общей опоры. А ведь всё можно свести к одному фундаменту, и тогда становятся гораздо заметнее как сильные стороны каждого решения, так и их ограничения. Для начала приведу все необходимые ссылки.Само исследование: https://arxiv.org/abs/2604.18580Код:

продолжить чтение

Оставлено в

DeepSeek в 10 раз снизила цену на кэш

DeepSeek резко удешевила один из самых чувствительных элементов API - кэш. Теперь повторные запросы (cache hits) стоят всего 10% от прежней цены по всей линейке моделей. Что это значит на практике?Любой повторно используемый контекст: 1) Системные промпты 2) Инструкции агентов

продолжить чтение

Оставлено в

ИИ в ловушке: что произойдет, когда в интернете не останется текстов, написанных людьми?

продолжить чтение

Оставлено в

Anthropic проверил, как AI-агенты торгуются между собой

Компания Anthropic провела необычный эксперимент Project Deal, чтобы проверить, как ИИ-агенты ведут реальные переговоры друг с другом.

продолжить чтение

Оставлено в

Правильная агентская архитектура в 2026 г. Часть 1. Долговременное состояние (durable state): ход, шаг, событие

Практическая статья по устройству production-ready агента

продолжить чтение

Оставлено в

Альтман в панике: зачем ChatGPT превратили в рекламную помойку и почему это не спасёт OpenAI

продолжить чтение

Оставлено в

Слишком опасен, чтобы показать? Что скрывается за запуском Claude Mythos

Опасный ИИ? Маркетинговый трюк? Или своеобразная «крыша»?Чуть больше недели назад Anthropic представила миру свою модель Claude Mythos

продолжить чтение

Оставлено в

Контент-модерация в ретроспективе: почему тексты 100-летней давности не проходят фильтры 2026 года

Дисклеймер: Статья не даёт правовой оценки историческим деятелям и событиям. Цель — показать, как изменились юридические и платформенные нормы в отношении публичных призывов. Все цитаты из архивных источников приведены исключительно в исследовательских целях.Дано: задача для ML-инженераПредставьте, вы обучаете большую языковую модель. В корпус данных попадает Полное собрание сочинений крупного политического автора начала XX века.Что будет, если модель начнёт генерировать текст в его стиле без пост-фильтров?

продолжить чтение

Оставлено в

Perplexity раскрыла, как обучает поискового AI-агента на Qwen

Команда Perplexity AI опубликовала техотчёт о создании своего поискового агента на базе моделей Qwen3.5.Результаты выглядят неожиданно сильными: модель Qwen3.5-397B после SFT и RL достигает 73,9% точности на FRAMES при стоимости около

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

машинное+обучение.

Anthropic объяснила падение качества в Claude Code

Как я создал альтернативу трансформерам

DeepSeek в 10 раз снизила цену на кэш

ИИ в ловушке: что произойдет, когда в интернете не останется текстов, написанных людьми?

Anthropic проверил, как AI-агенты торгуются между собой

Правильная агентская архитектура в 2026 г. Часть 1. Долговременное состояние (durable state): ход, шаг, событие

Альтман в панике: зачем ChatGPT превратили в рекламную помойку и почему это не спасёт OpenAI

Слишком опасен, чтобы показать? Что скрывается за запуском Claude Mythos

Контент-модерация в ретроспективе: почему тексты 100-летней давности не проходят фильтры 2026 года

Perplexity раскрыла, как обучает поискового AI-агента на Qwen

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

машинное+обучение.