машинное+обучение. - страница 4

Anthropic объяснила падение качества в Claude Code

Компания разобрала, почему в марте–апреле пользователи заметили деградацию Claude Code, а также Agent SDK и Cowork. Причина оказалась не в одной ошибке, а в наложении сразу трёх изменений. Что пошло не так?

продолжить чтение

Как я создал альтернативу трансформерам

В этой статье я хочу остановиться на разборе предложенной мной архитектуры декодера и тех вариантов, с которыми я сравниваю её в исследовании, но сделать это проще и интуитивнее, чем в самой работе. На мой взгляд, существующие объяснения архитектур декодеров часто подаются разрозненно. Каждый подход описывают отдельно, без общей опоры. А ведь всё можно свести к одному фундаменту, и тогда становятся гораздо заметнее как сильные стороны каждого решения, так и их ограничения. Для начала приведу все необходимые ссылки.Само исследование: https://arxiv.org/abs/2604.18580Код:

продолжить чтение

DeepSeek в 10 раз снизила цену на кэш

DeepSeek резко удешевила один из самых чувствительных элементов API - кэш. Теперь повторные запросы (cache hits) стоят всего 10% от прежней цены по всей линейке моделей. Что это значит на практике?Любой повторно используемый контекст: 1) Системные промпты 2) Инструкции агентов

продолжить чтение

ИИ в ловушке: что произойдет, когда в интернете не останется текстов, написанных людьми?

продолжить чтение

Anthropic проверил, как AI-агенты торгуются между собой

Компания Anthropic провела необычный эксперимент Project Deal, чтобы проверить, как ИИ-агенты ведут реальные переговоры друг с другом.

продолжить чтение

Правильная агентская архитектура в 2026 г. Часть 1. Долговременное состояние (durable state): ход, шаг, событие

Практическая статья по устройству production-ready агента

продолжить чтение

Альтман в панике: зачем ChatGPT превратили в рекламную помойку и почему это не спасёт OpenAI

продолжить чтение

Слишком опасен, чтобы показать? Что скрывается за запуском Claude Mythos

Опасный ИИ? Маркетинговый трюк? Или своеобразная «крыша»?Чуть больше недели назад Anthropic представила миру свою модель Claude Mythos

продолжить чтение

Контент-модерация в ретроспективе: почему тексты 100-летней давности не проходят фильтры 2026 года

Дисклеймер: Статья не даёт правовой оценки историческим деятелям и событиям. Цель — показать, как изменились юридические и платформенные нормы в отношении публичных призывов. Все цитаты из архивных источников приведены исключительно в исследовательских целях.Дано: задача для ML-инженераПредставьте, вы обучаете большую языковую модель. В корпус данных попадает Полное собрание сочинений крупного политического автора начала XX века.Что будет, если модель начнёт генерировать текст в его стиле без пост-фильтров?

продолжить чтение

Perplexity раскрыла, как обучает поискового AI-агента на Qwen

Команда Perplexity AI опубликовала техотчёт о создании своего поискового агента на базе моделей Qwen3.5.Результаты выглядят неожиданно сильными: модель Qwen3.5-397B после SFT и RL достигает 73,9% точности на FRAMES при стоимости около

продолжить чтение

1...234567...2030...108