Завод ИИ-агентов в одном терминале через оркестрацию
С детства я смотрел фильмы, где люди разговаривают с компьютерами, и каждый раз думал — ну когда уже. Когда можно будет сказать машине что делать, а она сделает.
Я залез в исходники Claude Code. Фичи, которых нет в документации
Комментарий от эксперта Александра Шустанова
Нейросеть Claude Opus 4.8: Первый ИИ без галлюцинаций. Как использовать Claude из РФ
Подробный обзор Claude Opus 4.8. Эта нейросеть от Anthropic исправляет самую главную беду современных LLM: галлюцинации. Абсолютная честность, мощнейшие автономные ИИ-агенты для работы с кодом и контекстное окно 1 млн токенов. Разбираем лимиты, тесты и способы доступа из России.
Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь
Вторник, час ночи. Сижу пишу промпт чтобы вытащить из 40 PDF-ок с актами нужные поля в JSON. Задача рутинная, у меня под неё лежит проверенный шаблон. Развёрнутый CoT, три few-shot примера, роль «опытный финансовый аналитик с 15 лет опыта». Раньше работал как часы.Закидываю в GPT-5.5 с высоким мышлением. Получаю мусор. Половина полей не та, формат сломан, в выводе развёрнутое рассуждение которое я не просил.Думаю ладно, заглючило. Прогоняю ещё раз. То же самое.Удаляю промпт целиком. Пишу заново, тупо: «вытащи из приложенного текста поля X, Y, Z в виде JSON, никаких пояснений». Десять строк. Запускаю.Работает.
Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro
Alibaba выпустили Qwen3.7-Max: флагманскую закрытую модель серии Qwen3.
Промпт-инжиниринг 2026: что устарело с приходом reasoning-моделей
Полгода назад взял старый промпт. Тот самый, отлаженный за два года — с развёрнутым chain-of-thought, тремя few-shot примерами, ролью «опытного инженера с 15 лет опыта», пошаговой схемой рассуждения. Запустил на reasoning-модели в режиме высокого мышления.Результат — хуже, чем у минимального промпта.Минимальный промпт был тупой: вход, ожидаемый формат вывода, одно ограничение. Без героики. И он выиграл.Тогда я понял: половина моего арсенала, накопленного на GPT-4 и Claude 3.5, против reasoning-моделей работает плохо. Что-то откровенно вредит. Что-то стало лишним. А что-то — что я делал по остаточному принципу — наоборот, теперь важнее всего.
Как мы перешли на Opus и стали платить меньше
На прошлой неделе мы писали о том, как скармливали терабайты CI-логов LLM. Большинство вопросов на Hacker News касались не самих логов — спрашивали про агента: какие модели, как они взаимодействуют и во сколько всё это обходится.Сейчас мы работаем на Opus 4.6 и платим меньше, чем когда всё крутилось на Sonnet 4.0.Причина в основном в том, чего Opus не делает: 80% сбоев до него не доходят, а когда доходят — он не читает ни одной строки лога.Архитектура выглядит так:
claude –model claude-opus-4-6
Недавно вышла Claude Opus 4.7 флагманская модель от Антропик. В выпущенных пресс-релизах и графиках маркетологи обещали пользователям, что модель станет ещё умнее, ещё точнее и так далее. На деле же получился феерический провал.На хабре эту тему уже поднимали
Claude Opus 4.7: Что нового? Как использовать нейросеть в России
Детальный обзор новой нейросети Claude Opus 4.7 от Anthropic. Разбираем реальные тесты программистов, официальные бенчмарки, скрытые лимиты на токены и рабочие способы оплаты подписки из РФ без зарубежных карт.

