GPT-5.5.

Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь

Вторник, час ночи. Сижу пишу промпт чтобы вытащить из 40 PDF-ок с актами нужные поля в JSON. Задача рутинная, у меня под неё лежит проверенный шаблон. Развёрнутый CoT, три few-shot примера, роль «опытный финансовый аналитик с 15 лет опыта». Раньше работал как часы.Закидываю в GPT-5.5 с высоким мышлением. Получаю мусор. Половина полей не та, формат сломан, в выводе развёрнутое рассуждение которое я не просил.Думаю ладно, заглючило. Прогоняю ещё раз. То же самое.Удаляю промпт целиком. Пишу заново, тупо: «вытащи из приложенного текста поля X, Y, Z в виде JSON, никаких пояснений». Десять строк. Запускаю.Работает.

продолжить чтение

Codex 5.3 vs Claude Opus 4.6 на реальном Java‑монолите

Дисклеймер

продолжить чтение

Промпт-инжиниринг 2026: что устарело с приходом reasoning-моделей

Полгода назад взял старый промпт. Тот самый, отлаженный за два года — с развёрнутым chain-of-thought, тремя few-shot примерами, ролью «опытного инженера с 15 лет опыта», пошаговой схемой рассуждения. Запустил на reasoning-модели в режиме высокого мышления.Результат — хуже, чем у минимального промпта.Минимальный промпт был тупой: вход, ожидаемый формат вывода, одно ограничение. Без героики. И он выиграл.Тогда я понял: половина моего арсенала, накопленного на GPT-4 и Claude 3.5, против reasoning-моделей работает плохо. Что-то откровенно вредит. Что-то стало лишним. А что-то — что я делал по остаточному принципу — наоборот, теперь важнее всего.

продолжить чтение

Два окна в работе с AI-агентами: архитектор и разработчик. Самый недооценённый паттерн

Самый рабочий паттерн в работе с AI-агентами на код — два окна. Одно с архитектором/проверяющим, второе с разработчиком. Можно собрать на одной модели: Claude в обоих окнах с разными системными промптами и сессиями. Можно смешать — у меня сейчас Claude Code в окне разработчика и GPT-5.5 в режиме высокого мышления в окне архитектора. Модель важна меньше, чем разделение ролей.Почему один агент почти всегда хуже двух, что делает каждое из окон, и где этот паттерн избыточен.Почему один агент — это плохо

продолжить чтение

Дизайн за 5 минут. Дайджест апреля 2026

Привет, Хабр! На связи Андрей, продуктовый дизайнер Garage Eight

продолжить чтение

«ИИ развивается «удивительно медленно»» — главный ученый OpenAI пообещал чрезвычайное ускорение

продолжить чтение

GPT-5.5 против DeepSeek-V4: почему OpenAI удваивает цены, пока Китай демпингует

GPT-2 мой новый фаворит для обложекЗа последние 48 часов индустрия ИИ пережила сразу 2 тектонических сдвига. Практически одновременно, 23 и 24 апреля 2026 года, свет увидели две новые флагманские модели: GPT-5.5 от OpenAI

продолжить чтение

OpenAI представили новый флагман — GPT-5.5

OpenAI выпустила GPT-5.5 — новый флагман, который, по заявлению компании, помог оптимизировать собственный инференс-стек.

продолжить чтение

Вышла GPT-5.5 — модель, которая сама создала часть своего инференса

OpenAI выпустила GPT-5.5 — новый флагман, который, по заявлению компании, сам помог переписать часть своего инференс-стека. Модель проанализировала недели продакшн-трафика и написала алгоритм балансировки запросов между вычислительными ядрами GPU — после этого скорость генерации токенов в продакшне выросла больше чем на 20%. GPT-5.5 и GPT-5.5 Pro сегодня раскатываются в ChatGPT и Codex для Plus, Pro, Business и Enterprise пользователей; в API OpenAI обещает поставить модель в ближайшее время.Это продолжение тренда, который компания обозначила

продолжить чтение

OpenAI выпустили GPT-5.5: пишет код дешевле предшественника

GPT-5.5 — это следующая модель после GPT-5.4, ориентированная прежде всего на агентную работу: многошаговые задачи, где модель планирует, использует инструменты и доводит работу до конца без постоянного участия пользователя.На Terminal-Bench 2.0 (сложные командно-строковые сценарии с планированием и итерациями) модель показала 82.7% против 75.1% у GPT-5.4. На SWE-Bench Pro, который оценивает решение реальных GitHub-задач, — 58.6%. Примечательно, что этих результатов GPT-5.5 достигает при меньшем количестве токенов, чем предшественник.

продолжить чтение

12