Chain-of-Thought.

Когда модели стоит «думать», а когда нет: проверил на своём агенте

продолжить чтение

Может ли ИИ думать? Разбираем вопрос без философии

Этот вопрос обычно заканчивается одинаково: кто-то произносит слово «сознание», дальше начинается философский спор, и через двадцать минут все расходятся ни с чем. Мы пойдём другим путём.Никакого Декарта, никакого Тьюринга, никаких рассуждений о душе. Только конкретный вопрос: что именно умеет и не умеет делать языковая модель — и насколько это похоже на то, что мы в быту называем мышлением.Что мы вообще называем «думать»

продолжить чтение

Режим thinking у ИИ: что на самом деле происходит, когда модель «думает»

Когда нажимаешь кнопку Thinking и видишь, как модель несколько секунд «размышляет» перед ответом — легко решить, что она просто старается сильнее. Работает усерднее. Думает глубже. Может, перебирает больше вариантов из какой-то внутренней базы знаний.Это не так. Thinking-режим — это принципиально другой способ генерации текста, не просто «обычный режим с усилием». И понять разницу полезно не для общего развития, а чтобы знать, когда его включать, когда он даёт реальное преимущество — а когда только тратит твоё время и ресурсы.Как работает обычная генерация — и в чём её фундаментальная ловушка

продолжить чтение

I just want an agent. Часть 2. Как мы построили виртуальную команду для разработки ИИ-агентов

В первой части

продолжить чтение

I just want an agent. Часть 1. Как я научил ИИ собирать ИИ‑агентов за пользователей и выиграл конкурс

продолжить чтение

Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь

Вторник, час ночи. Сижу пишу промпт чтобы вытащить из 40 PDF-ок с актами нужные поля в JSON. Задача рутинная, у меня под неё лежит проверенный шаблон. Развёрнутый CoT, три few-shot примера, роль «опытный финансовый аналитик с 15 лет опыта». Раньше работал как часы.Закидываю в GPT-5.5 с высоким мышлением. Получаю мусор. Половина полей не та, формат сломан, в выводе развёрнутое рассуждение которое я не просил.Думаю ладно, заглючило. Прогоняю ещё раз. То же самое.Удаляю промпт целиком. Пишу заново, тупо: «вытащи из приложенного текста поля X, Y, Z в виде JSON, никаких пояснений». Десять строк. Запускаю.Работает.

продолжить чтение

Промпт-инжиниринг 2026: что устарело с приходом reasoning-моделей

Полгода назад взял старый промпт. Тот самый, отлаженный за два года — с развёрнутым chain-of-thought, тремя few-shot примерами, ролью «опытного инженера с 15 лет опыта», пошаговой схемой рассуждения. Запустил на reasoning-модели в режиме высокого мышления.Результат — хуже, чем у минимального промпта.Минимальный промпт был тупой: вход, ожидаемый формат вывода, одно ограничение. Без героики. И он выиграл.Тогда я понял: половина моего арсенала, накопленного на GPT-4 и Claude 3.5, против reasoning-моделей работает плохо. Что-то откровенно вредит. Что-то стало лишним. А что-то — что я делал по остаточному принципу — наоборот, теперь важнее всего.

продолжить чтение

Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже

Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента (API/Поиск) -> Чтение -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, галлюцинируют и застревают в бесконечных циклах.Индустрия пытается лечить это экстенсивно: наращивает контекстное окно до миллионов токенов или пишет в системном промпте заклинания вроде «подумай шаг за шагом и будь максимально объективен».

продолжить чтение

Общество мыслей: совещание внутри LLM

Общество мыслей: совещание внутри LLMВы наверняка слышали про Chain-of-Thought. "Пусть модель думает вслух, и она станет умнее" — звучит логично, правда? Добавляем "Let's think step by step" в промпт, модель генерирует больше токенов, качество растёт. Почему это работает — долгое время было неочевидно.Но вот что странно: DeepSeek-R1, QwQ-32B и модели серии OpenAI o (o1, o3) показывают результаты, которые невозможно объяснить просто "более длинными рассуждениями". Они решают задачи, на которых обычные модели с Chain-of-Thought спотыкаются. И дело не в размере модели и не в количестве токенов.Исследователи из Google Research и University of Chicago в статье

продолжить чтение

Скрытые сигналы: как модели учатся тому, чего нет в данных

Изображение: Scientific American

продолжить чтение

12