- BrainTools - https://www.braintools.ru -

Когда мы говорим о “глубоких исследованиях”, чаще всего имеем в виду сервисы, которые сами планируют поиск, бродят по источникам, собирают цитаты и выдают аккуратный отчет. Это удобно, но почти всегда жестко привязано к одной стратегии и одному семейству моделей. Авторы Universal Deep Research (UDR) предлагают новый подход: дать пользователю выбрать любую LLM и самому задать стратегию исследования — без обучения [1] моделей и сложной настройки. По сути, это обертка над LLM плюс компилятор стратегий из естественного языка в исполняемый код, который можно проверять, повторять [2] и изменять.
Сегодняшние инструменты deep research — Gemini, Perplexity, OpenAI Deep Research, Grok DeepSearch — хорошо ищут и аккуратно формируют отчет, но прячут ключевые рычаги. Пользователь почти не влияет на приоритеты источников, кросс‑валидацию, контроль стоимости вызовов, не может подменить “мозги” системы на свою любимую LLM, а главное — не может описать собственную, предметно‑специфичную тактику. Это особенно бьет по тем, кто работает в финансах, праве, здравоохранении и других высокоценных доменах, где цена ошибки [3] велика, а требования к проверке источников жесткие.
гибкий контроль источников, проверок и бюджета;
возможность задавать специализированные стратегии под домен;
свободная компоновка: любую стратегию можно запускать на любой LLM.
Система работает в две фазы. Сначала стратегия, описанная простым списком шагов (на человеческом языке), превращается LLM в единый исполняемый код с понятным управлением и ограниченным набором инструментов (поиск, ранжирование, извлечение и т. п.). На этом этапе от модели требуют строгого соответствия: каждый кусок кода снабжен комментарием, какой пункт стратегии он реализует. Это сильно снижает риск, что LLM “срежет углы”, пропустит шаг или добавит лишние ограничения.
Далее код исполняется в изолированной “песочнице” с детерминированными вызовами инструментов. Все промежуточные данные живут в именованных переменных состояния, а не в растущем контексте чата — поэтому хватает даже небольшого окна (в экспериментах — 8k). Рассуждения LLM используются как утилиты: суммаризация, извлечение фактов, ранжирование. Оркестрация — это уже обычный код на CPU, а не скрытая “магия” внутри промта. Прогресс пользователь видит через поток уведомлений: стратегия сама решает, когда и что показывать.
Надежность. Цельный код оказался стабильнее, чем длинные промты с рассуждениями или пошаговая генерация фрагментов. Меньше каскадных сбоев, проще аудит.
Эффективность. Разделение ролей снижает стоимость: LLM вызывается только там, где нужна ее интеллектуальная работа, а не для всего процесса.
Прозрачность. Уведомления, переменные состояния и воспроизводимый финальный отчет делают путь к результату прослеживаемым.
Безопасность. Исполнение в изоляции ограничивает риски от пользовательского кода — важный момент для корпораций.
Авторы показывают три семейства стратегий: минимальную (быстрый проход), экспансивную (широкое покрытие тем), и интенсивную (несколько итераций с переосмыслением поисковых фраз). Каждую можно править под задачи: от проверки гипотез в R&D до юридической проверки документов. Важно, что UDR не навязывает свою “агентность”: если в стратегии не задано свободное рассуждение, система не будет импровизировать.
Поверх ядра есть простой UI: ввод промта, выбор и редактирование стратегии, поток уведомлений, просмотр отчета. Можно остановить исследование и сгенерировать промежуточный результат.
В демонстрациях стратегия минимального уровня на Llama 3.3 70B уверенно выдавала аккуратные отчеты по культурным и историческим запросам, по датам и новостным дням, а также по биографиям с требованиями к структуре и ссылкам. Важный момент — следование правилу “только из прочитанного в контексте”, что дисциплинирует модель и снижает риск домыслов.
UDR аккуратно разводит модели и агентную логику [4]. Это открывает двери к новым проверенным стратегиям для массовых сценариев. Производители LLM могут конкурировать качеством рассуждений, а разработчики — качеством стратегий, не мешая друг другу. Для организаций это путь к контролируемым, воспроизводимым исследованиям с четким управлением стоимостью и рисками.
💾 Код [6]
***
Если вам интересна тема ИИ, [7]подписывайтесь на мой Telegram-канал [8]– там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.
Автор: andre_dataist
Источник [9]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/19234
URLs in this post:
[1] обучения: http://www.braintools.ru/article/5125
[2] повторять: http://www.braintools.ru/article/4012
[3] ошибки: http://www.braintools.ru/article/4192
[4] логику: http://www.braintools.ru/article/7640
[5] 📜 Оригинальная статья: https://arxiv.org/abs/2509.00244
[6] 💾 Код: https://github.com/NVlabs/UniversalDeepResearch
[7] : https://t.me/+mP35nQPhgXZmZDYy
[8] подписывайтесь на мой Telegram-канал : https://t.me/+dQRUSTefradiMTcy
[9] Источник: https://habr.com/ru/articles/944742/?utm_source=habrahabr&utm_medium=rss&utm_campaign=944742
Нажмите здесь для печати.