- BrainTools - https://www.braintools.ru -
Всем привет!
Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые считаю стоят внимания [1]. В основном про AI, изменение процессов, тренды и продуктовое видение.
У себя в телеграм-канале [2] делюсь сжатыми и структурированными саммери статей.
Сегодняшний перевод — AI assisted search-based research actually works now [3]
Давно пользуюсь Perplexity [4] для поиска в интернете, экономит много времени, особенно когда поиск предполагает анализ множества страниц. Результаты на 90% закрывают мои задачи.
Особенно круто работает поиск по соц.сетям (Reddit) и по видео (Youtube), ответы на некоторые вопросы кардинально отличаются т.к. в классическом поиске много SEO текста, который не всегда экспертный и с большой задержкой обновляется.
В течение последних двух с половиной лет функцией, которую я больше всего хотел получить от LLM, была способность выполнять исследовательские задачи на основе поиска от моего имени. Мы увидели первые проблески этого ещё в начале 2023 года с Perplexity (впервые запущена в декабре 2022 [5], первая утечка промптов в январе 2023 [6]), а затем с Microsoft Bing на основе GPT-4 (который запустился/эпически провалился в феврале 2023 [7]). С тех пор множество людей пытались решить эту проблему, в частности Google Gemini [8] и ChatGPT Search [9].
Те версии 2023 года были многообещающими, но очень разочаровывающими. Они сильно склонялись к галлюцинированию деталей, которых не было в результатах поиска, до такой степени, что нельзя было доверять ничему, что они сообщали.
Я считаю, что в первой половине 2025 года эти системы наконец пересекли черту и стали по-настоящему полезными.
Сначала появились реализации Deep Research — Google Gemini [10], затем OpenAI [11] и затем Perplexity [12] запустили продукты с этим названием, и все они впечатляли: они могли принять запрос, затем работать несколько минут, составляя подробный отчет с десятками (иногда сотнями) цитат. Версия Gemini получила ОГРОМНОЕ обновление несколько недель назад, когда они переключили ее на использование Gemini 2.5 Pro [13], и с тех пор я получал от неё выдающиеся результаты.
Ждать несколько минут для получения отчета на 10+ страниц — не мой идеальный рабочий процесс для такого инструмента. Я нетерпелив, я хочу получать ответы быстрее!
На прошлой неделе OpenAI выпустила o3 и o4-mini с поддержкой поиска [14] через ChatGPT [15]. На поверхности они похожи на те же идеи, что мы уже видели: LLM с возможностью вызова инструмента поиска при ответе на запрос.
Но есть одно очень существенное отличие: эти модели могут выполнять поиск как часть процесса рассуждений, который они используют перед формированием окончательного ответа.
Это оказывается огромным преимуществом. Я задавал ChatGPT (в режиме o3 или o4-mini) всевозможные вопросы и получал действительно полезные ответы, основанные на результатах поиска. Я пока не заметил ни одной галлюцинации, и в отличие от предыдущих систем я редко ловлю себя на том, что кричу “нет, не ищи это!” на экран, когда вижу, что они делают.
Вот четыре недавних примера диалогов:
Предоставь мне спецификации, включая VRAM для RTX 5090 и RTX PRO 6000 — плюс даты выпуска и цены [16]
Выясни, какую поисковую систему ChatGPT использует для o3 и o4-mini [18]
Общение с o3 ощущается как общение с инструментом Deep Research в реальном времени, без необходимости ждать несколько минут, пока он создаст чрезмерно подробный отчет.
Мое предположение заключается в том, что для хорошей работы требуется очень сильная модель для рассуждений. Оценка результатов поиска сложна из-за необходимости просеивать огромное количество спама и обманчивой информации. Разочаровывающие результаты предыдущих реализаций обычно сводились к тому, что Интернет полон мусора.
Возможно, o3, o4-mini и Gemini 2.5 Pro — это первые модели, которые преодолели порог устойчивости к доверчивости настолько, что могут делать это эффективно?
Ориентированное на пользователя приложение Google Gemini [8] также может искать, но оно не показывает мне, что именно ищет. В результате я просто не доверяю ему. Это большое упущение, поскольку у Google предположительно самый лучший поисковый индекс, поэтому они действительно должны иметь возможность создать отличную версию этого. А поддерживаемый ИИ поисковик Google в их обычном поисковом интерфейсе галлюцинирует дико до такой степени, что это активно вредит их бренду. Я только что проверил, и Google все еще показывает чепуху по запросу Encanto 2 [20]!
Claude также наконец добавил веб-поиск [21] месяц назад, но он не кажется таким же хорошим. Он использует поисковый индекс Brave [22], который, как мне кажется, не так всеобъемлющ, как Bing или Gemini, и поиск не происходит как часть того мощного процесса рассуждений.
Настоящий волшебный момент для меня произошел несколько дней назад [23].
Мой инструмент сегментации изображений Gemini [24] использовал библиотеку @google/generative-ai [25], которая была громко объявлена устаревшей [26] в пользу ещё находящейся в предварительной версии библиотеки Google Gen AI SDK @google/genai [27].
Я не хотел выполнять работу по обновлению. На всякий случай я вставил весь свой HTML-код [28] (с встроенным JavaScript) в ChatGPT o4-mini-high и дал промпт:
Этот код нуждается в обновлении до новой рекомендуемой JavaScript библиотеки от Google. Выясни, что это за библиотека, и затем найди достаточно документации, чтобы портировать этот код на неё.
(Я даже не потрудился сам найти название новой библиотеки!)
… и он сделал именно это [29]. Он думал 21 секунду, выполнил ряд поисков, выяснил, что это за новая библиотека (которая существовала далеко за пределами его даты обучения [30]), нашел инструкции по обновлению [31] и создал новую версию [32] моего кода, которая работала идеально.
Я запустил этот промпт на телефоне из праздного любопытства, пока занимался чем-то другим. Я был крайне впечатлен и удивлен, когда он сделал именно то, что мне было нужно.
Я пишу об этом сегодня, потому что это был один из моих вопросов “могут ли LLM уже делать это надежно?” в течение более двух лет. Думаю, они только что пересекли черту, став полезными в качестве исследовательских помощников, без необходимости проверять все, что они говорят, с особой тщательностью.
Я все еще не доверяю им настолько, чтобы они не делали ошибок, но, возможно, я доверяю им достаточно, чтобы пропускать проверку фактов для задач с меньшими ставками.
Это также означает, что некоторые из мрачных сценариев будущего, которые мы предсказывали в течение последних пары лет, с гораздо большей вероятностью сбудутся. Зачем посещать веб-сайты, если можно получить ответы напрямую от чат-бота?
Судебные иски по этому поводу начали появляться [33] еще когда LLM были в основном никудышными. Ставки намного выше сейчас, когда они действительно хороши в этом!
Я уже чувствую, как мое использование поиска Google резко падает. Ожидаю непростой путь, пока новая экономическая модель для Интернета начинает вырисовываться.
Автор: Kual
Источник [34]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/14493
URLs in this post:
[1] внимания: http://www.braintools.ru/article/7595
[2] телеграм-канале: https://t.me/+9rn-oYnaOAUzNDIy
[3] AI assisted search-based research actually works now: https://simonwillison.net/2025/Apr/21/ai-assisted-search/
[4] Perplexity: https://www.perplexity.ai/
[5] в декабре 2022: https://en.wikipedia.org/wiki/Perplexity_AI
[6] в январе 2023: https://simonwillison.net/2023/Jan/22/perplexityai/
[7] в феврале 2023: https://simonwillison.net/2023/Feb/15/bing/
[8] Google Gemini: https://gemini.google.com/
[9] ChatGPT Search: https://openai.com/index/introducing-chatgpt-search/
[10] Google Gemini: https://blog.google/products/gemini/google-gemini-deep-research/
[11] затем OpenAI: https://openai.com/index/introducing-deep-research/
[12] затем Perplexity: https://www.perplexity.ai/hub/blog/introducing-perplexity-deep-research
[13] переключили ее на использование Gemini 2.5 Pro: https://blog.google/products/gemini/deep-research-gemini-2-5-pro-experimental/
[14] o3 и o4-mini с поддержкой поиска: https://openai.com/index/introducing-o3-and-o4-mini/
[15] ChatGPT: https://chatgpt.com/
[16] Предоставь мне спецификации, включая VRAM для RTX 5090 и RTX PRO 6000 — плюс даты выпуска и цены: https://chatgpt.com/share/6805758b-acc8-8006-88a3-bdd78866ee15
[17] Найди мне веб-инструмент, который позволяет вставить URL и выдает количество слов и предполагаемое время чтения: https://chatgpt.com/share/68057580-02c8-8006-8ff4-7ae3ce816342
[18] Выясни, какую поисковую систему ChatGPT использует для o3 и o4-mini: https://chatgpt.com/share/6805756c-4268-8006-82ab-014f7c304622
[19] Посмотри цены Cloudflare r2 и используя Python, выясни, сколько будет стоить это (скриншот панели управления): https://chatgpt.com/share/6805755b-4aa0-8006-ab0b-42ae569da6a8
[20] по запросу Encanto 2: https://simonwillison.net/2024/Dec/29/encanto-2/
[21] добавил веб-поиск: https://simonwillison.net/2025/Mar/20/
[22] использует поисковый индекс Brave: https://simonwillison.net/2025/Mar/21/anthropic-use-brave/
[23] несколько дней назад: https://simonwillison.net/2025/Apr/18/gemini-image-segmentation/#gemini-2-5-flash-non-thinking
[24] инструмент сегментации изображений Gemini: https://simonwillison.net/2025/Apr/18/gemini-image-segmentation/
[25] @google/generative-ai: https://www.npmjs.com/package/@google/generative-ai
[26] громко объявлена устаревшей: https://github.com/google-gemini/deprecated-generative-ai-js
[27] Google Gen AI SDK @google/genai: https://github.com/googleapis/js-genai
[28] весь свой HTML-код: https://github.com/simonw/tools/blob/aa310a4f9cde07d5e8e87572f70fceca532884dd/gemini-mask.html
[29] именно это: https://chatgpt.com/share/68028f7b-11ac-8006-8150-00c4205a2507
[30] обучения: http://www.braintools.ru/article/5125
[31] инструкции по обновлению: https://ai.google.dev/gemini-api/docs/migrate
[32] новую версию: https://github.com/simonw/tools/commit/d199de213dc3f866a3b8efbcdd2dde34204dc409
[33] начали появляться: https://simonwillison.net/2023/Dec/31/ai-in-2023/#ethics-diabolically-complex
[34] Источник: https://habr.com/ru/articles/903082/?utm_source=habrahabr&utm_medium=rss&utm_campaign=903082
Нажмите здесь для печати.