- BrainTools - https://www.braintools.ru -

GPT наконец перестал выдумывать факты и действительно понимает, что находит в интернете?

Всем привет!
Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые считаю стоят внимания [1]. В основном про AI, изменение процессов, тренды и продуктовое видение.

У себя в телеграм-канале [2] делюсь сжатыми и структурированными саммери статей.

Сегодняшний перевод — AI assisted search-based research actually works now [3]

Давно пользуюсь Perplexity [4] для поиска в интернете, экономит много времени, особенно когда поиск предполагает анализ множества страниц. Результаты на 90% закрывают мои задачи.
Особенно круто работает поиск по соц.сетям (Reddit) и по видео (Youtube), ответы на некоторые вопросы кардинально отличаются т.к. в классическом поиске много SEO текста, который не всегда экспертный и с большой задержкой обновляется.


В течение последних двух с половиной лет функцией, которую я больше всего хотел получить от LLM, была способность выполнять исследовательские задачи на основе поиска от моего имени. Мы увидели первые проблески этого ещё в начале 2023 года с Perplexity (впервые запущена в декабре 2022 [5], первая утечка промптов в январе 2023 [6]), а затем с Microsoft Bing на основе GPT-4 (который запустился/эпически провалился в феврале 2023 [7]). С тех пор множество людей пытались решить эту проблему, в частности Google Gemini [8] и ChatGPT Search [9].

Те версии 2023 года были многообещающими, но очень разочаровывающими. Они сильно склонялись к галлюцинированию деталей, которых не было в результатах поиска, до такой степени, что нельзя было доверять ничему, что они сообщали.

Я считаю, что в первой половине 2025 года эти системы наконец пересекли черту и стали по-настоящему полезными.

Deep Research от трех разных поставщиков

Сначала появились реализации Deep ResearchGoogle Gemini [10], затем OpenAI [11] и затем Perplexity [12] запустили продукты с этим названием, и все они впечатляли: они могли принять запрос, затем работать несколько минут, составляя подробный отчет с десятками (иногда сотнями) цитат. Версия Gemini получила ОГРОМНОЕ обновление несколько недель назад, когда они переключили ее на использование Gemini 2.5 Pro [13], и с тех пор я получал от неё выдающиеся результаты.

Ждать несколько минут для получения отчета на 10+ страниц — не мой идеальный рабочий процесс для такого инструмента. Я нетерпелив, я хочу получать ответы быстрее!

o3 и o4-mini отлично справляются с поиском

На прошлой неделе OpenAI выпустила o3 и o4-mini с поддержкой поиска [14] через ChatGPT [15]. На поверхности они похожи на те же идеи, что мы уже видели: LLM с возможностью вызова инструмента поиска при ответе на запрос.

Но есть одно очень существенное отличие: эти модели могут выполнять поиск как часть процесса рассуждений, который они используют перед формированием окончательного ответа.

Это оказывается огромным преимуществом. Я задавал ChatGPT (в режиме o3 или o4-mini) всевозможные вопросы и получал действительно полезные ответы, основанные на результатах поиска. Я пока не заметил ни одной галлюцинации, и в отличие от предыдущих систем я редко ловлю себя на том, что кричу “нет, не ищи это!” на экран, когда вижу, что они делают.

Вот четыре недавних примера диалогов:

Общение с o3 ощущается как общение с инструментом Deep Research в реальном времени, без необходимости ждать несколько минут, пока он создаст чрезмерно подробный отчет.

Мое предположение заключается в том, что для хорошей работы требуется очень сильная модель для рассуждений. Оценка результатов поиска сложна из-за необходимости просеивать огромное количество спама и обманчивой информации. Разочаровывающие результаты предыдущих реализаций обычно сводились к тому, что Интернет полон мусора.

Возможно, o3, o4-mini и Gemini 2.5 Pro — это первые модели, которые преодолели порог устойчивости к доверчивости настолько, что могут делать это эффективно?

Google и Anthropic нужно догонять

Ориентированное на пользователя приложение Google Gemini [8] также может искать, но оно не показывает мне, что именно ищет. В результате я просто не доверяю ему. Это большое упущение, поскольку у Google предположительно самый лучший поисковый индекс, поэтому они действительно должны иметь возможность создать отличную версию этого. А поддерживаемый ИИ поисковик Google в их обычном поисковом интерфейсе галлюцинирует дико до такой степени, что это активно вредит их бренду. Я только что проверил, и Google все еще показывает чепуху по запросу Encanto 2 [20]!

Claude также наконец добавил веб-поиск [21] месяц назад, но он не кажется таким же хорошим. Он использует поисковый индекс Brave [22], который, как мне кажется, не так всеобъемлющ, как Bing или Gemini, и поиск не происходит как часть того мощного процесса рассуждений.

Ленивый перенос кода на новую версию библиотеки через поиск

Настоящий волшебный момент для меня произошел несколько дней назад [23].

Мой инструмент сегментации изображений Gemini [24] использовал библиотеку @google/generative-ai [25], которая была громко объявлена устаревшей [26] в пользу ещё находящейся в предварительной версии библиотеки Google Gen AI SDK @google/genai [27].

Я не хотел выполнять работу по обновлению. На всякий случай я вставил весь свой HTML-код [28] (с встроенным JavaScript) в ChatGPT o4-mini-high и дал промпт:

Этот код нуждается в обновлении до новой рекомендуемой JavaScript библиотеки от Google. Выясни, что это за библиотека, и затем найди достаточно документации, чтобы портировать этот код на неё.

(Я даже не потрудился сам найти название новой библиотеки!)

… и он сделал именно это [29]. Он думал 21 секунду, выполнил ряд поисков, выяснил, что это за новая библиотека (которая существовала далеко за пределами его даты обучения [30]), нашел инструкции по обновлению [31] и создал новую версию [32] моего кода, которая работала идеально.

Скриншот ответа ИИ-ассистента о обновлении кода API Google Gemini. Показывает "Думал 21 секунду", за которым следуют результаты веб-поиска по запросу "Google Gemini API JavaScript library recommended new library" с вариантами включая Google AI for Developers, GitHub и Google for Developers. Ассистент объясняет обновление с библиотеки GoogleGenerativeAI на @google-ai/generative, с примерами кода: import { GoogleGenAI } from 'https://cdn.jsdelivr.net/npm/@google/genai@latest'; и const ai=new GoogleGenAI({ apiKey: getApiKey() });

Скриншот ответа ИИ-ассистента о обновлении кода API Google Gemini

Я запустил этот промпт на телефоне из праздного любопытства, пока занимался чем-то другим. Я был крайне впечатлен и удивлен, когда он сделал именно то, что мне было нужно.

Как теперь работает экономическая модель для Интернета?

Я пишу об этом сегодня, потому что это был один из моих вопросов “могут ли LLM уже делать это надежно?” в течение более двух лет. Думаю, они только что пересекли черту, став полезными в качестве исследовательских помощников, без необходимости проверять все, что они говорят, с особой тщательностью.

Я все еще не доверяю им настолько, чтобы они не делали ошибок, но, возможно, я доверяю им достаточно, чтобы пропускать проверку фактов для задач с меньшими ставками.

Это также означает, что некоторые из мрачных сценариев будущего, которые мы предсказывали в течение последних пары лет, с гораздо большей вероятностью сбудутся. Зачем посещать веб-сайты, если можно получить ответы напрямую от чат-бота?

Судебные иски по этому поводу начали появляться [33] еще когда LLM были в основном никудышными. Ставки намного выше сейчас, когда они действительно хороши в этом!

Я уже чувствую, как мое использование поиска Google резко падает. Ожидаю непростой путь, пока новая экономическая модель для Интернета начинает вырисовываться.

Автор: Kual

Источник [34]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/14493

URLs in this post:

[1] внимания: http://www.braintools.ru/article/7595

[2] телеграм-канале: https://t.me/+9rn-oYnaOAUzNDIy

[3] AI assisted search-based research actually works now: https://simonwillison.net/2025/Apr/21/ai-assisted-search/

[4] Perplexity: https://www.perplexity.ai/

[5] в декабре 2022: https://en.wikipedia.org/wiki/Perplexity_AI

[6] в январе 2023: https://simonwillison.net/2023/Jan/22/perplexityai/

[7] в феврале 2023: https://simonwillison.net/2023/Feb/15/bing/

[8] Google Gemini: https://gemini.google.com/

[9] ChatGPT Search: https://openai.com/index/introducing-chatgpt-search/

[10] Google Gemini: https://blog.google/products/gemini/google-gemini-deep-research/

[11] затем OpenAI: https://openai.com/index/introducing-deep-research/

[12] затем Perplexity: https://www.perplexity.ai/hub/blog/introducing-perplexity-deep-research

[13] переключили ее на использование Gemini 2.5 Pro: https://blog.google/products/gemini/deep-research-gemini-2-5-pro-experimental/

[14] o3 и o4-mini с поддержкой поиска: https://openai.com/index/introducing-o3-and-o4-mini/

[15] ChatGPT: https://chatgpt.com/

[16] Предоставь мне спецификации, включая VRAM для RTX 5090 и RTX PRO 6000 — плюс даты выпуска и цены: https://chatgpt.com/share/6805758b-acc8-8006-88a3-bdd78866ee15

[17] Найди мне веб-инструмент, который позволяет вставить URL и выдает количество слов и предполагаемое время чтения: https://chatgpt.com/share/68057580-02c8-8006-8ff4-7ae3ce816342

[18] Выясни, какую поисковую систему ChatGPT использует для o3 и o4-mini: https://chatgpt.com/share/6805756c-4268-8006-82ab-014f7c304622

[19] Посмотри цены Cloudflare r2 и используя Python, выясни, сколько будет стоить это (скриншот панели управления): https://chatgpt.com/share/6805755b-4aa0-8006-ab0b-42ae569da6a8

[20] по запросу Encanto 2: https://simonwillison.net/2024/Dec/29/encanto-2/

[21] добавил веб-поиск: https://simonwillison.net/2025/Mar/20/

[22] использует поисковый индекс Brave: https://simonwillison.net/2025/Mar/21/anthropic-use-brave/

[23] несколько дней назад: https://simonwillison.net/2025/Apr/18/gemini-image-segmentation/#gemini-2-5-flash-non-thinking

[24] инструмент сегментации изображений Gemini: https://simonwillison.net/2025/Apr/18/gemini-image-segmentation/

[25] @google/generative-ai: https://www.npmjs.com/package/@google/generative-ai

[26] громко объявлена устаревшей: https://github.com/google-gemini/deprecated-generative-ai-js

[27] Google Gen AI SDK @google/genai: https://github.com/googleapis/js-genai

[28] весь свой HTML-код: https://github.com/simonw/tools/blob/aa310a4f9cde07d5e8e87572f70fceca532884dd/gemini-mask.html

[29] именно это: https://chatgpt.com/share/68028f7b-11ac-8006-8150-00c4205a2507

[30] обучения: http://www.braintools.ru/article/5125

[31] инструкции по обновлению: https://ai.google.dev/gemini-api/docs/migrate

[32] новую версию: https://github.com/simonw/tools/commit/d199de213dc3f866a3b8efbcdd2dde34204dc409

[33] начали появляться: https://simonwillison.net/2023/Dec/31/ai-in-2023/#ethics-diabolically-complex

[34] Источник: https://habr.com/ru/articles/903082/?utm_source=habrahabr&utm_medium=rss&utm_campaign=903082

www.BrainTools.ru

Rambler's Top100