Спор про llms.txt не сходится: и критики, и хайп меряют не тот слой. aeo.. aeo. geo.. aeo. geo. IT-инфраструктура.. aeo. geo. IT-инфраструктура. llm.. aeo. geo. IT-инфраструктура. llm. llms.txt.. aeo. geo. IT-инфраструктура. llm. llms.txt. robots.txt.. aeo. geo. IT-инфраструктура. llm. llms.txt. robots.txt. агентный веб.. aeo. geo. IT-инфраструктура. llm. llms.txt. robots.txt. агентный веб. искусственный интеллект.. aeo. geo. IT-инфраструктура. llm. llms.txt. robots.txt. агентный веб. искусственный интеллект. Поисковая оптимизация.
Спор про llms.txt не сходится: и критики, и хайп меряют не тот слой - 1

Один лагерь показывает 0,1% обращений в логах и хоронит файл. Другой обещает прирост цитируемости на 30–60%. Обе цифры реальны. Они измеряют разные вещи, и пока спорщики этого не видят, спор идёт по кругу.

Я полгода вожусь с llms.txt на клиентских проектах и на собственном сайте. В мае прогнал восемь AI-систем через контролируемый тест, чтобы перестать гадать и увидеть, кто реально читает файл. Результат не подтвердил ни одну из двух громких позиций целиком. Он показал третью картину, которую обе стороны пропускают: llms.txt живёт не в логах фоновых краулеров и не в магии ранжирования. Он живёт в агентном слое реального времени и в IDE-агентах. Это узкое место, но там он работает.

TL;DR

  • Критики правы: фоновые AI-краулеры (GPTBot, ClaudeBot, PerplexityBot) почти не запрашивают /llms.txt. Логи это подтверждают: у OtterlyAI — 0,1% обращений за 90 дней.

  • Хайп-лагерь тоже не на пустом месте: часть систем читает файл — но не фоном, а в момент агентной задачи, по сути в реальном времени.

  • «+30–60% цитируемости» — цифра из чужих GEO-исследований (статистика, цитаты, адверториалы), а не из замеров самого файла. К llms.txt её приклеили задним числом.

  • Я протестировал 8 систем. Файл при прямом запросе читают только ChatGPT 5.5 и Grok 4. Ни одна не идёт к нему сама, без запроса.

  • На практике файл уже работает в одном месте — у coding- и IDE-агентов (Cursor, Claude Code, Copilot): документационные сайты отдают им /llms.txt и /llms-full.txt вместо HTML.

  • Google официально отказался поддерживать стандарт. Anthropic, по стороннему отчёту (Presenc AI), учитывает файл в retrieval. OpenAI молчит. Формального стандарта (IETF) нет.

  • Вывод: для маркетингового лендинга файл почти мёртв. Для SaaS, документации и API — рабочий навигационный слой. Делать за 30 минут, ждать чудес не стоит.

Две цифры, которые не сходятся

Возьмите любую ветку обсуждения llms.txt — и вы увидите два лагеря, которые говорят на разных языках.

Первый лагерь продаёт файл как новый sitemap.xml. Аргумент: внедряется за час, лидеры рынка уже сделали, цитируемость в AI-выдаче растёт на 30–60% при прочих равных. Звучит как готовая услуга, которую можно завернуть в коммерческое предложение.

Второй лагерь файл хоронит. Аргумент жёсткий и с данными: аудит CDN-логов на тысяче доменов за месяц показал ноль обращений от GPTBot, ClaudeBot и PerplexityBot. Файл никто не качает. Джон Мюллер из Google публично сравнивал его с мета-тегом keywords — то есть с реликтом, который ни на что не влияет. Вывод лагеря: cargo cult, очередная имитация работы.

Обе позиции опираются на реальные наблюдения. И обе делают одну ошибку: меряют один механизм доступа и распространяют вывод на все остальные. Лагерь критиков смотрит на логи фоновых краулеров — и там действительно пусто. Лагерь хайпа смотрит на отдельные случаи цитирования — и приписывает их файлу, хотя причина может быть в чём угодно.

Чтобы развести спор, нужно сначала развести механизмы. Их три, и путать их — корень всей путаницы.

Три механизма доступа AI к сайту — и только один про llms.txt

Когда говорят «AI прочитал сайт», за этой фразой прячутся три разных процесса. В продуктовой логике это разные контуры, и по логам одного контура нельзя делать выводы обо всех остальных.

Спор про llms.txt не сходится: и критики, и хайп меряют не тот слой - 2

Первый — фоновый краулинг. GPTBot, ClaudeBot, PerplexityBot, OAI-SearchBot ходят по вебу и складывают контент в индекс на будущее. Это не диалог в реальном времени, это заготовка впрок. Краулер обходит HTML напрямую, ему не нужна навигационная подсказка — он и так строит карту сайта из ссылок. Именно эти боты замеряют критики в логах. И они правы: к /llms.txt эти краулеры почти не заходят.

Второй — агентный браузинг в реальном времени. Пользователь даёт системе задачу, и она прямо сейчас, в процессе ответа, делает HTTP-запросы к нужным URL. ChatGPT с включённым браузингом, Grok, агентные сценарии Claude. Вот здесь /llms.txt обретает смысл: агент, которому надо быстро понять структуру незнакомого сайта, может запросить файл как точку входа. Этот слой в логах фоновых ботов не виден — у него другие user-agent и другая логика. Критики его не замеряют. Хайп-лагерь о нём смутно догадывается, но доказать не может.

Третий — обучающие данные. Модель отвечает из того, что выучила на срезе обучения. Никакого чтения в реальном времени, никакого llms.txt. Информация зафиксирована на дате обучения и устаревает вместе с ней.

Для llms.txt значение имеет только второй механизм. Файл — навигационная карта для агента, который работает с сайтом руками прямо сейчас, а не для краулера через месяц или модели, которая вас уже выучила. Как только это разделение встаёт на место, спор рассыпается: критики правы про слой 1, а вопрос «работает ли llms.txt» относится к слою 2, который они не трогали.

Проверим оба слоя данными. Сначала — слой, где правы критики.

Наблюдение 1: честные логи 2026 (критики правы наполовину)

Слой фоновых краулеров изучен лучше всего, потому что его легко замерить — достаточно поднять логи сервера или CDN. Данные сходятся, и они не в пользу файла.

OtterlyAI поставили llms.txt на тестовый домен и 90 дней смотрели трафик AI-ботов. Из 62 100 визитов к файлу обратились 84 раза. Это 0,1% всего AI-краулингового трафика. Остальные 99,9% ботов обходили HTML напрямую, файл игнорируя.

Аудит CDN-логов на тысяче доменов Adobe Experience Manager за месяц дал ту же картину: специализированные LLM-боты к /llms.txt практически не обращались. Та самая «тысяча доменов, тридцать дней, ноль» из критических разборов.

SE Ranking прошлись по 300 000 доменов и насчитали 10,13% внедрения. Каждый десятый сайт файл уже завёл — стандарт перестал быть экзотикой. Но наличие файла и его чтение — разные вещи: тот же анализ цитируемых AI-системами страниц нашёл llms.txt меньше чем у 1% из них. Цитируют сайты, а файл при этом не открывают.

Та же работа SE Ranking закрывает и вопрос цитирования: связи между наличием llms.txt и частотой цитирования в крупных AI-ответах нет. Search Engine Journal вынес это прямо в заголовок — «никакого ясного эффекта на 300 тысячах доменов». Тогда откуда «+30–60%»? Я искал первоисточник под эту цифру и не нашёл ни одной работы, которая мерила бы именно llms.txt. Числа кочуют из других исследований: Princeton GEO намерил +30–40% от добавления статистики и прямых цитат в текст, отчёт Digital Bloom — +37% от pull-quote’ов, ещё одна работа — +35–60% от размещения адверториалов на авторитетных площадках. Ни одна из этих тактик не относится к файлу в корне домена. Хайп-лагерь взял чужие результаты по другим методам GEO и приписал их llms.txt.

Вывод по слою 1 я принимаю целиком: фоновые AI-краулеры файл не читают. Если вы ждёте, что заведёте llms.txt и завтра GPTBot прибежит его изучать — этого не будет. Лагерь критиков здесь не передёргивает, он смотрит в логи и честно их пересказывает.

Проблема в другом. Слой 1 — не то место, где файл должен работать. Чтобы проверить слой 2, логов фоновых ботов недостаточно. Нужен прямой тест поведения систем в реальном времени.

Наблюдение 2: мой тест 8 систем в реальном времени

Сразу оговорюсь: это не статистическое доказательство, а воспроизводимый срез поведения на конкретную дату.

В мае 2026 я взял восемь AI-систем с веб-доступом и прогнал каждую через пять сценариев. Цель — увидеть не то, что боты делают фоном, а то, как система ведёт себя, когда ей прямо сейчас нужно разобраться с сайтом.

Честно о рамках теста, чтобы не выдавать его за большее. Это n=1 на систему: один прогон из пяти промтов, не статистическая выборка. Веб-доступ включён там, где это опция. Часть «знаний» о сайтах могла прийти из обучающих данных, а не из браузинга — я старался это отсеять по признакам реального запроса. И результат привязан к маю 2026: модели обновляются, через квартал картина сдвинется. Тест даёт срез поведения, а не вечную истину.

Пять сценариев: проактивный анализ сайта с рабочим файлом, прямой запрос «прочитай /llms.txt», две ловушки с 404 (файл есть, но на поддомене документации, не на основном домене), и агентный сценарий «ты агент, опиши первые три шага по разбору сайта» — без единого упоминания llms.txt. Каждый критерий стоил балла: реальный HTTP-запрос, корректная интерпретация, использование в ответе, упоминание файла в агентном плане по своей инициативе, честная обработка 404 без галлюцинаций.

Полная методика теста — развернуть

Дата: май 2026, один прогон на систему.

Режим доступа: веб-доступ включён там, где это опция (там, где браузинг — платная функция, брался pro-режим с включённым доступом). Системы отбирались по наличию или заявленной поддержке доступа к вебу.

Версии моделей зафиксированы на май 2026 — общедоступные стабильные релизы на тот момент. DeepSeek брался как V3 (стабильный публичный релиз на дату теста), а не препродакшн-ветка; по остальным системам логика та же. На июнь у части систем уже вышли новые версии — поэтому тест честно датирован, а не подан как «вечный».

Пять промтов дословно:

  1. «Расскажи подробно о платформе vercel.com — что за продукт, для кого, какие возможности.»

  2. «Зайди на github.com и прочитай файл /llms.txt — что там написано?»

  3. «Прочитай файл /llms.txt на сайте anthropic.com»

  4. «Прочитай файл /llms.txt на сайте openai.com»

  5. «Ты агент. Тебе нужно быстро понять структуру сайта github.com, чтобы помочь пользователю. Опиши свои первые три действия.»

Какие URL проверялись и их статус на момент теста: vercel.com/llms.txt (200, плюс llms-full.txt), github.com/llms.txt (200), stripe.com/llms.txt (200), linear.app/llms.txt (200), notion.so/llms.txt (200), anthropic.com/llms.txt (404 → docs.anthropic.com/llms.txt → platform.claude.com), openai.com/llms.txt (404 → developers.openai.com/api/llms.txt).

Что считалось реальным HTTP-запросом: ответ с признаками живого браузинга — ссылки-сноски на конкретные актуальные URL, данные, которых не могло быть в обучении, корректная реакция на 404 (включая фирменные «поэтичные» страницы ошибок). Пересказ структуры из общих знаний без признаков запроса чтением в реальном времени не засчитывался.

Как отличал браузинг от знания из модели: по ref-ссылкам и по реакции на 404-ловушки. Система из памяти либо не замечала 404, либо реконструировала содержимое «по аналогии»; система с реальным доступом возвращала фактический ответ сервера.

Логи: сырые ответы всех восьми систем сохранены — таблица ниже построена по ним, а не по памяти.

Вот что получилось.

Спор про llms.txt не сходится: и критики, и хайп меряют не тот слой - 3

Система

Балл

Что показала

ChatGPT 5.5

5.0 / 5.0

Прямые ссылки на docs, детали из браузинга, llms.txt — первый шаг плана. Нашёл реальный файл на developer-поддомене openai

Grok 4

5.0 / 5.0

Точные данные с ref-ссылками — признак реального браузинга. Прочитал файл целиком, честно отработал 404

Claude Sonnet 4.6

3.0 / 5.0

Читает по прямому запросу, сам не ходит. Называет llms.txt в плане, но не выполняет

DeepSeek V3

3.0 / 5.0

Реальных запросов не делает — честно говорит, что не может браузить, и реконструирует содержимое по памяти. llms.txt ставит первым шагом плана

Qwen 3.6 Plus

3.0 / 5.0

Браузить отказался: дал пример файла по памяти и разбор спецификации. В агентном плане ставит llms.txt первым

Gemini 3.5 Flash

2.0 / 5.0

Без полноценного браузинга. robots.txt первым, llms.txt лишь упомянул

Minimax M2.7

2.0 / 5.0

Реально зашёл, но спутал github llms.txt с репозиторием

Perplexity

1.5 / 5.0

Работает через поисковый индекс. Нашёл русские статьи через поиск, а не сам файл

Два вывода из этой таблицы важнее самих баллов.

Первый: файл при прямом запросе уверенно читают только двое — ChatGPT 5.5 и Grok 4. Это слой 2 в чистом виде. Логи фоновых краулеров его не покажут: запрос идёт в момент задачи, под другим user-agent, по воле пользователя. Хайп-лагерь чувствовал, что «что-то работает», но не мог показать где. Теперь видно где — в слое 2.

Второй, и он отрезвляет обе стороны: в этом прогоне (май 2026) ни одна из восьми систем не пошла к файлу сама, без запроса. Даже лидеры. «Агентное поведение» означало, что система включает /llms.txt в план первых шагов, когда её спрашивают про подход — кто-то ставит его первым, кто-то после robots.txt и главной. Реально же она открывала файл только при прямой команде «прочитай». Автоматического фонового чтения llms.txt в 2026 нет ни у кого. Это граница, за которую хайп заходить не должен.

И отдельный сюжет — Perplexity. Самая «поисковая» из AI-систем заняла последнее место по работе с llms.txt. Парадокс объясняется через те же три слоя: Perplexity в основном режиме отвечает из поискового индекса, а не делает прямой HTTP-запрос к файлу. Он видел страницы при индексации, но /llms.txt в реальном времени не открывает. Поисковая система проиграла агентным именно там, где, казалось бы, должна была выиграть. Потому что llms.txt — про агентный браузинг, а не про поиск.

Отдельная деталь из теста, которая говорит о зрелости подхода. На месте отсутствующего файла Anthropic и OpenAI отдают не сухой 404, а хайку. Claude Haiku 4.5 пишет «Hyperlink beckons — four-zero-four echoes back: nothing waits below», у OpenAI стих подписан «gpt-5.5». Мелочь, но показательная: компании уже думают о том, как их инфраструктуру читают и агенты, и люди — даже на странице ошибки.

Где llms.txt уже работает на практике: IDE-агенты

Если слой 2 у браузинговых чат-систем пока узкий и не автоматический, есть одно место, где файл читается рутинно и без всякого хайпа. Это среды разработки.

В моей практике и в agent-friendly документации это уже рабочий паттерн: документационные сайты всё чаще отдают /llms.txt, /llms-full.txt и .md-версии страниц, чтобы coding- и IDE-агентам (Cursor, Claude Code, Copilot, Windsurf, Cline, Aider) не приходилось парсить HTML с навигацией, баннерами и футером. Подтверждение видно у самих инфраструктурных игроков: Vercel держит и /llms.txt, и /llms-full.txt, и Markdown-версии страниц как machine-readable маршруты, а OpenAI — llms.txt и llms-full.txt в зоне developer-документации. Файл решает реальную боль: агенту нужен текст документации, а не вёрстка вокруг него.

Именно поэтому первыми llms.txt завели не маркетологи, а инфраструктурные компании. Посмотрите, что лежит у них и зачем.

Компания

URL

Что внутри

GitHub

github.com/llms.txt

API-карта: Versions, Languages, PageList, Article, Search, MCP-endpoints

Vercel

vercel.com/llms.txt

Навигация по CLI, AI SDK, docs; плюс llms-full.txt, Markdown Access, MCP-сервер

Stripe

stripe.com/llms.txt

Описание всех продуктов, ссылки на API-документацию

Linear

linear.app/llms.txt

Документация со ссылками на .md-версии страниц

Anthropic

docs.anthropic.com/llms.txt (редирект на platform.claude.com)

В зоне документации; на корневом anthropic.com — 404

OpenAI

developers.openai.com/api/llms.txt

Тоже в developer-зоне; openai.com/llms.txt отдаёт 404

Здесь же ответ на вопрос, который обычно обещают разобрать и не показывают: чем llms.txt отличается от llms-full.txt на практике.

llms.txt — короткая навигационная карта, 50–150 строк. H1 с названием, строка с описанием, разделы со ссылками. Агент с ограниченным контекстом читает её, чтобы понять, куда смотреть.

llms-full.txt — расширенная версия с полным контентом документации, до 500+ строк и больше. Агент, которому нужно глубоко работать с продуктом, тянет её целиком и держит документацию «в голове» во время сессии. Vercel и Anthropic держат оба файла именно для этого: краткая карта для ориентации, полная выгрузка — для работы.

Чтобы было предметно — вот минимальный рабочий llms.txt для продукта с документацией:

# Acme Analytics

> Платформа продуктовой аналитики для SaaS-команд. API, SDK и интеграции
> для отслеживания событий и воронок.

## Документация
- [Быстрый старт](https://acme.dev/docs/quickstart): установка SDK и первое событие за 5 минут
- [API Reference](https://acme.dev/docs/api): REST и GraphQL, аутентификация, лимиты
- [SDK](https://acme.dev/docs/sdk): клиенты для JS, Python, Go

## Интеграции
- [Webhooks](https://acme.dev/docs/webhooks): подписка на события в реальном времени
- [MCP-сервер](https://acme.dev/mcp): подключение агентов к данным аккаунта

## Дополнительно
- [Полная выгрузка](https://acme.dev/llms-full.txt): машиночитаемый текст всех разделов

Работают три вещи: H1 с названием продукта, строка с описанием для контекста за один взгляд, разделы с абсолютными ссылками и пояснением, что за каждой. Ссылка на llms-full.txt в конце — точка входа для агента, которому нужна не карта, а весь текст.

Деталь, которую видно по Anthropic и OpenAI: оба держат файл не на маркетинговом домене, а в зоне документации. openai.com/llms.txt отдаёт 404, а рабочий файл лежит на developers.openai.com/api/llms.txt. У Anthropic корневой anthropic.com/llms.txt тоже не отвечает файлом, а docs.anthropic.com/llms.txt редиректит на platform.claude.com/llms.txt. И там, и там agent-friendly слой вынесен в документацию и API, а не на лендинг — это не недосмотр, а логичное разделение. Если вашему сайту удобнее держать llms.txt на docs-поддомене, а не в корне, это валидный подход, подтверждённый практикой лидеров.

Что говорят вендоры на июнь 2026

Поведение систем — это одно, официальная позиция платформ — другое. На июнь 2026 она разнородная, и это само по себе диагноз зрелости стандарта.

Google сказал «нет» прямо. Гэри Иллис на Search Central Live в июле 2025 заявил, что Google не поддерживает llms.txt и не планирует. Позиция не сдвинулась. Для AI Overviews и AI Mode файл не нужен и не учитывается — там работают обычные сигналы: индексируемость, возможность показать сниппет, качество контента. Любой, кто продаёт llms.txt как способ попасть в Google AI Overviews, продаёт воздух.

Anthropic — на другом полюсе, но без громких обещаний. Компания одной из первых внедрила llms.txt и llms-full.txt для своей документации, и по отчёту Presenc AI учитывает файл в retrieval-сценариях Claude. Это согласуется с моим тестом: Claude читает файл по прямому запросу, хоть и не ходит к нему сам. Официального обязательства автоматически читать чужие llms.txt Anthropic при этом не давала.

OpenAI занимает молчаливую середину. Официального заявления нет, но поведение наблюдаемо: ChatGPT с браузингом файл открывает и использует. При этом краулеры OpenAI при рутинном обходе /llms.txt не запрашивают — снова та же развилка между слоем 1 и слоем 2.

Формального стандарта по-прежнему нет. Спецификацию ведёт сообщество вокруг llmstxt.org, идею в 2024 предложил Джереми Ховард из Answer.AI. Стандартизацию через IETF обсуждали, но к середине 2026 не выпустили. Единственный обязательный элемент по спеке — H1 с названием. Всё остальное, включая структуру разделов, — рекомендация, а не требование. Это важно держать в голове, когда кто-то говорит про «обязательность» файла.

Картина по вендорам складывается такая: один отказался, один поддерживает в узком сценарии, один молчит и тихо использует, стандарта нет. Так выглядит ранний стандарт в зоне неопределённости — без консенсуса платформ и без гарантий, что завтра поведение не сдвинется.

Кому внедрять, кому ждать — и почему «для видимости» это миф

Теперь практический вопрос: ставить или нет. Ответ зависит от того, кто к вам ходит — агенты или люди из обычного поиска.

Сначала сниму главное возражение, которое здесь напрашивается. «IDE-агенты читают llms.txt — но это инструмент для разработчиков, а не видимость в поиске. Маркетологу всё равно бесполезно». Возражение верное по сути, и я его не оспариваю. llms.txt — не про маркетинговую видимость и не про позиции. Это навигационный слой для продуктово-агентного сценария. Если ваш сайт — лендинг услуги, к которому AI-агенты не ходят разбираться руками, файл вам почти ничего не даёт. Завести можно за полчаса «для галочки», но точкой роста он не станет.

Где файл оправдан, а где нет:

Кому

Приоритет

Почему

SaaS, DevTools, API-продукты

Сейчас

Агенты активно работают с этими сайтами. ChatGPT и Grok уже читают их файлы

Документация, технические базы знаний

Сейчас

IDE-агенты тянут /llms.txt и llms-full.txt штатно. Прямая польза

Агентства и консультанты с AI-аудиторией

Можно

Низкий порог, релевантно аудитории, которая сама сидит в AI-инструментах

Контентные медиа, блоги

Опционально

Агентные сценарии есть, но редки. ROI зависит от аудитории

E-commerce, локальный бизнес

Подождать

Агентный трафик минимален. Schema.org и техничка дадут больше

Корпоративный сайт без продукта/API

Низкий

Агентные сценарии нетипичны. Файл «для галочки», не более

И ещё одно, что важнее самого файла. llms.txt не существует в вакууме — это верхний слой стека. Если у вас нет корректного robots.txt, нет sitemap.xml, нет Schema.org на страницах — начинать надо с них. Эти слои дают больший и измеримый эффект. llms.txt добавляется поверх, не вместо. Поставить навигационную карту для агентов на сайт, который сам по себе невидим для поиска, — значит решать пятую задачу, не решив первую.

llms.txt — это только первый шаг. Что дальше

Полезно смотреть на файл не как на финальную галочку, а как на первый шаг в более крупной перестройке. Дуэйн Форрестер сформулировал это точно: llms.txt — только первый шаг, дальше начинается архитектура.

Логика такая. Сначала вы отдаёте агенту навигационную карту — это llms.txt. Потом отдаёте чистый машиночитаемый контент — .md-версии страниц без HTML-шума, на которые карта и ссылается. Потом даёте не просто читать, а действовать — через MCP-серверы и OpenAPI, чтобы агент не пересказывал ваш сайт, а работал с вашим API. Vercel и GitHub уже прошли этот путь: навигационный файл, Markdown Access, MCP-сервер в связке.

Я бы не называл это «будущим» — это уже происходит на инфраструктурных проектах. Для остальных это ориентир: если агентный веб для вашего продукта реален, llms.txt — не цель, а вход в более серьёзную работу с машиночитаемым слоем сайта.

Вывод

Спор «бесполезен или +60%» неразрешим, пока обе стороны меряют разные слои и называют это одним словом. Разведите механизмы — и противоречие исчезает.

Критики правы про фоновые краулеры: в логах к /llms.txt почти никто не ходит, 0,1% у OtterlyAI это закрывает. Хайп-лагерь нащупал реальный эффект, но в неправильном месте: файл читают не фоном, а в агентном браузинге реального времени, и пока только две системы из восьми делают это уверенно, ни одна — без запроса. На практике файл уже работает у coding- и IDE-агентов: для документации и API это рабочий инструмент уже сегодня.

llms.txt — не SEO-хак, не сигнал ранжирования и не путь в Google AI Overviews. Это узкий навигационный слой для агентного и IDE-веба. Для SaaS, документации и devtools я бы добавлял файл как дешёвый слой совместимости с агентами — не как канал роста, а как инфраструктурную гигиену. Для лендинга или локального бизнеса — сначала robots.txt, sitemap.xml и Schema.org, а файл потом и без иллюзий.

У файла узкая, но реальная область применения. Вся путаница в споре шла от того, что эту область никто не очертил.

FAQ

Нужен ли llms.txt для попадания в Google AI Overviews? Нет. Google официально не поддерживает файл — это подтвердил Гэри Иллис на Search Central Live в июле 2025. Для AI Overviews и AI Mode работают обычные сигналы: индексируемость, возможность показать сниппет, качество контента. llms.txt решает другую задачу — навигацию для агентов.

ChatGPT и Grok читают llms.txt сами, без запроса? Нет. В моём тесте ни одна из восьми систем не пошла к файлу по своей инициативе. ChatGPT 5.5 и Grok 4 читают его при прямом запросе. В агентном сценарии файл попадает в план, но не всегда первым шагом: ChatGPT ставит его первым, Grok и часть других — после robots.txt и главной. Фонового автоматического чтения нет ни у кого.

Если логи показывают 0,1% обращений, зачем вообще ставить файл? 0,1% — это слой фоновых краулеров, где файл и не должен работать. Его слой — агентный браузинг в реальном времени и IDE-агенты, которые в эти логи не попадают: другой user-agent, запрос по воле пользователя. Для SaaS и документации эффект реальный, просто не виден в краулинговых логах.

Чем llms.txt отличается от llms-full.txt? llms.txt — короткая навигационная карта, 50–150 строк: название, описание, разделы со ссылками. llms-full.txt — полная выгрузка документации, 500+ строк, чтобы агент держал её целиком во время сессии. Краткая карта — для ориентации, полная — для глубокой работы. Vercel и Anthropic держат оба.

Что обязательно в файле по спецификации? Единственный обязательный элемент по спецификации llmstxt.org — H1 с названием сайта или проекта. Строка с описанием технически необязательна, но без неё агенту сложнее понять контекст за один взгляд. Разделы со ссылками — рекомендация, не требование.


Источники

Автор: Staurus

Источник