GEO и AI-поиск 12 мин чтения

llms.txt: новый стандарт для нейросетей — что это и как сделать

llms.txt — это карта сайта, написанная для нейросетей: кто вы, что у вас есть и как вас цитировать. Показываю на примере своего сайта, как устроен файл, чем отличается от robots.txt и sitemap и как его внедрить.

llms.txtGEOAI-поискнейросетистандарты

Коротко (TL;DR)

  • llms.txt — это текстовый файл в формате Markdown, который кладут в корень сайта (адрес /llms.txt) и в котором владелец сайта простым языком объясняет нейросетям, что у него за проект и какие страницы читать в первую очередь.
  • Это не robots.txt и не sitemap.xml. robots.txt разрешает или запрещает обход, sitemap.xml перечисляет все URL для поисковых роботов, а llms.txt — это понятная LLM-моделям «карта смысла»: курированный список самых важных ссылок с описаниями.
  • Стандарт предложил Джереми Говард (Answer.AI) в сентябре 2024 года. Он пока неофициальный, но быстро растёт: файл уже выкладывают Anthropic, Stripe, Cloudflare, Zapier, Vercel и тысячи других сайтов.
  • Сделать файл — дело 30–60 минут: один H1 с названием, цитата-описание через знак больше, и несколько разделов H2 со списками ссылок «название — короткое пояснение». Никакого кода, только текст.
  • Я сделал llms.txt на chimitdorzhi.tech и в этой статье показываю готовый пример, разбираю синтаксис, частые ошибки и способы проверить, что файл валиден. Посмотреть мой llms.txt.

За последний год ко мне всё чаще приходят с вопросом: «Чимитдоржи, я слышал про какой-то llms.txt — это вообще нужно или очередной хайп?» Отвечаю честно и из практики. Я сделал llms.txt на собственном сайте chimitdorzhi.tech, внедрял его клиентам и наблюдал, как файл влияет на то, как нейросети «понимают» бизнес. В этой статье разбираю стандарт по косточкам: что это, кто его читает, как устроен синтаксис, даю готовый пример, который можно скопировать и адаптировать, и показываю, как внедрить и проверить файл за один вечер. Без воды и без обещаний волшебного трафика — только то, что реально работает в 2026 году.

Что такое llms.txt

llms.txt — это простой текстовый файл в формате Markdown, который размещается в корне сайта по адресу вида https://вашсайт.ру/llms.txt. Его задача — дать большим языковым моделям (LLM, large language models, отсюда и название) короткую, понятную и структурированную «выжимку» о вашем сайте: чем вы занимаетесь, какие у вас есть ключевые страницы, документация, услуги, и куда модели стоит заглянуть, чтобы дать пользователю точный ответ про вас.

Идею предложил Джереми Говард — известный в мире машинного обучения человек, сооснователь fast.ai и компании Answer.AI. Он опубликовал предложение в сентябре 2024 года. Логика простая. Обычная веб-страница для нейросети — это каша из навигационных меню, баннеров, всплывающих окон, рекламы, скриптов и JavaScript-разметки. Модель тратит «внимание» и токены на то, чтобы продраться сквозь весь этот шум к сути. А у языковых моделей есть жёсткий лимит контекста — окно, в которое помещается ограниченное число токенов. llms.txt решает проблему в лоб: вы сами, человеческими словами, говорите модели «вот главное, читай отсюда».

Важно сразу зафиксировать: формат — именно Markdown, а не произвольный текст и не HTML. Это сделано намеренно. Markdown одновременно легко читается человеком и идеально парсится машиной: заголовки, списки, ссылки и цитаты имеют чёткую структуру. Языковые модели обучены на гигантских объёмах Markdown (вся техническая документация, README на GitHub, статьи), поэтому такой формат для них «родной». Файл должен быть валидным Markdown, который модель может разобрать без ошибок.

Ещё одна деталь, которую часто упускают. У стандарта есть «старший брат» — файл llms-full.txt. Если llms.txt это оглавление и карта, то llms-full.txt — это уже полный текст ключевых страниц, собранный в один большой файл, чтобы модель могла прочитать всё содержимое разом, не ходя по ссылкам. Для небольшого сайта обычно достаточно одного llms.txt. Для крупной документации (как у Stripe или Anthropic) имеет смысл делать оба. В этой статье я в основном про базовый llms.txt — с него начинают все.

llms.txt — это инициатива сообщества, а не официальный стандарт W3C или IETF. Никто не обязан его поддерживать. Но именно так в вебе и рождались многие стандарты: robots.txt тоже начинался как «договорённость джентльменов» в 1994 году и стал де-факто нормой. llms.txt идёт тем же путём, и идёт быстро.

Зачем он нужен и кто его читает

Давайте честно: зачем тратить вечер на текстовый файл, который, может быть, кто-то прочитает. Я разложу мотивацию по полочкам, потому что без понимания «зачем» внедрение превращается в карго-культ.

Первое и главное — мы живём в эпоху, когда люди всё чаще получают ответы не из синей ссылки в Google или Яндексе, а прямо из чата с нейросетью. Пользователь спрашивает ChatGPT, Claude, Perplexity или Алису «кто в Бурятии делает Telegram-ботов для бизнеса» — и модель формирует ответ, опираясь на то, что она знает и что нашла. Если ваш сайт для модели — непрозрачная каша, вы рискуете в этот ответ не попасть или попасть с искажениями. Это новая дисциплина, я подробно писал про неё в статье что такое GEO (Generative Engine Optimization — оптимизация под генеративные движки). llms.txt — один из инструментов GEO.

Второе — точность. Когда модель цитирует ваш бизнес, ошибки бьют по репутации. Неверная цена, устаревшая услуга, перепутанный город. Курированный llms.txt снижает риск: вы прямым текстом задаёте, что про вас правда и где это написано. Это не гарантия, но это сильный сигнал.

Третье — экономия ресурса модели и качество ответа. Чем меньше модели нужно «гадать» и продираться сквозь шум, тем выше шанс, что она даст про вас корректный и полный ответ. Вы фактически делаете её работу проще, а себе — выгоднее.

Теперь к вопросу «кто это вообще читает». Тут нужна предельная честность, потому что в интернете полно маркетингового вранья на эту тему. Состояние дел на 2026 год такое:

  • Инструменты разработчиков и AI-агенты — уже активно используют llms.txt. Например, среды разработки с ИИ (Cursor, и подобные), плагины документации, фреймворки для построения агентов. Это самый зрелый сценарий: разработчик подключает вашу документацию к своему ассистенту, и тот первым делом смотрит llms.txt.
  • Поисковые системы с ИИ и ассистенты — официально единого подтверждения, что все они читают llms.txt при ответе пользователю, на сегодня нет. Крупные вендоры осторожны в формулировках. Поэтому относиться к файлу как к «гарантии попадания в ответ ChatGPT» нельзя — это было бы враньём.
  • Парсеры и сервисы подготовки данных — многие конвертеры «сайт в Markdown для LLM» уже умеют находить и приоритизировать llms.txt.

Мой вывод после практики: llms.txt — это инвестиция с асимметричным риском. Сделать файл стоит час времени и ноль рублей, а потенциальная выгода растёт по мере того, как всё больше систем начинают его учитывать. Это как заранее поставить табличку с адресом на доме, который пока никто не ищет, но скоро будут. Не панацея, но разумный шаг для любого, кто относится к присутствию в ИИ-выдаче всерьёз.

Не верьте обещаниям «поставь llms.txt и попадёшь в топ ChatGPT». Файл — это сигнал, а не кнопка. Он помогает моделям точнее понять сайт, но не управляет их выдачей. Любой, кто гарантирует попадание в ответы нейросетей за счёт одного файла, продаёт вам иллюзию.

Структура файла: разделы и синтаксис

Хорошая новость: структура llms.txt предельно простая и регламентированная. Это не свободное сочинение, а конкретный набор элементов, которые идут в строгом порядке. Разберём по частям.

1. Заголовок H1 — название проекта (обязательно). Самая первая строка файла — это заголовок первого уровня в Markdown, то есть одна решётка, пробел и название. Например: # Чимитдоржи Дарижапов — IT-консультант. Это единственный обязательный элемент всего файла. H1 в документе должен быть ровно один.

2. Блок-цитата с кратким описанием (настоятельно рекомендуется). Сразу под названием идёт короткая выжимка сути, оформленная как цитата — строка начинается со знака «больше» и пробела. Здесь в одном-двух предложениях вы говорите, что это за сайт и для кого. Эту цитату модель воспринимает как главный контекст.

3. Свободный текст-пояснение (по желанию). После цитаты можно добавить несколько абзацев обычного Markdown без заголовков — детали, важные оговорки, что искать и чего не искать. Главное правило: здесь не должно быть заголовков уровня H2, иначе они смешаются с разделами ссылок.

4. Разделы H2 со списками ссылок (основное тело). Дальше идут смысловые блоки, каждый начинается с заголовка второго уровня (две решётки). Внутри каждого раздела — маркированный список. Каждый пункт списка устроен так: ссылка в Markdown-формате, затем двоеточие или тире и короткое пояснение, зачем эта ссылка. То есть квадратные скобки с названием, круглые скобки с URL, потом тире и описание.

5. Особый раздел Optional (по желанию). Есть зарезервированное имя раздела — ## Optional. Ссылки в нём модель может пропустить, если у неё мало места в контексте. Сюда складывают второстепенное: архив, юридические страницы, всё что «хорошо бы, но не критично».

Главное, что нужно понять про синтаксис: каждая ссылка должна иметь человеческое описание. Голый список URL без пояснений почти бесполезен — именно описания дают модели понять, что за чем стоит и куда идти за конкретной информацией. Описание должно быть коротким (одна строка), но содержательным.

Совет из практики: думайте о llms.txt как о том, что бы вы сказали новому сотруднику в первый день. «Вот чем мы занимаемся (цитата), вот список услуг и где про них почитать (раздел), вот блог с разбором тем (раздел), вот контакты (раздел)». Если файл читается как внятный устный пересказ сайта — вы всё сделали правильно.

Готовый пример llms.txt

Теория без примера — пустой звук. Ниже — реальный по структуре llms.txt, близкий к тому, что стоит у меня на сайте. Можете взять его за шаблон, заменить названия, ссылки и описания на свои. Обратите внимание на порядок: сначала H1, потом цитата, потом пара абзацев пояснения, потом разделы H2 со списками, и в конце — раздел Optional.

# Чимитдоржи Дарижапов — IT-консультант

> IT-консультант и разработчик из Бурятии. Помогаю бизнесу в России внедрять
> нейросети, делать сайты, Telegram- и VK-ботов, MAX мини-приложения,
> RAG-системы и автоматизацию. Простым языком, под задачи реального бизнеса.

Этот сайт — личный блог и витрина услуг. Здесь экспертные статьи про ИИ,
GEO-оптимизацию, разработку и цифровизацию для предпринимателей в РФ, а также
описание услуг и способы связи. Цены и услуги ориентированы на российский рынок.

## Услуги

- [Разработка сайтов](https://chimitdorzhi.tech/services/sites/) — лендинги, корпоративные сайты, интернет-магазины под ключ
- [Telegram- и VK-боты](https://chimitdorzhi.tech/services/bots/) — чат-боты, мини-приложения, автоматизация продаж
- [Внедрение нейросетей](https://chimitdorzhi.tech/services/ai/) — RAG-системы, AI-агенты, автоматизация процессов
- [GEO и SEO](https://chimitdorzhi.tech/services/geo/) — оптимизация под нейросети и поисковики

## Блог: ключевые статьи

- [Что такое GEO-оптимизация](https://chimitdorzhi.tech/blog/geo-optimizaciya-chto-eto-2026/) — как попасть в ответы нейросетей
- [Чек-лист GEO из 30 пунктов](https://chimitdorzhi.tech/blog/geo-chek-list-30-punktov-2026/) — пошаговая оптимизация под ИИ
- [RAG-системы для бизнеса](https://chimitdorzhi.tech/blog/rag-systems/) — как сделать ИИ, отвечающий по вашей базе знаний
- [Сколько стоит сайт](https://chimitdorzhi.tech/blog/skolko-stoit-sayt/) — разбор цен на разработку в РФ

## О проекте

- [Обо мне](https://chimitdorzhi.tech/about/) — опыт, сертификации, подход к работе
- [Словарь терминов](https://chimitdorzhi.tech/slovar/) — простые объяснения IT- и AI-понятий
- [Контакты](https://chimitdorzhi.tech/contacts/) — как со мной связаться

## Optional

- [Архив блога](https://chimitdorzhi.tech/blog/) — полный список всех статей
- [Политика конфиденциальности](https://chimitdorzhi.tech/privacy/) — обработка персональных данных

Разберём, почему он устроен именно так. H1 сразу даёт модели имя и роль — «IT-консультант», без вариантов толкования. Цитата в трёх строках отвечает на вопросы «кто, что делает, для кого, где» — это самый ценный для модели абзац. Затем два абзаца контекста уточняют характер сайта и важную оговорку про российский рынок. Разделы сгруппированы по смыслу: услуги, ключевые статьи, информация о проекте. Каждая ссылка снабжена описанием — модель понимает, куда идти за ценами, куда за разбором GEO, куда за контактами. И в конце Optional с тем, что не критично для понимания сути.

Обратите внимание на одну техническую тонкость в примере выше: знак «больше» в цитатах в коде показан как HTML-сущность, потому что так требует разметка этой страницы. В вашем настоящем файле llms.txt вы пишете обычный знак «больше» с клавиатуры — никаких сущностей, чистый Markdown.

Как внедрить и проверить

Перейдём к рукам. Внедрение делится на три шага: написать файл, разместить его в корне сайта, проверить доступность и валидность.

Шаг 1. Написать файл. Откройте любой текстовый редактор — Блокнот, VS Code, что угодно, что сохраняет чистый текст. Главное — не Word, потому что он подсунет невидимое форматирование. Сохраните файл строго с именем llms.txt в кодировке UTF-8. Возьмите мой пример выше как каркас, замените содержимое на своё. На небольшой сайт уходит 30–60 минут. Не гонитесь за объёмом: 10–20 хорошо описанных ссылок лучше, чем сто без пояснений.

Шаг 2. Разместить в корне. Файл должен открываться по адресу https://вашсайт.ру/llms.txt — именно в корне, не в подпапке. Как именно его туда положить, зависит от движка:

  • Сайт на своём сервере или хостинге — просто загрузите файл в корневую папку сайта (обычно public_html или www) через FTP или панель управления хостингом.
  • Next.js, Nuxt и подобные фреймворки — положите llms.txt в папку public (или static), при сборке он попадёт в корень.
  • WordPress — загрузите файл в корневую директорию через FTP или файловый менеджер хостинга, рядом с robots.txt.
  • Tilda, конструкторы сайтов — тут сложнее: не все конструкторы дают доступ к корню. Если доступа нет, размещение llms.txt может быть недоступно — это ограничение платформы.

Шаг 3. Проверить. Это критичный и часто пропускаемый шаг. Проверка состоит из нескольких пунктов:

  • Доступность. Откройте https://вашсайт.ру/llms.txt в браузере. Файл должен отдаваться с кодом ответа 200 и показываться как обычный текст. Если видите 404 — файл не в корне или назван неправильно.
  • Тип содержимого. Файл должен отдаваться как text/plain или text/markdown. Если сервер отдаёт его как HTML или принудительно скачивает — поправьте настройки MIME-типов.
  • Валидность Markdown. Скопируйте содержимое в любой Markdown-просмотрщик (их полно онлайн) и убедитесь, что заголовки, списки и ссылки рендерятся корректно. Один H1, дальше H2, ссылки кликаются.
  • Рабочие ссылки. Пройдитесь по всем URL в файле — каждая должна открываться и вести туда, куда обещает описание. Битая ссылка в llms.txt хуже её отсутствия.
  • Живой тест. Скормите содержимое файла любой нейросети с вопросом «опиши, чем занимается этот сайт, по этому llms.txt». Если ответ точный — файл работает как задумано. Если модель путается — упрощайте формулировки.

Дальше — поддержка. llms.txt не статуя: запустили новую услугу, написали важную статью, сменили контакты — обновите файл. Я держу его в одном ритме с обновлением sitemap. Раз в квартал имеет смысл пройтись по ссылкам и описаниям заново.

llms.txt никак не конфликтует с robots.txt, sitemap.xml и обычным SEO. Это отдельный, дополнительный слой. Вы ничего не теряете, добавив его, и не ломаете существующую индексацию. Поэтому внедрять его можно спокойно, без страха «сломать поиск».

Чтобы окончательно развести три файла, которые часто путают, привожу таблицу. Это самый частый вопрос, который мне задают: «а чем это отличается от sitemap, у меня же уже есть».

Параметрllms.txtrobots.txtsitemap.xml
Для когоЯзыковые модели, AI-агентыПоисковые роботы, краулерыПоисковые роботы
НазначениеОбъяснить смысл сайта и дать карту главногоРазрешить или запретить обход страницПеречислить все URL для индексации
ФорматMarkdown (читаемый текст)Свой простой синтаксис правилXML (машинный)
РасположениеКорень сайта, /llms.txtКорень сайта, /robots.txtОбычно корень, /sitemap.xml
КурированиеДа, вручную выбираете главноеНет, только правила доступаНет, обычно генерируется автоматически
Описания страницДа, ключевая частьНетНет, только URL и даты
Статус стандартаНеофициальный, растущийДе-факто с 1994 годаОфициальный, протокол sitemaps

Если коротко: robots.txt говорит «куда можно ходить», sitemap.xml говорит «вот все адреса», а llms.txt говорит «вот что тут важно и зачем». Три разных задачи, три разных файла. Они не заменяют, а дополняют друг друга.

Частые ошибки

Я насмотрелся на десятки чужих llms.txt и собрал коллекцию граблей. Вот те, на которые наступают чаще всего.

Ошибка 1. Дамп всех ссылок без описаний. Самая массовая. Человек выгружает sitemap, вставляет двести URL в файл и думает, что готово. Это бесполезно: без описаний модель не понимает приоритетов и смысла. llms.txt — про курирование, а не про полноту. Лучше 15 ссылок с пояснениями, чем 200 голых.

Ошибка 2. HTML вместо Markdown. Люди по привычке вставляют теги или копируют кусок страницы с разметкой. Файл должен быть чистым Markdown. Никаких тегов, скриптов, стилей.

Ошибка 3. Несколько заголовков H1. По стандарту H1 ровно один — это название проекта. Если вы расставили решётки как попало, структура ломается, и модель не понимает иерархию.

Ошибка 4. Файл не в корне или с опечаткой в имени. llmstxt.txt, llms.md, /docs/llms.txt — всё это мимо. Только llms.txt и только в корне сайта. Проверяйте адрес в браузере.

Ошибка 5. Битые и устаревшие ссылки. Сайт переехал, страницу удалили, а в llms.txt всё по-старому. Модель пойдёт по мёртвой ссылке и сделает неверный вывод. Сверяйте ссылки при каждом обновлении.

Ошибка 6. Маркетинговая вода вместо фактов. «Мы лучшие на рынке, лидеры индустрии, выбор номер один» — для модели это шум без информации. Пишите по делу: что вы делаете, для кого, где это найти. Конкретика всегда выигрывает у пафоса, и это касается не только llms.txt.

Ошибка 7. Сделать и забыть. Файл, который не обновлялся год, постепенно расходится с реальностью сайта. Поставьте llms.txt в один список с другими файлами, которые вы держите в актуальном состоянии.

Лучшая проверка качества файла — прочитать его вслух. Если получается связный, осмысленный рассказ о вашем сайте — отлично. Если это похоже на сухой список из выгрузки базы данных — переписывайте. llms.txt пишется для понимания, а не для галочки.

Частые вопросы

llms.txt реально влияет на то, как меня показывают нейросети? Влияет на понимание сайта моделями и инструментами, которые уже умеют его читать (особенно AI-агенты и среды разработки). Но это сигнал, а не рычаг управления выдачей. Гарантировать попадание в ответы ChatGPT или Алисы за счёт одного файла нельзя — кто обещает обратное, тот лукавит. Это часть более широкой работы по GEO, про которую у меня есть отдельный чек-лист GEO из 30 пунктов.

Чем llms.txt отличается от sitemap.xml, если у меня уже есть карта сайта? sitemap.xml — машинный список всех URL для поисковых роботов, без смысла и приоритетов. llms.txt — курированная карта главного с человеческими описаниями для языковых моделей. Разные форматы, разная аудитория, разные задачи. Одно не заменяет другое — держите оба.

Нужен ли llms.txt маленькому сайту или лендингу? Польза тем выше, чем больше у вас осмысленного контента: блог, документация, каталог услуг. Для одностраничного лендинга эффект минимальный, но и вреда ноль, а файл делается за 15 минут. Я бы сделал — это дешёвая страховка на будущее, когда стандарт станут учитывать шире.

Можно ли запретить нейросетям использовать мой контент через llms.txt? Нет, это не его задача. llms.txt помогает моделям понять сайт, а не блокирует доступ. Для ограничений по обходу есть robots.txt и серверные настройки. Это два разных инструмента: один приглашает и направляет, другой запрещает.

На каком языке писать llms.txt, если сайт русскоязычный? На языке вашего контента и аудитории. Для русского сайта пишите по-русски — модели прекрасно работают с русским Markdown. Описания должны быть на том же языке, что и страницы, на которые они ведут.

Где посмотреть живой пример? У меня — по адресу мой llms.txt. Можете открыть, посмотреть структуру и взять за основу. Если непонятны термины из статьи — загляните в словарь, я там простым языком разбираю IT- и AI-понятия. А узнать, кто я и почему пишу про это из практики, можно на странице обо мне.

Услуги по теме

Чем помогу с GEO и продвижением в ИИ

  • GEO-аудит: готовность сайта к ответам ИИ
  • Настройка llms.txt и robots.txt под AI-краулеры
  • Schema: Person, Organization, FAQ, Speakable
  • Мониторинг упоминаний бренда в нейросетях
  • SEO + GEO под Яндекс и ИИ-поиск
Написать в Telegram

Нужен профессиональный аудит 152-ФЗ?

Отчёт за 1–3 дня, устранение нарушений под ключ. От 5 000 ₽.

Готовые решения под ключ 211 готовых IT-решений для бизнеса Автоматизация, боты, AI, 152-ФЗ и платформы · бесплатная консультация Смотреть каталог