SEO-основы

Индексация

indexation

Индексация (indexation) — это процесс добавления страниц сайта в базу данных поисковика. После индексации страница может появляться в результатах поиска по запросам пользователей.

Индексация (indexation) — это процесс, при котором поисковая система добавляет страницы сайта в свою базу данных. Простыми словами, до индексации страницы для Google и Яндекса не существует — её нельзя найти по запросу. Сам термин закрепился в SEO ещё в конце 1990-х, когда AltaVista и ранний Google запустили промышленный краулинг веба.

В 2018 году Google перешёл на mobile-first indexing: робот Googlebot Smartphone стал основным сканером для всех новых сайтов. Что это значит на практике — без индексации органическое продвижение невозможно, поэтому отчёт «Страницы» в Search Console сегодня открывают чаще, чем позиции по ключам.

§ 01Как работает индексация

Индексация проходит в три шага: обнаружение URL (через sitemap.xml или ссылки), краулинг роботом Googlebot и обработка контента с записью в индекс. Простыми словами, краулер скачивает HTML, рендерит JavaScript через Web Rendering Service на базе Chromium и сохраняет токены, теги, ссылки. По данным Google за 2023 год, в индекс попадает не каждая просканированная страница — фильтр качества отсеивает дубли и тонкий контент.

§ 02Зачем нужна индексация сайта

Без индексации страницы её нет в выдаче — значит, нет органического трафика, лидов и продаж. Что это значит для бизнеса: новый материал блога, опубликованный сегодня, начнёт приносить визиты только после посещения Googlebot и записи в индекс. У крупных СМИ это занимает минуты, у молодого сайта — от 3 дней до нескольких недель. Джон Мюллер из Google не раз повторял: индексация не гарантирована, поисковик решает сам.

Кейс e-commerce

проиндексировано 12k → 47k — Интернет-магазин одежды на Shopify закрыл фасетные URL через robots.txt и настроил динамический sitemap. За 4 месяца в индекс Google вошло 47k страниц из 52k. Контроль через Search Console Coverage и Ahrefs.

До и после

органика +38% за 5 мес — B2B SaaS-платформа для HR убрала noindex с блога и добавила внутреннюю перелинковку из 6 хабовых страниц. Доля проиндексированных URL выросла с 41% до 92% за 5 месяцев. Замер через GSC Pages и GA4 Acquisition.

§ 03Как проверить и ускорить индексацию

Базовая проверка — оператор site:example.com/page в Google. Точные данные даёт Google Search Console: отчёт «Страницы» показывает статусы «Проиндексировано», «Обнаружено — не проиндексировано», «Просканировано — не проиндексировано». Для ускорения используют инструмент «Проверка URL» с кнопкой «Запросить индексирование», свежий sitemap.xml и внутренние ссылки с трафиковых страниц. В Яндексе аналог — IndexNow и раздел «Переобход страниц» в Вебмастере.

§ 04Подводные камни индексации

Главные блокировщики: директива noindex в meta robots, запрет в robots.txt, неправильный canonical, ответ сервера 4xx или 5xx, soft 404. После March 2024 Core Update Google стал жёстче выкидывать из индекса страницы с малой ценностью — массовый AI-контент попадает под раздачу. Краулинговый бюджет (crawl budget) расходуется впустую на дублях фасетной навигации интернет-магазинов, поэтому фильтры товаров закрывают через canonical или параметры в GSC.

Частые ошибки
01
Подмена индексации сканированием страниц. Считают, что если Googlebot зашёл на URL — он уже в индексе. На деле краулинг и индексация — разные этапы: страница может сканироваться месяцами и не попадать в выдачу. Трафик не растёт, бюджет на контент уходит впустую. Как правильно: Разделяйте отчёты «Просканировано» и «Проиндексировано» в Search Console. Сверяйте обе вкладки перед выводами о видимости.
02
Закрытие дублей через robots.txt вместо canonical. Запрет в robots.txt не удаляет URL из индекса — он лишь блокирует обход, и страница висит без сниппета. John Mueller повторял это в 2021–2023: для деиндексации нужен noindex или 301. Доверие к структуре сайта падает. Как правильно: Используйте noindex или rel=canonical для дублей, а robots.txt оставьте для технических разделов. Проверяйте результат через URL Inspection.
03
Замер индексации через site: вместо Search Console. Оператор site:domain.ru показывает приблизительное число и часто врёт на 30–50%. Реальные данные — только в отчёте «Страницы» GSC, где видно статус каждого URL и причину исключения. Решения по такой метрике ведут к ложным выводам и потере позиций. Как правильно: Замеряйте индексацию по отчёту Pages в Search Console и выгрузке Indexing API. Сравнивайте с картой sitemap.xml раз в неделю.
Часто спрашивают

Индексация сайта — частые вопросы

Индексация — что это простыми словами?

+

Индексация — это занесение страницы в базу поисковика, после чего она становится доступна в выдаче. Робот (например, Googlebot или YandexBot) обходит URL, считывает контент и сохраняет копию в индексе. Без этого шага сайт не появится в результатах поиска, даже если он идеально оптимизирован.

Сканирование (crawling) — это обход страниц роботом, а добавление в индекс происходит уже после анализа содержимого. URL может быть просканирован, но не попасть в базу: например, из-за тега noindex, дублей или низкого качества. В Search Console такие случаи отображаются в отчёте «Просканировано, но не проиндексировано».

Обычно от 1 до 14 дней в Google и 1–4 недели в Яндексе. Скорость зависит от авторитета домена, частоты обновлений и наличия XML-карты. Ускорить помогают инструменты Google Indexing API, переобход в Яндекс.Вебмастере и внутренняя перелинковка с часто обновляемых страниц.

Самый точный способ — отчёт «Покрытие» в Google Search Console и раздел «Индексирование» в Яндекс.Вебмастере. Быстрая проверка через оператор site:домен.ru/url в поисковике. Для массового аудита подойдут Screaming Frog, Netpeak Spider или сервис JetOctopus — они сверяют список URL с фактическим индексом.

Пять основных причин: запрет в robots.txt, мета-тег noindex, неканоническая версия (rel=canonical указывает на другой URL), дубли контента и низкое качество страницы. Также влияет краулинговый бюджет: на сайтах от 10 000 URL робот может просто не дойти до новых разделов без грамотной структуры и sitemap.xml.

Не нашли ответ?

Спросите Андрея Гусарова — отвечаю в течение 1-2 рабочих дней.

Нажимая, вы соглашаетесь с обработкой данных.