Написать в Telegram

Мы онлайн, ответим быстро

Как собрать семантическое ядро сайта: составление и кластеризация

Сбор семантического ядра сайта — первый шаг в любом SEO-проекте, без которого невозможно продвижение сайта. Кажется, что довольно просто обозначить список ключевых запросов, прогнать их через Вордстат и вот — семантика готова. На деле есть тонкости. Объемы запросов могут быть многотысячными, и тогда без автоматизации не обойтись. Без правильной группировки запросов, составления url и тегов уже на этапе структурирования сайта можно пойти по ложному пути. Здесь мы собрали все, что нужно знать о том, как правильно собрать семантику для сайта.

Что такое семантика и семантическое ядро

Семантика в SEO — это слова, или ключевые запросы в поисковых системах, которые по смыслу относятся к тематике вашего бизнеса и сайта. Если проще — это те слова, которые используют люди, когда ищут тот или иной товар или услугу.

Список ключевых слов называется семантическим ядром. Он нужен, чтобы проработать структуру сайта и контент страниц. Задача SEO-специалиста — собрать максимально полное семантическое ядро, чтобы учесть все возможные запросы потребителей. Используя правильно подобранные ключи, можно сделать сайт не только информативным для пользователей, но и удобным для ранжирования поисковыми роботами.
Смотри кейсы студентов, которые стали
SEO-специалистами

Откуда брать семантику

Как и где собирать семантику? Есть несколько источников:

  • Сервисы поисковых систем. Это максимально надежный источник. Поскольку в поисковых системах и продвигается сайт, на них нужно ориентироваться. Именно их данные самые релевантные и ценные. Обычно пользуются сервисом Яндекс.Wordstat. Он позволяет смотреть статистику запросов по разным периодам времени и регионам. Можно использовать и Google.Trends. Этот сервис менее популярен в России, так как, в отличие от Вордстата, дает не точную статистику запросов, а только общие тренды, динамику.

  • Сервисы парсинга поисковых систем. С их помощью можно автоматизировать работу с семантикой, что ценно, когда речь идет о тысячах запросов в семантическом ядре. Собственно, парсинг — это и есть автоматизированный сбор данных. Например, сервис A-Parser быстро расширяет семантику по подсказкам поисковых систем — он парсит те слова, которые поисковик предлагает сам, когда мы только начинаем вводить свой запрос.

  • Программы парсинга поисковых систем. Можно установить специальную программу-парсер для анализа данных поисковиков: ключевые запросы, поисковые подсказки, группировка и чистка фраз и многое другое. Одна из самых популярных программ — Key Collector.

  • Базы ключей. Это готовые сборники ключевых запросов. Вы вводите свою тематику и получаете готовый список слов и фраз. Этим инструментом удобно пользоваться для сбора длинных фраз, более 7 слов. Их нельзя собрать в Яндекс.Wordstat. Но ориентироваться только на этот инструмент нежелательно. Данные в этих базах актуализируются не часто, выдается много мусорных слов, качество сбора данных сомнительное.

  • Сайты конкурентов. Можно спарсить сайт конкурента и получить готовую структуру и семантику. Но этим методом лучше пользоваться только как дополнительным. Сбор семантики лучше начинать самостоятельно с нуля.

Дальше рассмотрим…..

Поиск маркеров

Сбор семантического ядра начинается с определения маркеров — поисковых запросов, которые лучше всего описывают тематику сайта. Например, для магазина зимней верхней одежды одним из маркеров будет «женский пуховик». Если проверить этот запрос в Яндекс.Wordstat, не только частотность разных словосочетаний с этим ключом, но и подбор похожих запросов. Скорее всего в качестве маркера нам также подойдет запрос «куртка зимняя женская».
Собирать маркеры можно вручную или автоматически. В каких случаях лучше пользоваться тем или иным способом:
Ручной сбор:
подходит для «мусорных» тематик. Например, запрос «масло» может относиться к разным категориям: масло машинное, сливочное, массажное и пр. Автоматический сбор даст нам много лишних запросов. Также вручную лучше собирать семантику в узких категориях, в которых мало запросов. Например, узкоспециализированное оборудование. В любом случае необходимо дополнять собственные списки маркеров проверкой в Яндекс.Wordstat — это поможет найти синонимичные запросы, о которых вы могли не догадаться.
Автоматизированный сбор:
когда тематика четко ограничена, как в нашем примере с женским пуховиком, или семантика очень обширна, нужно использовать специальные инструменты для ее сбора. Например, уже упомянутая программа Kelly Collector или сервис Rush Analytics. Парсить маркеры можно и в Вордстате, и среди поисковых подсказок, и на сайтах конкурентов.

Парсинг конкурентов

К конкурентам могут относиться не только ваши прямые конкуренты, но и крупные ритейлеры, маркетплейсы. Например, если вы производите бытовую технику, полезно будет посмотреть как работают ключевые интернет-магазины с семантикой в вашей категории.

Рекомендуем пользоваться программой Screaming Frog SEO Spider. Вы сможете спарсить сотни страниц сайта конкурента и посмотреть их структуру и набор тегов — title, description, h1.

Частотность запросов

Частотность показывает, сколько раз вводился в поисковике тот или иной запрос за определенный промежуток времени.
Бывают высокочастотные (ВЧ), среднечастотные (СЧ) и низкочастотные (НЧ) запросы. Важно понимать, что в разных категориях пороги значений частотности могут быть разные. Например, 1000 запросов в месяц в категории «зимние женские куртки» — это НЧ, а в категории «биометрические программные решения» — ВЧ.
Частотность запросов
  • Общая частота
    При вводе запроса «купить пальто» без каких-либо знаков Вордстат покажет все количество запросов, которые содержат эти слова в том или ином виде: в любых словоформах, с любым порядком слов, со всеми расширениями. Например, «покупка зимнего пальто в Москве» или «мужское пальто купить».
  • Точная частота
    Если тот же запрос ввести в кавычках («купить пальто»), то получим более точные данные: будут учитываться запросы с содержанием только этих слов в разных словоформах, но с сохранением частей речи. То есть уже не будут считать запросы типа «покупка пальто» или «купить женское пальто».
  • Уточненная частота
    Уточненная частота. Запрос в Вордстате имеет такой вид: «!купить !пальто». В показателе частоты будут считаться именно эти слова именно в такой словоформе, но с вариантами порядка слов.
  • Уточненная частота с фиксированным порядком слов
    Предыдущий вариант запроса нужно поставить в квадратные скобки: «[!купить !пальто]». Учитывается только конкретная фраза с заданной словоформой и заданным порядком слов.

Облако запросов

Семантическое ядро нужно максимально расширять. Помимо маркеров, есть еще хвосты запросов, длинные запросы и низкочастотные запросы. Полный перечень ключей называется «облако запросов». Пример длинного низкочастотного запроса для маркера «новостройки в москве»: «новостройки в москве от застройщика эконом класса рядом с метро».

Чтобы охватить всю возможную семантику, нужно использовать не только исходные маркеры, например, «ноутбук ASUS», но и его вариации — так называемые раскрытые маркеры: «ноутбук Асус», «купить ноутбук ASUS», «ноутбуки Асус цены», «продажа ноутбуков ASUS» и пр.

Собираем облако запросов уже привычными инструментами: Яндекс.Wordstat, парсинг подсказок в поисковых системах.

Весь полученный массив семантики нужно будет почистить по стоп-словам. Например, для разработки коммерческих страниц нерелевантны запросы со словами «отзыв» и «бесплатно». Все фразы, содержащие эти слова, нужно будет удалить.

Кластеризация запросов

Кластер — это группа поисковых запросов, объединенная по определенному признаку. Чтобы с полученным, как правило, довольно обширным семантическим ядром можно было работать, его нужно разделить на кластеры, или кластеризовать.

Можно заниматься кластеризацией вручную, но лучше все же использоваться специальные сервисы — кластеризаторы. Принцип их работы: выделить в одну группу ключевые запросы, по которым примерно одинаковый топ-10 выдач страниц в поисковиках. Например, по запросам «рабочая одежда» и «спецодежда» в топе выдач поисковика пять одних и тех же страниц. Значит, эти запросы войдут в один кластер.

Кластеризация бывает двух видов:
Soft-кластеризация
Берем один высокочастотный запрос и по нему сравниваем выдачу всех остальных запросов. Те, у которых в выдаче те же страницы, что и у основного запроса, попадают к нему в группу. Пороговое количество одинаковых страниц определяется индивидуально. Далее страницы, которые не попали в первую группу, кластеризуются по этому же принципу.

Такой тип кластеризации подходит для интернет-магазинов, агрегаторов и для информационных проектов.
Hard-кластеризация
Одинаковые url в выдаче должны быть у всех запросов в одной группе. То есть они все должны пересекаться между собой, а не только с одним частотным запросом.

Этот вид кластеризации используется для высококонкурентных ниш, где важна точность соответствия запросов. Например, в сфере услуг.

Фильтрация и чистка облака запросов

Этот этап можно проходит и до, и после кластеризации. Первым делом нужно отфильтровать все запросы с частотностью «0» и удалить их. Далее идет чистка по стоп-словам. Например, в категории «моторное масло» не должны попадаться какие-то другие запросы со словом «масло». Поэтому определяем стоп-слова: «сливочное», «для тела» и пр.

Стоп-слова можно начать выписывать уже на этапе сбора маркеров. Также, работая в Rush Analytics, можно сразу вбить стоп-слова, чтобы семантика подбиралась сразу с учетом ограничений.
Итоговый файл и схема семантики
Результат всех пройденных этапов — это итоговый Excel файл. В нем содержатся:
все запросы, разбитые по группам (кластерам);
показатели частотности для каждой группы запросов и для каждого отдельного запроса;
кластеры просортированы в порядке убывания суммарной частотности;
визуально выделены заголовки кластеров;
для каждой группы запросов сформированы: url, description, title, h1.
Пример: часть итоговой таблица с семантикой.
Пример: часть итоговой таблица с семантикой.
На основе полученного списка url страниц делается схема семантики. В ней отражаются «родительские» категории и то, как они разбиваются на более детальные запросы. В каждой категории есть свой набор ключевых тегов. В приведенном примере для группы «слитные купальники»: «недорогие», «большого размера», «с утяжкой на животе» и пр.
Пример: часть итоговой таблица с семантикой.
Пример схемы семантики.

Заключение

Собрать семантику для работы над сайтом не так сложно, если знать этапы процесса и инструменты, которые автоматизируют парсинг. Мы разобрали в статье весь путь и дали рекомендации сервисов и программ, которые вы можете использовать. Чтобы подытожить, даем целевую схему сбора семантического ядра:
Пример: часть итоговой таблица с семантикой.