Обсудить проект

Анализ n-грамм: как не тратить время на сбор минус-слов для контекстной рекламы

  • Контекст
  • 28 декабря 2023
  • 1109
  • 4 минуты

Большинство специалистов закладывают минусацию в ежедневную рутину. Это бесконечный процесс, так как нельзя минусовать абсолютно всё по одной простой причине. По данным Google, ежедневно около 15% (500 миллионов) от всех запросов являются уникальными и ни разу не встречались. Такой высокий процент сохраняется уже на протяжении 15 лет.

В конце концов, после долгих лет минусации и потери бюджета мы просто придем к лимиту по числу символов доступных для минус-фраз. В Яндексе это до 20 000 символов на уровне рекламной кампании (далее просто РК) и 4 000 символов на уровне каждой группы.

Это ежедневная рутина, которая отнимает много времени, а ведь его можно выделить на более важные вещи. Но что, если я скажу, что можно за один раз минусовать всю самую высокочастотную нецелевую семантику, отфильтровать ее по числу показов, кликов и расходу с помощью n-gram анализа и сразу «забить» все доступные символы на уровне групп и РК?

Пошаговый n-gram анализ

Давайте подробно разберем все по порядку:

Сначала выгружаем наши ключевые фразы. Это будет наш вайт-лист — самые целевые слова, которые уже есть в нашем кабинете. Проще всего сделать это в Директ Коммандере. Нажимаем на столбец с ключами.

Копируем и загружаем в таблицу Excel.

Нормализуем фразы

С помощью платной надстройки SemTools в Excel проводим ряд операций по нормализации фраз. Чтобы избавиться от неявных дублей и схлопнуть статистику по ключевым фразам:

  • Удаляем пунктуацию;
  • Удаляем лишние пробелы;
  • Удаляем стоп-слова — союзы, предлоги;
  • Приводим к одному регистру;
  • Леммантизируем — приводим слова к начальной форме;
  • Делаем н-грамм анализ.

Получаем частотный словарь и понимаем, что вся наша семантика состоит совсем из небольшого числа уникальных слов, при том, что ключевых фраз тысячи. Это как раз и получается наш вайт-лист — униграммы нашей целевой семантики.

Работаем с запросами из кабинета

Далее необходимо провернуть ту же самую процедуру, но уже с поисковыми запросами, выгруженными из кабинета.

Выгружаем наши поисковые запросы за 180 дней из Директа. Это максимальное количество дней, за которые можно выгрузить семантику из кабинета Яндекса. Выбираем нужные РК, выбираем период, добавляем чек-боксами самые важные показатели — показы, клики, расход, конверсии.

Стоит подметить, что при этом анализе мы выделяем столбец не только с ключами, но и столбцы с показами, кликами, расходом и конверсиями, чтобы получить статистику по каждой н-грамме.

Удаляем из н-грамм поисковых фраз все наши н-граммы ключевых слов из вайт-листа.

Теперь мы получили слова, по которым были показы, но их не было в нашей РК. Этот список нужно внимательно просмотреть, вдруг туда попало что-то целевое.

Как минимизировать риски минусации непроработанных слов

Для этого можно:

  • Сделать фильтр по столбцам;
  • Убрать пустые значения из столбца н-грамм;

Делаем фильтр по столбцу с конверсиями, нам нужны те фразы, которые не привели лидов;

Для удобства можем сделать фильтр по кликам, показам, расходу и отсортировать по убыванию. Например, сделаем числовой фильтр и сделаем срез по униграммам, по которым было больше трех кликов.

Для наглядности можно сложить формулой посчитать сумму расходов по нецелевым показам за все время и посмотреть, сколько денег было потрачено на фразы, которые нельзя было минусовать в самом начале.

Также можно сделать условное форматирование, чтобы табличка была более приятна глазу.

В итоге у нас получаются около 10 слов, которых нет в наших ключах и по которым были показы. Мы можем тщательно проверить каждую н-грамму и добавить ее в список минус-фраз.

Результат

Выгружаем скопом десятки тысяч нецелевых слов и загружаем всё в минус-фразы. Скорее всего, вы сразу забьете все символы на уровне РК, поэтому советую проводить подобный анализ отдельно и на уровне групп, чтобы забить все доступные символы и на более низком уровне. Данный метод может помочь убрать нецелевую семантику в тех случаях, когда важно не срезать охваты целевой семантики с помощью уточняющих операторов.

Вы великолепны, мы сэкономили десятки часов на минусации!

Руслан Голованов
ROI-маркетолог

Обсуди с другими
Обсудить проект
Выберите услугу,
впишите имя и телефон, нажмите кнопку
Нужна консультанция Экспресс-аудит Реклама Аналитика Анализ конкурентов Стратегия ROI-маркетинг SMM Блог Сайт Другое
Нажимая кнопку, вы соглашаетесь с  Условиями обработки персональных данных