Атрибуция на основе данных: что это и как она работает

Октябрь 2018 г.

Представим, что вам нужно отследить, какие ключевые слова сыграли бóльшую роль в конверсии или какие каналы лучше всего отработали в рекламной кампании. Это позволит понять Data-driven атрибуция — самая совершенная модель на сегодня.

Чем она уникальна

У брендов масса возможностей для взаимодействия с покупателями. Важно знать, какие эффективны, а какие — бесполезны. По сравнению с привычными моделями, атрибуция на основе данных позволяет увеличить объем конверсий в поисковых кампаниях в Google Рекламе в среднем на 5%, сохраняя стоимость привлечения.

Отличие от других моделей

Стандартные модели ключевой вес отдают конкретной позиции источника (в начале, в конце или где-то еще), но не всегда эта позиция самая конверсионная. Вес присваивается просто потому, что канал находится в конкретном месте в цепочке переходов. Однако это не значит, что взаимодействие реально повлияло на конверсию — оно просто отработало в определенный момент на пути к ней.

Data-driven атрибуция индивидуальна и учитывает всё разнообразие путей к конверсии. Она присваивает ценность каждому взаимодействию пользователя, и степень этой ценности зависит не от позиции, а от того, как конкретное действие повлияло на финальный результат.

attribution

Сравним эту модель с самой популярной — атрибуцией по последнему клику. В отличие от неё, Data Driven поможет:

  • эффективно работать с каналами, которые в модели по последнему клику считаются менее результативными — дисплей, видео, мобильный трафик;
  • взвешенно и осторожно оценивать вклад ремаркетинга, который в модели по последнему неизменно показывает высокий результат.

Теперь создадим свою модель в качестве примера

Мы — магазин бытовой техники. В отчете «Атрибуция на поиске» в Google Рекламе отображается последовательность переходов пользователя к покупке из 10 шагов. Там все виды ключевых слов: общий небрендовый поиск («магазин бытовой техники»), названия товаров («холодильник», «купить холодильник»), товар плюс бренд («холодильник “Морозко”»), название магазина. Пользователи прошли по этой цепочке и что-то купили.

Для простоты представим, что такой путь проделали 100 пользователей, и 25 из них купили товар (сконвертировались). Показатель конверсионности получится 25%.

Шаг 1. Рассчитываем коэффициент конверсии (CVR)

attribution

Пока не будем присваивать разную ценность отдельным кликам, а посчитаем по линейной модели, что у всех слов равный вклад в финальную конверсионность. То есть как будто все ключевые слова одинаково повлияли на то, что 25% пользователей купили холодильники.

Шаг 2. Берем такую же цепочку без одного ключевого слова и сравниваем CVR — оцениваем вклад этого слова

2

Цепочка такая же, но без слова «холодильник на дачу». В последовательности кликов оно стояло на пятой позиции. Получается, конверсионность такого пути — уже 10%.

То есть отсутствие ключевого слова из предыдущей цепочки снизило конверсионность с 25 до 10%. Вклад этого слова —  разница конверсионности двух цепочек.

Шаг 3. Определяем вес этого ключевого слова и корректируем распределение ценности

3

Итого, мы видим:

  • Цепочка без слова «холодильник на дачу» — 10%.
  • Цепочка с этим словом — 25%.

То есть слово увеличивает конверсионность пути в 2,5 раза (на 150%). Мы увеличиваем ценность этого слова, но оставляем неизменными остальные.

Шаг 4. Десятки тысяч раз повторяем эту процедуру для каждой цепочки и каждого ключевого слова

4

Data driven-атрибуция использует машинное обучение, поэтому мы можем сравнивать цепочку много раз. Если ключевое слово увеличивает её конверсионность — мы повышаем его вес, на какой бы позиции оно ни появлялось. При этом мы не уменьшаем вес тех слов, которые не влияют на конверсионность положительно.

Шаг 5. Получаем финальный результат: конверсионный вес каждого слова

5

Суммируем ценности всех слов и делим индивидуальный вес ключевого слова на общий знаменатель — сумму весов всех ключевых слов.

Когда моделирование закончено, мы получаем взвешенный рейтинг каждого ключевого слова: процент веса, который оно заберет себе. Вес перераспределяется между всеми участниками конверсионных цепочек. Такая модель не субъективна, потому что учитывает все данные о взаимодействиях с пользователями. А главное — все расчеты происходят автоматически.

В каких продуктах доступна

  • Google Реклама — поиск и покупки. Чтобы модель заработала, необходимо минимум 600 конверсий и 15 000 кликов в месяц.
  • Google Analytics 360 — учитывает только 4 последних взаимодействия (с ограничениями).
  • Google Атрибуция (бета-версия). Новый продукт, в котором будет собрана вся атрибуционная функциональность: кросс-канальная с кросс-девайсом.
Как внедрить в компании культуру mobile first