Modelowanie atrybucji i atrybucja Data-Driven

Image Description
Grzegorz Kowalczyk
pon. 25.03.2019

Modelowanie atrybucji

Branża digital marketingu na przestrzeni ostatnich lat rozwija się bardzo dynamicznie. Marketerzy prześcigają się w pomysłach, jak zdobyć kolejnych klientów, jak utrzymać aktualnych i wreszcie generalnie – jak zwiększyć rentowność swoich biznesów. Analityka internetowa jest obecnie ważniejsza niż kiedykolwiek, szybko rośnie też świadomość znaczenia omni-channel marketingu i holistycznego podejścia do strategii marketingowej. Odpowiednia koordynacja kanałów oraz właściwe rozdysponowanie środków budżetowych pomiędzy różne działania marketingowe, ma olbrzymie znaczenie dla zwiększenia zyskowności biznesu. Dzięki atrybucji, możemy sprawdzić, jaki udział w konwersjach przypada poszczególnym kanałom i dzięki temu podjąć decyzje o odpowiednim podziale budżetu. Niestety nadal większość analiz przeprowadza się w oparciu o najbardziej popularny model last-click. Modeli jest jednak znacznie więcej, na dodatek sami możemy (i powinniśmy!) tworzyć i testować wiele z nich. Dzięki temu możemy dowiedzieć się, które kanały faktycznie odpowiadają za większość naszych konwersji. Dlaczego modelowanie atrybucji jest takie ważne i co właściwie kryje się za tym pojęciem?

Czym jest modelowanie atrybucji?

Modelowanie atrybucji polega na określeniu sposobu przypisania udziału w konwersji poszczególnym kanałom występującym na ścieżce zakupowej klienta, w zależności od momentu pojawienia się na niej. Można do nich zaliczyć m.in. płatne wyniki wyszukiwania, bezpłatne wyniki wyszukiwania, reklamy displayowe, sieci społecznościowe, linki afiliacyjne czy mailing. Dzięki dążeniu do wypracowania modelu najbliżej odwzorowującego wagę konkretnych kanałów na customer journey, możemy w najwyższym stopniu zoptymalizować budżet reklamowy. Powinno to wpłynąć na wzrost wielkości sprzedaży i spadek kosztu konwersji.

model data-driven

Standardowe modele atrybucji

Do standardowych modeli Google Analytics (tzw. modeli bazowych) zaliczają się:

  • Ostatnia interakcja – 100% udziału przypisywane jest ostatniemu kliknięciu
  • Pierwsza interakcja – 100% udziału przypisywane jest pierwszemu kliknięciu
  • Liniowy – każdej interakcji przypisywany jest równy udział
  • Rozkład czasowy – udział interakcji rośnie wraz ze zbliżaniem się do końca lejka zakupowego
  • Uwzględnienie pozycji – najważniejsze jest pierwsze i ostatnie kliknięcie i mają one równy udział (możliwość samodzielnego ustalenia jego wielkości)

Model ostatniej interakcji jest najpopularniejszym z nich, używanym także przez inne systemy śledzenia konwersji, jak Facebook Ads lub Google Ads. Platformy te przypisują całą zasługę za konwersję sobie, bez względu na to, czy na ścieżce konwersji pojawiły się też inne kanały. Jeżeli zaś takiego kliknięcia w ogóle nie było, wtedy konwersja przypisana zostanie wejściu bezpośredniemu. Dlatego też zazwyczaj dane Google Analytics pokazują niższe (i bliższe prawdy) liczby odnośnie poszczególnych platform. Z kolei domyślnym modelem w Google Analytics jest również last-click, ale z wykluczeniem wejść bezpośrednich – nazywamy go Ostatnim kliknięciem niebezpośrednim. De facto więc udział ruchu bezpośredniego będzie ograniczał się jedynie do osób, które nie wchodziły wcześniej na stronę (w okresie ostatnich 90 dni) lub też zawsze odwiedzali ją bezpośrednio wpisując adres w wyszukiwarce.

Każdy z powyższych modeli ma swoje zalety i wady, które warto brać pod uwagę podczas ich stosowania.

modelowanie atrybucji

Ostatnia interakcja (last-click)

Wiemy, która interakcja wystąpiła bezpośrednio przed konwersją, model ten łatwo zrozumieć i mierzyć. Występuje też domyślnie w przypadku wielu platform. Takie uproszczenie może prowadzić jednak do błędnych wniosków. Nie bierze on pod uwagę żadnej poprzedniej interakcji na ścieżce zakupowej, a często to one miały decydujący wpływ na wygenerowanie konwersji. Dodatkowo model ten sporą część konwersji przypisze do wejść bezpośrednich. Dzieje się tak, ponieważ użytkownicy klikając w reklamę, często odkładają zakup na później. W takim przypadku znając już markę, wchodzą bezpośrednio na jej stronę. Model ten nie przypisze wtedy jednak konwersji żadnemu działaniu marketingowemu.

Pierwsza interakcja (first-click)

Zaletę stanowi to, że wiemy w którym momencie rozpoczynają się konwersje. Pomija on jednak znaczenie dalszych punktów styku. Model ten przydaje się, jeśli marka jest na etapie wprowadzania na rynek i budowania świadomości u odbiorcy. Dzięki temu dowiemy się skąd warto pozyskiwać wartościowych użytkowników.

Model liniowy

Zaletą tego modelu jest z pewnością fakt, że każdy punkt styku ma istotne znaczenie. Jednak realnie istnieje bardzo mała szansa, że wszystkie mają równie dużą wagę w kontekście wygenerowania konwersji. Możemy go stosować w branżach, gdzie ścieżki użytkowników złożone są z wielu interakcji.

Rozkład czasowy

Model ten odzwierciedla ścieżkę zakupową klienta, polegającą na coraz większym zaangażowaniu w miarę zbliżania się do konwersji. Jest to ciekawa i bardziej wiarygodna alternatywa dla modelu last-click. Nadal jednak nagradza przede wszystkim ostatnią interakcję, co nie musi odzwierciedlać jej faktycznego udziału w konwersji. Model ten dobrze sprawdzi się w przypadku długich kampanii, podczas których skupiamy się na różnorodnych celach w zależności od progresu użytkownika na ścieżce zakupowej.

Uwzględnienie pozycji

Model, który dobrze odzwierciedla rzeczywistość, często zdarza się bowiem, że pierwsza i ostatnia interakcja odgrywają bardzo istotne role w generowaniu konwersji. Jednak któreś z pośrednich punktów styku również mogą mocno wpłynąć na konwersje, a w tym modelu ich znaczenie jest minimalizowane. Model ten można zastosować w przypadku znacznej roli remarketingu w kampaniach, dzięki czemu dowiemy się, skąd pozyskiwać osoby do ponownego kierowania na nie reklam.

Modele awaryjne

Modelowanie atrybucji uwzględnia też tzw. modele awaryjne. Charakteryzują się one dodatkowym wykluczaniem lub uwzględnianiem różnych parametrów. Możemy np. zmierzyć efektywność konkretnej platformy, lepiej niż pokazuje to jej autorski panel (wykluczając wejścia bezpośrednie). Spowoduje to uwzględnienie interakcji ze wszystkimi kanałami i dopiero jeśli nie będzie żadnej, konwersje zostaną przypisane do wejścia bezpośredniego. Innym pomysłem jest wykluczenie z udziału w konwersji wizyt bezpośrednich oraz pochodzących z wyszukiwania słów związanych z marką – te wizyty niewiele bowiem powiedzą nam o kanałach wartościowych z punktu widzenia pozyskiwania nowych osób. Możliwości dopasowania modelu są tutaj ograniczone jedynie naszą wyobraźnią i aktualnymi potrzebami.

atrybucja danych

data-driven attribution

Modele uwzględniające wspomaganie (multi-touch)

Najczęściej używanymi modelami są nadal modele przypisujące 100% udziału jednej interakcji (przeważnie ostatniej). Jednak u zdecydowanej większości klientów liczba kliknięć na ścieżce zakupowej jest zdecydowanie wyższa. Każda interakcja może w mniejszym lub większym stopniu wpłynąć na liczbę konwersji. Modelowanie atrybucji w oparciu o takie modele jest więc znacznie bardziej efektywne. Należą do nich wspomniane już wcześniej: model liniowy, uwzględnienia pozycji i rozkładu czasowego. Poza samodzielnym odgórnym przypisaniem wag do poszczególnych interakcji, można też je dostosować w zależności od czasu spędzonego w witrynie lub głębokości wizyty po kontakcie z danym kanałem.

Grupowanie kanałów

Domyślne grupowanie kanałów ścieżek wielokanałowych w Google Analytics obejmuje następujące kanały: Direct (wejścia bezpośrednie), Organic Search (bezpłatny ruch z wyszukiwarek), Social (media społecznościowe), Email, Affiliates (programy partnerskie), Refferal (ruch pochodzący z witryn odsyłających), Paid Search (płatny ruch z wyszukiwarek), Display (reklama displayowa) i Other Advertising (pozostały ruch reklamowy). Utworzenie indywidualnego grupowania znacząco jednak ułatwi modelowanie atrybucji. Dzięki temu będziemy mogli przypisać poszczególne źródła wizyt do konkretnych kategorii, zgodnie z naszymi preferencjami.

Przykładowe grupowanie dla branży e-commerce mogłoby zawierać następujące kategorie:

  • Direct & Brand – wejścia bezpośrednie oraz wejścia z wyszukiwarek ze słowami brandowymi. Do tej kategorii należą osoby, które są już dobrze zaznajomione z marką i sami mają intencję wejścia na naszą stronę. Dla lepszego obrazu, warto tutaj dodatkowo wykluczyć działania organiczne, strony serwisów płatności online oraz przekierowania z własnej domeny.
  • Remarketing – wszystkie kampanie remarketingowe
  • Mailings – wysyłki skierowane do własnych baz danych
  • Paid Search Non-Brand – płatne wyszukiwania na słowa niezwiązane z marką
  • Organic Search – ruch organiczny
  • Affiliate – programy partnerskie
  • Social Media – sieci społecznościowe
  • Comparison Engines – porównywarki cen
  • Other Refferals – pozostałe odesłania

grupowanie kanałów

Okna konwersji

Modelowanie atrybucji uwzględnia wpływ poszczególnych interakcji na konwersje w ustalonym, poprzedzającym je okresie. O jego długości decyduje tzw. okno konwersji. Wszystkie kliknięcia mające miejsce przed ustalonym oknem konwersji nie będą brane pod uwagę w modelu. W standardowym raportowaniu Google Analytics okno konwersji wynosi 6 miesięcy, natomiast w raportach ścieżek wielokanałowych i porównania modeli atrybucji, możliwa jest zmiana jego długości w przedziale od 1 do 90 dni. Możemy też dostosować każdy model atrybucji oddzielnie. Jeśli tego nie zrobimy, model domyślnie przyjmie okno konwersji zdefiniowane w raporcie porównania modeli atrybucji. Możliwość regulowania okna konwersji pozwala na jeszcze dokładniejszą analizę danych. Dzięki temu jesteśmy przykładowo w stanie bezpośrednio porównać dane z Google Analytics i systemów zewnętrznych lub też zestawić wyniki dla różnych okien konwersji w tym samym modelu.

conversion window

Czym jest model atrybucji data-driven

Problemem większości modeli jest niekompletność danych. Skutkuje to niedokładnościami w ocenie faktycznego wpływu poszczególnych kanałów na wartość konwersji. Modelem, który zdaje się być odpowiedzią na te niedogodności, jest model atrybucji data-driven, inaczej zwany modelem opartym na danych. Dokonuje on dynamicznej analizy wszystkich interakcji występujących na ścieżce zakupowej klienta i określa ich skuteczność, a następnie przypisuje każdej z nich odpowiedni udział w konwersji. Modelowanie atrybucji w oparciu o model data-driven wymaga wcześniejszego zgromadzenia 400 konwersji z co najmniej 2 interakcjami na konwersję oraz uzbierania 10 000 ścieżek (ok. 10 000 użytkowników witryny).

Jak działa model atrybucji oparty na danych?

Algorytm modelu data-driven oparty jest na pojęciu tzw. „wartości Shapley’a”, która definiuje sposób sprawiedliwego podziału wypłaty danego zespołu wśród jego członków. W kontekście atrybucji w charakterze członków występują interakcje na ścieżce zakupowej (czyli np. płatne wyniki wyszukiwania, afiliacja, mailing), a w charakterze wypłaty – konwersje.

Atrybucja oparta na danych korzysta ze wszystkich danych o ścieżkach, zarówno użytkowników dokonujących konwersji, jak i niedokonujących. Dzięki temu algorytm odpowiadający za kreowanie modelu może oszacować prawdopodobieństwo wystąpienia konwersji dla określonych punktów stykowych dla podobnych użytkowników, którzy się z nimi zetknęli lub nie. Porównanie wszystkich kombinacji punktów stykowych, a następnie ujednolicenie ich umożliwia obliczenie statystyk konwersji. Są one różne dla różnych pozycji na ścieżce, a więc kolejność interakcji odgrywa dużą rolę. Tak stworzony model pokazuje, jaka jest realna szansa na dokonanie konwersji w określonym momencie ścieżki zakupowej.

Model odświeża się co tydzień z oknem konwersji 28 dni uwzględniając cztery interakcje w ciągu 90 dni przed każdą konwersją. Do obsługiwanych interakcji należą standardowo kliknięcia i wizyty bezpośrednie. W przypadku połączenia konta Campaign Managera z kontem Analytics lub jeśli uczestniczy się w tworzeniu białej listy Raportów wyświetleń w sieci reklamowej Google, dodatkowo model będzie obejmował wyświetlenia i interakcje multimedialne, takie jak reklamy TrueView. W przypadku każdej konwersji, model usuwa ostatnie 24 godziny powiązanej wizyty bezpośredniej, a więc jeśli w ciągu doby poprzedzającej wizytę bezpośrednią miała miejsce aktywność marketingowa, model przypisze konwersję do tej aktywności.

Co jest potrzebne do implementacji modelu atrybucji data-driven?

Żeby móc zaimplementować model atrybucji data-driven trzeba spełnić kilka wymagań:

  1. Dostęp do Google Premium / konta Google Analytics 360 / spełnienie odpowiednich warunków w Google Marketing Platform lub Google Ads (15 000 kliknięć oraz 600 konwersji w okresie 30 dni)
  2. Wysokiej jakości dane – im lepsze, tym efektywniej będzie działał model
  3. Ustawienie śledzenia konwersji i celów w Google Analytics
  4. Kompatybilność KPI i celów pomiędzy kanałami
  5. Osiągnięcie minimalnego progu konwersji dla każdego typu konwersji

Aktywacja modelu data-driven

Żeby aktywować modelowanie atrybucji na danych, należy:

  1. Zalogować się na konto Google Analytics
  2. Kliknąć Administracja, a następnie Widok danych
  3. Kliknąć Ustawienia widoku
  4. W obszarze „Ustawienia modelowania” zaznaczyć Włącz modele na podstawie danych
  5. Kliknąć Zapisz

Analiza danych rozpocznie się natychmiastowo, a pierwszy model atrybucji data-driven dostępny będzie w ciągu siedmiu dni.

Raportowanie w modelu data-driven

Dzięki odpowiednim raportom, możemy poznać szczegóły dotyczące funkcjonowania modelu data-driven.

Raport Eksplorator modeli pokazuje jakie wagi przyporządkowane są przez model data-driven do poszczególnych kanałów i pozycji przed wystąpieniem konwersji. Znajduje się on w raportach Konwersje > Atrybucje. Dzięki niemu możemy dowiedzieć się, które kanały są istotniejsze na początku ścieżki zakupowej, a które w jej dalszej fazie. Pozwoli to zoptymalizować nasze działania reklamowe. Model odświeżany jest co tydzień, a dane dotyczące konwersji z każdego tygodnia mają swój własny model. Automatyczna aktualizacja odzwierciedla więc zmiany w strategii marketingowej.

Z kolei raport Analiza ROI da nam odpowiedź, jak nasz model wpływa na ogólne ROI oraz określi możliwości optymalizacji. Dzięki niemu dowiemy się, jakie są wydatki poszczególnych kanałów, a także jaki jest sposób obliczania danych o konwersji i ROI dla kanałów przez model data-driven. Model ten jest domyślnym modelem raportu, ale dzięki selektorowi modelu atrybucji możemy porównać wartości dla różnych modeli. Skuteczność poszczególnych kanałów (np. pod kątem ROAS lub CPA) pokaże nam, jak warto je zoptymalizować pod kątem odpowiedniego rozdysponowania budżetu.

conversion path

Optymalizacja modelu atrybucji opartego na danych

Modelowanie atrybucji w oparciu o model data-driven pokazuje nam wpływ poszczególnych kanałów na prawdopodobieństwo wystąpienia konwersji. Jak jednak dokonywać optymalizacji, by maksymalnie zwiększyć ROI?

Warto rozpocząć od wybrania typu konwersji, który chcemy poddać analizie. By to zrobić, można sprawdzić, jakie cele mamy ustawione na koncie Google Analytics i określić, który jest w danym momencie dla nas najważniejszy. Następnie w raportach Atrybucji, korzystając z selektora „typ konwersji”, wybieramy odpowiedni z nich i przechodzimy do analizy. Następnie należy zastanowić się, na optymalizacji której kampanii lub kanału szczególnie nam zależy. Porównanie modelu opartego na danych do standardowego modelu również powinno dać nam ciekawe wnioski. Można w ten sposób sprawdzić, jaki wpływ na otrzymywane wartości miała zmiana modelu. Następnym krokiem jest identyfikacja interakcji na ścieżce zakupowej, które w największym stopniu uległy zmianie w modelach. Odpowiednie rozdysponowanie budżetu do konkretnych kanałów, w zależności od ich znaczenia w generowaniu konwersji, jest kluczowa z punktu widzenia ROI. Po wykonaniu wszystkich tych kroków, dalszą analizę możemy już opierać o raport Analiza ROI – nie ma potrzeby dalszego porównywania modeli.

Podsumowanie

Dążenie do znalezienia modelu atrybucji jak najbardziej odzwierciedlającego rzeczywistość będzie jednym z najważniejszych wyzwań branży marketingowej w najbliższej przyszłości. Modele oparte na danych umożliwiają marketerom coraz bardziej efektywne wykorzystanie środków budżetowych. Przy obecnej konkurencyjności, odpowiednie modelowanie atrybucji i umiejętność optymalizacji działań reklamowych na jego bazie, będzie stanowić kluczową rolę w kontekście maksymalizacji zysków.

1 gwiazdka2 gwiazdki3 gwiazdki4 gwiazdki5 gwiazdek (3 głosy, średnia ocena: 5,00)
Loading...
Image Description

Mam na imię Grzesiek, w branży marketingu internetowego pracuję od lutego 2016 roku. W trakcie mojej kariery zawodowej pracowałem w GroupM, Deloitte Digital CE, Digital Resolution (część grupy OMD) oraz w Grupie Domodi. Przez cały ten okres zdobywałem doświadczenie w obszarze Social Ads. Aktualnie mieszkam w Warszawie i pracuję w AdPeak, gdzie rozwijam się bardziej w obszarze Google Ads, nie tracąc jednak nadal kontaktu z reklamami socialowymi.