Varför är direkttrafiken så mycket högre i nya analysverktyget?
Datum publicerad
Sitter du i ett nytt analysverktyg och undrar varför det är så stor skillnad mellan direkttrafiken i det gamla och nya systemet? Svaret är kanske lite annorlunda än vad du tror.
Under de senaste åren har alla bytt från Google Universal Analytics (GA3) och kanske har du lekt lite med att jämföra gammal data med det nya systemet.
Kanske kliar du dig i huvudet och försöker hitta svar på skillnaderna du ser i datamaterialet. Skillnader kommer du förmodligen att hitta oavsett om du har bytt till Google Analytics 4, Piwik Pro, Matomo, Fathom eller Plausible, eller något annat.
En av skillnaderna du mest troligt har fastnat för är en signifikant förändring i direkttrafiken. Många följer direkttrafiken som en indikation på varumärkesstyrka, position och lojalitet. Tanken är att om fler besökare över tid kommer direkt till din webbplats utan att gå via andra källor så gör du förmodligen något rätt. Då är det irriterande när du upptäcker en stor skillnad mellan verktygen.
Men just skillnaden i direkttrafiken har en mycket logisk förklaring.
Direkttrafikken i Google Analytics är baserad på en lögn.
De flesta kommer att märka att direkttrafiken till webbplatsen verkar vara mycket högre i det nya verktyget än i GA3. Samtidigt ser du förmodligen att det är betydligt mindre trafik från andra källor. Ofta är det trafik från organisk sökning och nyhetsbrev som har den största minskningen.
Orsaken till detta är en obekväm sanning som du måste förlika dig med: GA3 har ljugit för dig i alla år, men det har varit välvilligt menat!
GA3 har rapporterat direkttrafiken för lågt genom att tilldela besök till tidigare trafikkällor när det var möjligt.
MEN: It’s not a bug, it’s a feature!
Direkttrafik är inte en trafikkälla
Först och främst måste du vara medveten om att "direkt" inte är en trafikkälla, det är snarare frånvaro av trafikkälla.
All spårning av trafikkällor baseras på att användarens webbläsare rapporterar in en referens, till exempel en webbplats som användaren har klickat från för att komma till dig. Det kan också vara kampanjkoder eller andra UTM-parametrar som du själv har skapat.
När denna information saknas, räknas besöket som “direkt”.
Varför är det ofta mer intressant att se den föregående trafikkällan?
I många fall kan det vara ointressant eller till och med vilseledande att kategorisera ett besök som direkttrafik.
Till exempel: Tänk dig att du klickar på en annons och besöker en onlinebutik på förmiddagen, på kvällen öppnar du fliken igen och navigerar runt på webbplatsen. Kvällssessionen kommer då att räknas som ett nytt besök utan att ta hänsyn till annonsen du först klickade på.
Det vill säga direkttrafik.
Eller om du söker på Google och hamnar på onlinebutiken.
Du gör lite research om olika produkter och bokmärker slutligen den produkt du är mest intresserad av.
En vecka senare, när du besöker samma bokmärke och köper produkten, kommer köpet att registreras som ett besök utan trafikkälla.
I båda dessa fall är det mer intressant om besöken tilldelas den ursprungliga trafikkällan, det vill säga annonskanalen och organisk sökning på Google. Och det är precis vad Google Analytics gör, både i GA3 och i GA4.
I vissa fall kan detta vara vilseledande.
I en del andra fall är det inte lika logiskt att besöka tidigare trafikkällor. Det påverkar olika typer av webbplatser olika, särskilt om din webbplats har hög lojalitet och regelbundna besök från samma användare.
Till exempel: Tänk dig att du tillhandahåller ett ekonomisystem. Dina kunder kommer ofta direkt till startsidan för att logga in.
Självklart skickar du regelbundet ut nyhetsbrev och ibland klickar kunderna på något intressant där. Efter ett sådant besök från en "extern" källa kommer alla nya besök direkt till din webbplats att tillskrivas den externa källan - alltså i detta fall "nyhetsbrev". Det betyder att om en kund klickar en gång på ett nyhetsbrev och sedan kommer in hundra gånger direkt, så registreras det totalt som hundra-ett besök från nyhetsbrevet.
Det kan lätt ge en vilseledande bild av hur betydelsefulla dina nyhetsbrev är.
Hur länge "minns" Google Analytics den föregående trafikkällan?
I praktiken kommer Google Analytics att minnas den föregående trafikkällan tills användarnas cookies löper ut eller försvinner.
I GA3 fanns det en inställning som kallades "Campaign Timeout". Som standard var den inställd på 6 månader. Det innebar att nya besök direkt på webbplatsen skulle tillskrivas den föregående trafikkällan om det hade gått mindre än 6 månader sedan det föregående besöket. Men det föregående besöket kunde också ha "ärvt" sin källa från det som kom innan det. Därmed var varaktigheten i praktiken obegränsad så länge som cookien som identifierar användaren fortfarande existerade.
GA4 har ingen sådan justerbar inställning, åtminstone inte en som vi har hittat hittills. Därför antar vi att tilldelningen sker under en obegränsad tidsperiod så länge som cookien existerar.
Varför uppstår avvikelser när båda verktygen gör samma sak?
Om både GA3 och GA4 gör denna tilldelning på samma sätt, varför uppstår det då fortfarande avvikelser mellan verktygen?
Avvikelsen beror främst på att GA4 ännu inte har byggt upp samma historia som du hade i GA3. När du börjar använda ett nytt analysverktyg kommer alla dina användare att vara nya, eftersom ingen har cookies från tidigare. Då kommer ingen heller ha någon historia av trafikkällor från tidigare besök.
Med tiden, när månaderna går, kommer fler och fler användare att få en sådan historia och andelen direkttrafik kommer att minska. När GA4 först lanserades var trafikkällorna "Direct" och "Organic" nästan lika stora. Med tiden har de skilt sig och stabiliserat sig på olika nivåer.
Här ser du ett exempel från GA4-kontot för en stor e-handelsaktör. Direkttrafiken minskar och organisk trafik ökar allt eftersom GA4 får mer historia:
Om vi tittar på samma tidsperiod från GA3 ser vi att avståndet mellan de två källorna har varit stabilt hela tiden:
Samma trend kan du tydligt se på e-posttrafiken.
I grafen nedan kan du se att GA4 började rapportera trafik i slutet av januari. Vid den tiden finns det ingen trafik från källan "Email". Efter att det första nyhetsbrevet har skickats ut i mars - vilket är den första höga toppen i grafen - kan vi se att det kommer in en jämn ström av trafik från "Email" mellan utskicken (de tre höga topparna):
I GA3 kan du se att det finns låg och stabil trafik från nyhetsbrevet även före den höga toppen som kom i mars:
De första dagarna med helt nya GA4 kommer du alltså att se den "sanna" fördelningen av trafikkällor. Du måste låta det gå några månader innan du kan jämföra data med GA3.
Hur är det då med andra system som Piwik Pro och Matomo?
De flesta andra analysverktyg kommer att rapportera den "sanna" trafikkällan för varje enskilt besök. Det innebär att om ett besök startar utan en extern källa kommer det att kategoriseras som direkt, oavsett vad som tidigare har registrerats för samma användare.
Jämfört med Google Analytics innebär detta att direkttrafiken generellt sett kommer att vara betydligt högre, medan nästan alla andra trafikkällor kommer att vara lägre än vad du är van vid.
Här är ett exempel från en välgörenhetsorganisation som har många trogna supportrar. Data visar samma period från både GA3 och Piwik Pro:
Här kan du se att det är betydligt högre direkttrafik rapporterad i Piwik Pro än vad det är i GA3.
Ett annat exempel, med inte så drastiska skillnader, är våra egna data från synlighet.no:
Synlighet.no har inte lika många besökare som återkommer ofta och därmed blir också avståndet i direkttrafik mindre. Under denna tidsperiod har Synlighets GA4-konto varit aktivt under lång tid och då kan du se att den i stora drag överensstämmer med GA3.
Finns det andra felkällor?
Absolut!
Dessa avvikelser i trafikkällor beror på olika mät förfaranden i olika system. Det är nödvändigtvis inte ett "fel”, det är bara olika utfall på grund av hur systemen är konstruerade.
Men det finns flera saker som kan orsaka avvikelser och fel i hur trafikkällor rapporteras och så länge direkttrafik är "frånvaro av trafikkälla", kan detta påverkas av många olika faktorer.
Exempel på avvikelser i trafikkällor:
- Referenten har försvunnit: På grund av tekniska fel i webbläsaren, eller redirects i flera steg, eller strikta säkerhetsinställningar, kan det hända att webbläsaren inte kan skicka in information om referenten. Om trafiken inte heller har kampanjkoder kommer den att klassificeras som direkt.
- Det fanns aldrig någon referent: vissa applikationer med inbyggda webbläsare kanske inte använder konceptet "referent" när de visar en webbplats. Detta gäller till exempel de flesta e-postläsare, men även vissa sociala medier och andra applikationer. Då kommer du återigen att få trafik som klassificeras som direkt, om inte länkarna har kampanjkoder.
- Samtyckesboxar och adblockers: Verktyg som blockerar eller påverkar spårning och cookies kan på olika sätt påverka hur trafikkällor registreras. Det är inte ovanligt att se avvikelser efter att en samtyckeslösning har implementerats eller ändrats. Dessa saker kan också påverka olika verktyg på olika sätt och därmed leda till fler avvikelser.
- Apples spårningskydd: Både iOS och Safari har inbyggda mekanismer som påverkar vilka data som kan samlas in och livslängden på cookies. Detta kan i sin tur leda till att sammansättningen av trafikkällor och andelen direkttrafik kan vara annorlunda mellan iOS- och Android-användare. Detta kan påverka olika system på olika sätt.
Data Quality Sucks - Get over it!
Om du är en av dem som är frustrerad över att det finns skillnader, måste du först ta ett djupt andetag och tänka på något trevligt. Två mätsystem för webbtrafik kommer aldrig att ge dig samma svar. Därför upprepar vi ofta detta citat från Avinash Kaushik som ett mantra: "Data Quality Sucks - Get over it!"
Det som är viktigare än om data är "korrekt" är om den är "användbar".
Avvikelser och fel som är stabila över tid kan du ignorera, eftersom det fortfarande kommer att vara värdefullt att se utvecklingen över tid. Det kommer också att vara användbart att titta på relativa storlekar i form av procentuell förändring och skillnaderna i volym och kvalitet mellan olika källor, olika kampanjer, olika landningssidor osv.
Problemet när du har bytt system är att du får ett avbrott i tidslinjen som är svår att fixa. Förhoppningsvis satte du upp det nya analysverktyget tidigt nog så att du har en period med överlapp mellan det gamla och det nya systemet. Då kan du titta tillbaka och få en uppfattning om förväntad storlek på avvikelserna. På så sätt kan du skapa en ny bild av vad som förväntas och vad som är baslinjen för olika siffror. Kanske kan du hitta en nyckel för omvandling så att de historiska siffrorna blir jämförbara med de nya.
Men slösa inte bort massor av resurser på att "korrigera felet" mellan det nya och det gamla systemet, för du kommer ändå aldrig att komma 100% i mål. Bli istället van vid att det nya systemet fungerar lite annorlunda. Avbrottet i tidslinjen kommer att blekna över tid.
Följ utvecklingen av förstasidans trafik
Som sagt är det många som följer den direkta trafiken som en indikation på varumärkesstyrka, position och lojalitet. Detta är ett bra tillvägagångssätt, men störs tyvärr av dålig data.
Å ena sidan har vi konstaterat att direkttrafiken rapporteras alltför lågt, eftersom mycket tillskrivs andra trafikkällor. Å andra sidan rapporteras direkttrafiken ofta alltför högt, eftersom alla andra felkällor hamnar kategoriserade som direkttrafik.
En bättre lösning är att följa utvecklingen av förstasidan, eller mer exakt antalet besök som har förstasidan som landningssida. I många fall är det faktum att människor söker sig till din förstasida en indikation på att de vet vart de ska och de känner redan till ditt namn. Oavsett vad som rapporteras som trafikkälla, så tyder hög trafik på förstasidan att du har en stark position.
Och en ökning i denna trafik över tid är en god indikation på att du gör något rätt.
Det bästa av allt är att du kan förvänta dig att förstasidans trafik är densamma i alla verktyg. Om den inte är det så har du förmodligen ett tekniskt problem som kan åtgärdas.
Vill du lära dig mer om analysverktyg och insikt? Hitta fler artiklar om insikt och analys här!