De relatie tussen organische zoekwoord posities en CTR-waardes is interessant omdat (bij gelijkblijvende conversie-ratio) het mogelijk is om een indicatie te krijgen van de te verwachten omzetgroei bij het stijgen van keyword rankings. Door de jaren heen zijn er diverse zogeheten CTR studies gepubliceerd. Anno 2018 ziet een zoekresultatenpagina er echter zeer anders uit in vergelijking met voorgaande jaren. Naar verwachting is de relatie tussen organische zoekwoord posities en CTR-waardes dan ook verschillend van wat er in voorgaande studies is gerapporteerd. In deze studie is gekeken naar de relatie tussen de organische keyword rankings en CTR-waardes in de modebranche met als doel om CTR benchmarkwaardes per positie te bepalen voor deze sector. In vervolgstudies is het onze ambitie om dit ook voor andere sectoren in kaart te brengen.

Onderzoeksmethode

Vanuit Google Search Console (GSC) is 16 maanden data geëxporteerd van vijf modewebsites met de volgende verdeling van gemiddeld aantal organische clicks per maand: 8000, 18.000, 28.000, 44.000, en 120.000 en de volgende verdeling van gemiddeld aantal impressions per maand: 95.000, 407.000, 575.000, 1.256.000 en 2.600.000

In een aantal oudere CTR studies waar gebruik werd gemaakt van GSC (Webmaster Tools) data was men gelimiteerd tot slechts 90 dagen data. Er is in deze studie geen rekening gehouden met een eventueel seizoenseffect. Ook zijn de zoekresultatenpagina’s de afgelopen 16 maanden niet substantieel veranderd.

Met de tool Search Analytics for Sheets zijn er in totaal 70.000 rijen data geëxporteerd met daarin informatie over queries, bestemmingspagina’s, clicks, impressions en gemiddelde posities van deze queries.

De data vanuit GSC is geanalyseerd met het R Project for Statistical Computing ook zijn alle figuren gemaakt met deze tool. Voor het clusteren van data  is een  K-means clusteranalyse toegepast.

Resultaten

In figuur 1 wordt de frequentie van het aantal queries per positie weergegeven. Positiedata wordt vanuit GSC als een gemiddelde tot 6 cijfers achter de komma aangeleverd. Om exacte posities te kunnen plotten is er voor gekozen om de data als staafdiagrammen weer te geven. Positie 10 bijvoorbeeld vertegenwoordigt alle waardes tussen 9,5 en 10,499999 waarbij de standaard regels voor afronding worden gebruikt.

Zoals te zien is het merendeel van de data afkomstig van keyword posities 1 tot en met 20, met andere woorden, er wordt amper gekeken voorbij pagina 2 van de zoekresultaten.

 

Verdeling resultaten vanuit GSC op basis van keyword posities

Figuur 1 – Verdeling resultaten vanuit GSC op basis van keyword posities

Aangezien de data laat zien dat er amper gekeken wordt naar resultaten buiten de top 20 hebben we deze datapunten niet meegenomen voor de verdere analyse van de relatie tussen keyword positie en CTR-waarde. In de praktijk is voor SEO het klikgedrag buiten de top 20 ook niet zo relevant. Ook zijn resultaten met minder dan 100 impressions buiten beschouwing gelaten. Na deze eerste filtering blijven er 31.468 rijen data over, N.B. 29.110 rijen data vallen binnen de top 10 posities.

Verdeling van CTR-waardes gefilterde data (top 20 posities)Figuur 2 – Verdeling van CTR-waardes gefilterde data (top 20 posities)

Meer dan 90% van alle datapunten liggen tussen de 0% en 10% CTR. In de longtail van dit diagram valt te zien dat er CTR-waardes zijn in het hele bereik tussen 0% en 100%, dat verklaart de aanwezigheid van de outlier-data in Figuur 3.

Relatie tussen zoekwoord positie en CTR-waardeFiguur 3 – Relatie tussen zoekwoord positie en CTR-waarde

Figuur 3 laat de verhouding zien tussen de eerste 10 organische keyword posities en CTR-waardes, weergegeven als boxplots. Voor iedere positie bevindt 50% van de data punten zich binnen de box. Voor positie 1 bijvoorbeeld varieert dit tussen ongeveer 1% en 12% CTR terwijl dit voor positie 2 tussen ongeveer 2% en 8% is. De data laat zien dat met oplopende positie de CTR-range van de boxes ook afneemt, zie tabel 1 voor de verdeling.

 

positie boxplot 50% range CTR percentage
   1 1,27 – 12,34 %
   2 1,85 – 8,15   %
   3 2,01 – 6,88   %
   4 2,32 – 6,31   %
   5 2,02 – 5,54   %
   6 1,83 – 4,74   %
   7 1,60 – 4,06   %
   8 1,35 – 3,60   %
   9 1,23 – 3,52   %
  10 1,04 – 3,30   %

Tabel 1 – relatie keyword positie en CTR-range

Deze data laat al een duidelijke trend zien, maar om een nauwkeurige relatie tussen keyword positie en CTR te bepalen moet er een verklaring worden gevonden voor de outlier-data (buiten de boxes) en de verdeling binnen de boxes zelf. Het is bijvoorbeeld niet exact genoeg om te stellen dat een keyword op positie 1 in de organische rankings een CTR van 1% tot 12% mag verwachten. Het is belangrijk om een kwalitatieve scheiding te maken tussen de keyword termen in deze data. Voor positie 1 treffen we in de outlier-data termen aan zoals “retour zenden merknaam” en “contactgegevens bedrijf” termen waar mensen heel specifiek naar deze informatie zoeken waarbij het zeer waarschijnlijk is dat er op een relevant zoekresultaat geklikt wordt. In de box data vinden we termen als “koop herenschoenen” en andere koopintentie termen waarbij de zoeker zich nog aan het oriënteren is. Het lijkt er op dat zoekintentie invloed heeft op de te verwachten CTR waarde per zoekwoordpositie. Op basis van deze data lijkt het aannemelijk dat zoekwoorden onderverdeeld kunnen worden in verschillende categorieën waarbij iedere categorie waarschijnlijk een verschillende CTR-waarde per keywordpositie zal hebben.

Om te voorkomen dat er een subjectieve indeling van categorieën wordt gemaakt is er voor gekozen om in R een K-means clustering toe te passen op de data. Met positie, impressions en clicks-data als input komt daar de volgende clustering uit naar voren, zie Figuur 4.


Figuur 4 – Clusters in kaart gebracht met K-means clustering analysis in R

R produceert een output van 7 verschillende clusters, waarin er per cluster een impliciete samenhang tussen de datapunten is gevonden. De samenhang tussen de keywords per groep was in eerste instantie moeilijk te interpreteren. Daarom is ervoor gekozen om per cluster wederom een K-means clusteranalyse toe te passen, zie Figuur 5 als voorbeeld.

sub-cluster 6 op basis van de data in figuur 4Figuur 5 – sub-cluster 6 op basis van de data in figuur 4

De data van cluster 6 zijn via een K-means clustering analyse onderverdeeld in 4 groepen. In cluster 1 (rood) zien we vooral termen met hoge impression waardes voor algemene merknamen en algemene termen zoals bijvoorbeeld: Nike, Converse, Zusss, slippers, dames sneakers, geisha jurk en laarzen. In cluster 2 (blauw) zien we dat de keywords meer product gerelateerd zijn, bijvoorbeeld: schoenen sale, enkellaarsjes dames, Reset jassen dames, Dirkje kleding. In cluster 3 (groen) zien we vooral de merknamen van de websites die gebruikt zijn in deze studie en daarnaast de combinatie van merknaam in met locatie zoals bijvoorbeeld: merknaam Zwolle, merknaam Enschede etc.  In cluster 4 (paars) zien we onder andere merknamen in combinatie met andere termen zoals: retour, retourneren, vacature(s), waardebon, VVV bon en inloggen.

Op basis van deze clusteranalyse zien we duidelijk dat keyword termen uiteenvallen in verschillende groepen, ieder met een zekere CTR-waarde bandbreedte. Naar verwachting kan er een duidelijk kwalitatief onderscheid gemaakt worden tussen de gevonden keywordgroepen. In het vervolgartikel zal onderzocht worden of er een duidelijke definitie kan worden toegekend aan iedere keywordgroep op basis van zoekintentie met voor iedere keywordgroep een eigen CTR-waarde benchmark per positie.

Waarom niet  gewoon één gemiddelde CTR waarde bepalen op basis van alle data?

Figuur 6, afkomstig uit Moz.com’s blog “Google Organic Click-Through Rates in 2014” is door de jaren heen vaak aangehaald. Volgens deze grafiek zou een eerste positie in de organische resultaten moeten leiden tot zo’n 31% van de clicks. In 2014 zagen de zoekresultatenpagina’s er een stuk simpeler uit. Daarnaast was Google destijds nog niet zo goed in staat om zoekintentie te bepalen als nu in 2018. Ook is de data uit de 2014 studie alleen afkomstig van de maand juli 2014 en was dus destijds al mogelijk minder relevant voor andere maanden.

Relatie tussen keyword positie en CTR-waarde Figuur 6 – Relatie tussen keyword positie en CTR-waarde afkomstig uit https://moz.com/blog/google-organic-click-through-rates-in-2014

In figuur 7 zien we de enorme spreiding rond de gemiddelde CTR-waardes per positie bij het totaal van 70.000 datapunten.

Gemiddelde CTR-waardes met standaarddeviatie per positie van ongefilterde dataFiguur 7 – Gemiddelde CTR-waardes met standaarddeviatie per positie van ongefilterde data

In figuur 8 zien we nog steeds een grote spreiding rondom de gemiddelde CTR-waardes van de gefilterde data (31.468 data punten). Hieruit volgt één belangrijke conclusie, het toevoegen van meer datapunten leidt niet tot een lagere spreiding. Dat komt omdat er kwalitatieve verschillen zijn tussen de verschillende groepen zoekwoorden binnen de data set. De gemiddelde CTR-waarde wordt niet nauwkeuriger door meer data punten van andere mode websites aan deze data set toe te voegen.

Gemiddelde CTR-waardes met standaarddeviatie per positie van gefilterde dataFiguur 8 – Gemiddelde CTR-waardes met standaarddeviatie per positie van gefilterde data

Conclusie

Op basis van de dataset is het duidelijk dat er per positie een grote spreiding is in CTR-waardes. Verdere analyse laat zien dat er kwalitatief verschillende clusters bestaan binnen de data. De voorlopige verklaring is dat de spreiding in CTR-waardes veroorzaakt wordt door verschillende type intenties achter de zoekopdrachten, informatief, branded, commercieel etc. De analyse van deze clusters wordt in een vervolgartikel gepresenteerd. Voorlopig kan er geconcludeerd worden dat er een relatie is tussen zoekwoord positie en CTR waarbij hogere posities een hogere CTR-waarde hebben dan lagere posities wat in de lijn der verwachting ligt. De verschillen per positie zijn minder klein dan in het verleden gerapporteerd en de relatie tussen zoekwoord positie en CTR in 2018 is substantieel anders dan in 2014.

positie boxplot 50% range CTR percentage
   1 1,27 – 12,34 %
   2 1,85 – 8,15   %
   3 2,01 – 6,88   %
   4 2,32 – 6,31   %
   5 2,02 – 5,54   %
   6 1,83 – 4,74   %
   7 1,60 – 4,06   %
   8 1,35 – 3,60   %
   9 1,23 – 3,52   %
  10 1,04 – 3,30   %

Tabel 1 – relatie keywordpositie en CTR-range

De verwachting is dat met verdere analyse van de clusters het mogelijk is om specifieke CTR-ranges te kunnen geven voor verschillende types keywords. In eerste instantie ligt de focus op de modebranche. In een latere meta-studie zullen verschillende branche CTR-benchmarks met elkaar vergeleken worden. Ook kijken we naar verschillen tussen mobiel en desktop.

Referenties
https://www.internetmarketingninjas.com/blog/google/announcing-2017-click-rate-study/
https://moz.com/blog/google-organic-click-through-rates-in-2014
https://www.seoclarity.net/mobile-desktop-ctr-study-11302/
https://searchanalyticsforsheets.com/
https://www.r-project.org/
https://stat.ethz.ch/R-manual/R-devel/library/stats/html/kmeans.html

Alexander van Aken

Dr. Alexander van Aken is gepromoveerd als biochemicus aan de University of Sussex in Brighton, Engeland. Na een loopbaan als post-doctoral researcher en universitair docent heeft hij de overgang gemaakt naar search in 2010 en is nu bij Smart IM verantwoordelijk voor R&D. Voor een overzicht van Alexander’s loopbaan en publicaties, bezoek LinkedIn of Slideshare.