Big Data in SEO
Wat kun je er mee? En waar moet je starten? Waarom zou je er überhaupt mee willen starten? Allemaal relevante vragen die ik op deze pagina beantwoord of ga beantwoorden. Met een hoop tips and tricks om je ook echt te helpen als je zelf aan de slag wilt met data, of gewoon wat efficiënter wilt werken met kleine hoeveelheden data. En hoewel ik dit toepas op SEO, werkt het proces hetzelfde voor alle marketing kanalen. Sterker nog, die kun je allemaal heel mooi samen brengen met dit proces!
Deze pagina leeft. Over tijd voeg ik hier steeds meer informatie aan toe. Oftewel in SEO termen ben ik bezig een vette pillar page neer te zetten. Helemaal in het Nederlands.
Inhoudsopgave
Dit is waar ik in zijn geheel naar toe aan het werken ben om uit te schrijven. Mogelijk dat de sub onderdelen op eigen pagina's komen, maar ik vind het ook wel gaaf om alles op 1 pagina te hebben. Dus daar ben ik nog niet over uit. Ik hoop dat het leerzaam en interessant is. Enjoy!
Data verzamelen
Data Transformeren
Data visualisatie
Verschillende data sources
Belangrijke data types
Owning SEO data versus leasen
Stakeholders en SEO data
Data Planning
Data monitoring
Metadata Management
Korte introductie
Als je het mij vraagt heeft iedere marketing afdeling op een gegeven moment belang bij een datawarehouse. Het maakt data onderling toegankelijk en iedereen kan met dezelfde taal met alle data spreken (SQL), no matter the source. Want in het datawarehouse komt alle marketing data samen. Wanneer dit onderdeel is van het marketing team gaat het veel tijd besparen aan het regulier opzetten van dezelfde rapportages, analyses krijgen meer diepgang en zelfs data discussies zijn verleden tijd. Dat laatste omdat het inrichten van een datawarehouse het je verplicht op voorhand keuzes te maken m.b.t. het inrichten van die data.
Om te beginnen zijn slechts 4 basis stappen nodig waar nagenoeg gratis en klein mee kan worden gestart. Kosten groeien mee met je maturity en behoefte. Op deze pagina ga ik hier dieper op in vanuit de SEO lens. Uiteraard is het van toepassing op alle marketing kanalen en liefst ook integratie met de bredere business.
Contact opnemen kan natuurlijk altijd. Ik help je graag persoonlijk of met mijn team.
groet,
Michel
Disclaimer
Niets op deze pagina is automatisch gegenereerd door AI. De informatie komt van mezelf. Ik ga er vanuit dat je al een tijdje in SEO zit en doe dus aannames m.b.t. je kennis van tools en afkortingen.
Zie je iets dat niet klopt of een typefout? Let me know. Dan hebben we het erover en/of pas ik het aan waar nodig.
TODO:
Uiteraard ga ik meer types content toevoegen over tijd. I know dat het erg veel tekst is nu 😅
Structured data toevoegen.
Items van mijn SQL cursus integreren
Meer blogposts plaatsen en hierin verwerken waar relevant
FAQ's toevoegen
Waar te beginnen met je Big Data avontuur?
Er zijn 4 stappen nodig om een goed process neer te zetten. Daarna zijn er nog eens 3 geavanceerde stappen. Laat je hier vooral niet door afremmen want het klinkt een stuk ingewikkelder dan het is. Vooral wanneer je gewoon klein begint. Bijvoorbeeld met 1 data source zoals Google Search Console Data. Die kan je via Flipstream gratis naar Google BigQuery (DWH) laden.
Stap 1:
Een Datawarehouse
Een datawarehouse is een database specifiek gericht op business intelligence. Waar een traditionele database wordt ingezet voor het opslaan van data, richt een DWH zich vooral op de analyse van data. Datawarehouses zijn daarom gespecialiseerd in het snel verwerken van heel veel data.
Stap 2:
Data Verzamelen
Welke data wil je graag op kunnen rapporteren of analyseren? Hoe gaat deze data in een eigen datawarehouse komen? Soms kan dat met een directe koppeling, zoals GA4 naar BigQuery. Soms via externe tools zoals funnel. Stel jezelf eerst de vraag welke data je nodig hebt. Je behoefte zal over tijd groeien. Tip: Klein beginnen.
Stap 3:
Data Transformeren
Een belangrijke stap in het van werken met data is het standaardiseren van data. Dat wordt het transformeren van ruwe data genoemd. Dit wat mij betreft de belangrijkste stap in dit eerste proces. Toekomstige analyses worden hierdoor veel eenvoudiger. Bijvoorbeeld elke URL is op dezelfde manier geformatteerd, no matter the source.
Stap 4:
Data Visualiseren
Vooral voor een eerste start is dit een gaaf moment. Data inladen in je favoriete BI-Tool. Zoals Google datastudio, Power BI, Tableau of Looker. Er zijn een hoop manieren om dit te doen. Gelukkig kan een datawarehouse zoals BigQuery eenvoudig koppelen met al deze BI oplossingen.
Beginnen met een eigen datawarehouse
Waarom een datawarehouse
Een goed ingerichte eigen datawarehouse hebben is alsof je als kind een snoepwinkel binnen loopt. Alles netjes geordend, onnoemelijk veel soorten en je kan van alles naar hartelust combineren. Heerlijk!
Voor het SEO team - het hele marketing team - is het hebben van gestructureerde data een uitkomst. Niet meer alles in silo's in verschillende tools waar het naar CSV bestanden geëxporteerd dient te worden. Maar data gestandaardiseerd op één plek. Elke dag aangevuld met verse data van verschillende bronnen/tools. Een plek waar met een simpele SQL statement GSC met GA data kan worden combineren en aan Google Ads data kan worden gelinkt. Een plek waar data van jou is en niet meer wordt "geleased" bij een tool. Want zo gauw de data is geïmporteerd, dan blijf het er.
Met SEO data in een datawarehouse kunnen processen worden geautomatiseerd en geïntegreerd in de business. Richt je stap 3: data transformatie goed in, dan ben je minder tool-specifiek afhankelijk.
Wat is een datawarehouse
Een datawarehouse (DWH) is een database specifiek gericht op business intelligence. Waar een traditionele database wordt ingezet voor het opslaan van data, richt een DWH zich vooral op de analyse van data. Datawarehouses zijn daarom gespecialiseerd in het snel verwerken van heel veel data.
Met veel data bedoel ik ook écht veel data. Spotify, Snapchat en Twitter zijn voorbeelden van bedrijven die gebruik maken van Google BigQuery en hier geen gigabytes, terabytes of petabytes in hebben staan, maar exabytes. Oftewel 1 miljard gigabytes aan data. Medewerkers van deze bedrijven doen samen met gemak 10 miljoen queries in de DWH per maand. Hoeveelheden waar een gemiddelde SEO team echt niet aan komt. Dus die datawarehouses kunnen met gemak onze gigabytes aan.
Een datawarehouse stelt je als bedrijf dus echt in staat om data gedreven te werken. Maar vooral ook data efficient te werken. Want een datawarehouse stelt je in staat om afscheid te nemen van handmatig excel bestandjes exporteren en aan elkaar te knippen en plakken.
Als SEO zeg ik dan ook graag: De datawarehouse stelt je in staat om afscheid te nemen van de vlookup.
Met een datawarehouse wordt data gestandaardiseerd.
Wie herkent het niet. De maandelijkse rapportage. Elke keer dezelfde stappen herkauwen.
- Data opzoeken uit verschillende tools
- Data exporteren
- Data schoonmaken
- Vlookuppen en structuur aanbrengen
- De data visualiseren & analyseren
- Tot slot de bevindingen rapporteren
Irritant! En uiteraard geldt dit ook voor ad-hoc analyses.
Toen ik bij Staples het SEO team runde spendeerden we hier binnen het team (5 FTE) 100 uur per maand aan. Bizar. En het opleveren van de rapportage gebeurde ook nog eens in de derde week van de nieuwe maand. Kortom, de rapportage was al weer oud. Laat staan dat je real time actie aan het ondernemen was.
Tot ik op een gegeven moment data ben gaan centraliseren. Destijds met DOMO. Voor onze tijd toen in 2018 mega fancy en geavanceerd. Hun concept is interessant, maar heeft niet meer mijn voorkeur anno 2022. Zij combineren de datawarehouse met visualisatie in hun oplossing. Dit maakt je 100% afhankelijk van hun oplossing waardoor het niet meermijn voorkeur geniet. Juist het feit dat je data in BigQuery of Snowflake op kan slaan en in datastudio, looker, power bi of qlik kan visualiseren geeft je vrijheid. Maar het loste wel ons probleem op.
Long story short: we hebben uiteindelijk 90 uren wegbezuinigd! Daarnaast hadden we nagenoeg real time inzichten ineens. En konden onze stakeholders, met name de lokale e-commerce managers, de dashboards bekijken wanneer zij zelf behoefte hadden. Hierdoor ging ook nog eens de kwaliteit van onze gesprekken omhoog. Gerichte vragen omtrent de SEO data.
Een goed ingerichte datawarehouse bespaart je het altijd terugkerende proces van export data - clean - merge - structure - visualiseer - rapporteer. Alles staat standaard gevisualiseerd klaar. Een rapport is nu in een handomdraai te realiseren en dashboards staan altijd met de laatste updates verwerkt tot je beschikking.
Weg met datasilo's
Naast het feit dat we het met een datawarehouse het SEO team kunnen optimaliseren door tijd te besparen krijg je nog zo veel meer voordelen uit het standaardiseren van data. Met name team en organisatie overkoepelend. Een belangrijke tweede is dat het veel eenvoudiger wordt om data samen te voegen. Denk hierbij aan toegang tot data van verschillende marketing kanalen, maar ook andere afdelingen intern en zelfs externe data kan eenvoudig structureel in worden geladen.
Hoe irritant is het wanneer je inzichten wilt krijgen over hoe Google Ads + Organic presteert in category X. Hoe maak je category X in al die data? Hoe kom je aan de juiste Google Ads KPI's en idem voor Organic. GSC of GA? Etc..
Wanneer ieder team zijn data in een DWH pompt is het belangrijk dat dit gestandaardiseerd wordt. Hierover later op deze pagina meer in "Chapter 3: Data transformeren". In het kort komt het er op neer dat ieder kanaal zijn data niet ruw beschikbaar maakt, maar juist met kleine transformaties gebaseerd op standaarden. Zodat iedereen een "url" in de tabellen op dezelfde manier formatteert en de kolom namen ook aligned zijn. Bijvoorbeeld wel of niet met https://www.
Hierdoor krijg je een single source of truth waar iedereen eenvoudig mee kan werken. Wat dus verder gaat dan enkel marketing data. Allen gebaseerd op een gezamenlijke taal om met die data te communiceren: SQL.
Datawarehouses: Google, Microsoft, Amazon, Snowflake en meer...
Er zijn verschillende bedrijven die een datawarehouse aanbieden. Ze hebben allen hun eigen voor en nadelen.
Voor SEO's en marketeers is BigQuery van Google ideaal. Vooral omdat zij standaard, gratis en ook nog eens eenvoudig data van het Google ecosysteem inladen. Denk hierbij aan Google Ads, GA4 en YouTube. Mochten ze bij jou nou persé met bijvoorbeeld microsoft willen werken, niet getreurd. Je kan relatief eenvoudig data importeren (redirecten 😉) van BigQuery naar een andere datawarehouse. Ze proberen het natuurlijk wel drempels weg te nemen om over te stappen van datawarehouse.
Het opstarten van een datawarehouse zoals Google BigQuery is gedaan wanneer je een account aanmaakt op het Google Cloud Platform. Ieder project dat je aanmaakt heeft BigQuery standaard erin zitten. Technisch gezien is het dus up and running in a matter of seconds. Net als een goed schaakspel heeft het wel wat tijd nodig om het te masteren.
Zelf werk ik eigenlijk enkel met Google BigQuery. Puur vanwege het eco systeem en marketeers die sneller gewend zijn met een Google product. Bij enterprise klanten merk ik echter wel dat Azure (Microsoft) een goede tweede is. Sterker nog, vaak wordt data opgevangen in BigQuery van bijvoorbeeld een Flipstream integratie en doorgestuurd naar Azure Synapse simpelweg omdat het data team daar mee werkt. Wil je fancy doen, dan raad ik snowflake aan.
Als marketeer to marketeer raad ik aan "gewoon" eens aan de slag te gaan met Google BigQuery.
Kosten van een datawarehouse
Iedereen vraagt altijd snel naar het kostenplaatje. Vooral met de gedachte dat het wel erg duur moet zijn. Gelukkig is dit niet meer dezelfde tijd als toen ik 20 jaar geleden skyhosting.nl had en nog 35 euro kon vragen voor 5 MB aan opslag. Nu kost een gigabyte aan data opslag in BigQuery bijvoorbeeld slechts 0,02 euro per maand. Inderdaad: twee eurocent. En dit kan er één worden als je het slim in richt.
Pricing voor een datawarehouse bestaat uit de volgende drie componenten:
- Streamen ( Uploaden van data )
- Opslag van data
- Draaien van queries (analyseren van data)
Kosten verschillen per aanbieder. De meesten - if not all - beginnen gratis. Ze weten maar als te goed dat wanneer je bent begonnen er een behoorlijke drempel is om alle data te verhuizen. Kosten van datawarehousing groeien met de data maturity van de organisatie mee. Hoe meer van de drie elementen, hoe meer de kosten toenemen. In de praktijk zijn het de queries die het meeste impact hebben op de kosten. Maar die analyses maken de bedrijfsvoering als het goed is ook efficiënter en goedkoper. Kortom, een relatief lage nieuwe kostenpost in ruil voor verlaging aan de andere kant.
Om een goed beeld van de pricing te vormen ga ik een aantal voorbeelden maken die ik later toevoeg aan de pagina. Dat werk ik eerst even apart uit in een blog.
Begin!
Een datawarehouse staat aan het begin van je data-avontuur. Wees vooral niet bang om te starten, en richt een account in op Google BigQuery en experimenteer. Het is belangrijk dat je eerst een gevoel van het concept krijgt en wat ervaring met SQL. Je zal zien dat je over tijd een steeds beter beeld krijgt van wat je wilt en nodig hebt om meer uit data te halen. En door SQL steeds efficienter wordt met (veel) data te werken.
Het eerste doel: data verzamelen. Mijn advies is om zo van start te gaan:
- Start met GSC data via Flipstream en zet het GSC Datastudio dashboard op
- Laad GA(4) data in via de standaard connector of doe het vanuit GA360
- Voeg Google Ads data toe via de interne Google Transfer service
- Heb je toegang tot Botify of Deepcrawl? Voeg dat ook toe
Tussen iedere stap:
- Bedenk hoe de data te structureren?
- Wat zijn de belangrijkste data-punten van de geladen data?
- Stel jezelf vragen om met SQL te beantwoorden
Keep you posted?
Vond je dit interessant? Dan laat ik het je graag weten wanneer het volgende onderdeel live staat. Ondertussen stuur ik af en toe een update met een blogpost.
SEO Data Management
Het is belangrijk om zelf eigenaar van data te zijn en niet alleen toegang te hebben tot de data. Zo kun je eenvoudig nieuwe inzichten op historische data toepassen. Bijvoorbeeld door een nieuwe hierarchy op een ecommerce site veranderd de structuur. En dit moet in rapportages terugkomen. Zelf eigenaar zijn geeft vele malen meer flexibiliteit hier mee om te gaan en dit toe te passen op historische data. Ook wil ik het data verhaal concreet maken door op specifieke cases in te gaan met betrekking tot onderstaande onderwerpen.
Verschillende data sources
Waarmee moet je dan aan de slag? Met andere woorden: het klinkt allemaal heel vet, maar vertel me eens met welke data sources ik dan moet gaan werken? Het is belangrijk om een goed beeld te krijgen van de mogelijkheden. Daar komt mijn ervaring van pas :)
Belangrijke data voor je team
Deze gaat in combinatie met de stakeholders. Leuk al die connectoren en zo veel data. Uiteindelijk gaat het om een bepaalde data-kern en hier op schaal mee te gaan werken. Met andere woorden: Wat haal je het liefst uit diverse data sources?
Owning SEO data versus leasen
Ik ben voorstander van data zo veel mogelijk in eigen beheer te halen. Noem het first-party SEO data. In plaats van naar een tool te gaan om met hun data te werken, koop je data om zelf mee aan de slag te gaan. Dit geeft je zo veel meer flexibiliteit. En vaak is het ook nog eens goedkoper!
Stakeholders en SEO data
Hoe ga je om met nieuwe stakeholders zoals het data team? En aan de andere kant hoe zorg je er voor dat bestaande stakeholders gebruik gaan maken van jouw SEO data. In de vorm van dashboards of SQL. Hoe krijg je het management mee in je data dromen? Heel belangrijk voor het succes van je data dromen.
Testimonials van klanten
Tot ik er aan toe ben om het over deze onderwerpen te hebben nu even wat testimonials waar ik trots op ben!
Next level Big Data
Deze drie stappen worden ondernomen door de interne data teams. Dit is waar data-maturity hoog is. Wanneer er veel data intern te managen is van meerdere kanalen dient er een goed overzicht van te komen. Ook is het belangrijk dat de kwaliteit van de data wordt geborgen. Precies waar deze stappen bij helpen. Voor een SEO manager is het goed om te begrijpen waarom dit nodig is zodat je een fijne gesprekspartner bent voor het data team.
Stap 5:
Data Planning
Een datawarehouse is een database specifiek gericht op business intelligence. Waar een traditionele database wordt ingezet voor het opslaan van data, richt een DWH zich vooral op de analyse van data. Datawarehouses zijn daarom gespecialiseerd in het snel verwerken van heel veel data.
Stap 6:
Data Monitoring
Welke data wil je graag op kunnen rap
Stap 7:
Metadata Management
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.
SQL
SQL is de magische taal van data. En gelukkig lijkt het erg veel op standaard excel formules die je waarschijnlijk al kent. De kans dat je dus snel aan de slag kan met SQL en grote hoeveelheden data is dus groot. Wat vooral belangrijk is om met SQL aan de slag te gaan, is dat het een kwestie van doen is. Voordat je het weet wil je niet meer terug naar Excel. Vooral wanneer je door hebt hoe je CSV bestanden eenvoudig kunt bewerken met SQL in DeepNote. Of vanuit BigQuery direct met je gefilterde data kan spelen in Looker Datastudio en Google Spreadsheet.
En uiteraard gaan we het ook hebben over Python.
Stap 5:
Data Planning
Een datawarehouse is een database specifiek gericht op business intelligence. Waar een traditionele database wordt ingezet voor het opslaan van data, richt een DWH zich vooral op de analyse van data. Datawarehouses zijn daarom gespecialiseerd in het snel verwerken van heel veel data.
Stap 6:
Data Monitoring
Welke data wil je graag op kunnen rap
Stap 7:
Metadata Management
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.
Recente artikelen
Tot ik er aan toe ben om SQL verder uit te werken hierbij wat leuke blog artikelen!