7 anledningar att lära sig SQL och BigQuery

Adam Andersson

Det började för några år sedan när jag började känna mig begränsad i vad jag kunde få ut ifrån Google Analytics. Det kändes trubbigt och framförallt långsamt när jag jobbade med större datamängder. Det var då jag började ta mig tiden till att lära mig SQL. Under de senaste 18 månaderna har jag jobbat uteslutande med BigQuery när det kommer till att analysera trafiken på hemsidor.

Så vad är egentligen BigQuery? BigQuery är ett data warehouse där kunder kan lagra all sin data. Datan sparas i stora Excel-liknande tabeller med miljoner (ibland miljarder) rader. Det vanligaste är att kunder lagrar data från Google Analytics, men det händer även att det är CRM-data. För att hämta datan behöver du berätta för BigQuery vad du vill hämta, vilket du gör genom att skriva SQL-kod.

Med det sagt vill jag ta tillfället i akt att förklara hur SQL och BigQuery gjort mig till en bättre analytiker och varför du också borde lära dig SQL.

Ok, here we go:

1. Jag vill inte bara kunna analysera data från Google Analytics

För mig personligen har det varit en viktig del i att framtidssäkra mig själv. Hur ska jag kunna kalla mig analytiker om jag bara kan ta del av data via Google Analytics interface? Med SQL i ryggen kan jag nu hämta data från andra databaser som kundregister m.m., vilket gör analyserna ännu vassare.

2. Distributioner – inte bara medeltal

Google Analytics erbjuder bara medeltal, vilket kan vara missvisande och som faktiskt inte ger så mycket information. Om du inne i Google Analytics och ser att medelvärdet för Number of Sessions per User är 5.5 är det väldigt svårt att få en uppfattning av hur många besökare detta faktiskt gäller. 90% av besökarna kanske bara gör ett besök, medan ett fåtal individer drar upp genomsnittet till 5.5. Detta är särskilt viktigt när det kommer till beräkningar av revenue, såklart.

3. Lättare att felsöka

Eftersom BigQuery ger dig tillgång till all data som har samlats in blir det extremt lätt att felsöka. Att ta fram alla hits som en besökare gjort, fint sorterade från första besök till sista, gör det lätt att hitta fel i tracking, men också att skapa kundresor. Det bidrar till en bättre övergripande förståelse för hur Google Analytics fungerar på baksidan.

4. All data är unsampled

BigQuery ger dig all data, vilket innebär att du slipper tråkiga skyltar som “This report is based on 60% of your data”. I vanliga Google Analytics kan du råka ut för samplade rapporter, det innebär att siffrorna du ser är beräknade ett litet urval av all trafik.

I’ve got 99 problems but sampling ain’t one.

5. Du kan arbeta mer effektivt

För större siter kan det vara ett problem att skapa en bra bild av rörelsemönster. Det går inte att skapa 1000 page-segment för att se vilka sidor besökaren har sett. I BigQuery går detta oftast enkelt att skriva med några rader kod. Snabbt, osamplat, skalbart.

6. Du kan arbeta mer strukturerat

Inne i BigQuery är allting bara tabeller av data, vilket innebär att du inte har några färdiga grafer som distraherar. Detta innebär att du behöver arbeta mycket mer strukturerat då du inte får någonting gratis.

7. Skapa nya metrics

Sist, men inte minst. Eftersom all data finns tillgänglig i BigQuery kan du skapa dina egna metrics som beskriver kundbeteendet för din site allra bäst. Hur många sidvisningar har vi där en besökare har spenderat mer än 30 sekunder på en sida?

Eftersom all data finns tillgänglig i BigQuery kan du skapa dina egna metrics som beskriver kundbeteendet för din site allra bäst.

Givetvis finns det nackdelar med BigQuery också. Det höga priset för att skaffa BigQuery innebär att det oftast är större företag som har råd med tjänsten. Samtidigt är det nästan mer eller mindre ett måste när samplingen blir så stor att datan inte längre känns pålitlig.

BigQuery gör det möjligt att hämta data som annars inte finns tillgängligt i Google Analytics. Hur du väljer att exportera datan från BigQuery kan variera – i vissa fall vill du ha svaret aggregerat direkt. Andra gånger kanske vill du plocka ut sex miljoner rader för att göra analysen med Python och Jupyter Notebook, men det är för ett annat blogginlägg. Stay tuned!

Läs även

Cookiedöden är här!

Cookiedöden är här!

Av Olof Törnqvist 29 januari, 2020

Gå in i det nya decenniet med Atomic Research

Gå in i det nya decenniet med Atomic Research

Av Johanna Norberg & Magdalena Sjöstrand 8 januari, 2020

Conversionista – nu i familj om fem bolag 🙌

Conversionista – nu i familj om fem bolag 🙌

Av Malin Holmberg 4 december, 2019