První krůčky s Google BigQuery

Na Marketing Festivalu 2024 jsem navštívila workshop vedený Vaškem Jelenem, který se věnoval základům v Google BigQuery. Upřímně? Šla jsem tam hlavně proto, že to byl jediný technicky zaměřený workshop, který se to dopoledne konal. Ale odešla jsem s úplně novým pohledem na práci s daty z GA4.

Co je Google BigQuery a proč se vyplatí ji používat s GA4

BigQuery je cloudová databáze od Googlu, která je stavěná na zpracování obřích objemů dat. Pokud jste někdy zkoušeli tahat měsíce návštěvnosti e-shopu do Excelu a čekali, kdy začne počítač hulákat o pomoc, BigQuery je přesně ten nástroj, který vám zachrání nervy i hardware. Proč?

Výhodou je také to, že na BigQuery (BQ) můžete napojit i další služby, třeba GAds, Meta, vaše CRM a importovat data v různých formátech. A z pohledu někoho, kdo se v datech rád hrabe a zkoumá je, není nic krásnějšího než mít data v hezky na jednom místě.

Proč GA4 a BigQuery dávají dohromady smysl?

GA4 jsou fajn, ale mají dost omezení – samotná data GA4 nejsou špatná, ale pořádně chutnat začnou až v BigQuery. Tam se totiž dají filtrovat, řadit a analyzovat bez všech těch klikacích omezení v GA rozhraní. A navíc, co je možná to nejpodstatnější – GA4 rozhraní data defaultně po dosažení určitého počtu eventů sampluje. Pokud máte web, na kterém se toho děje dost (aka průměrný eshop), spoustu toho nevidíte. V BigQuery se tohle samplování neděje - máte raw data. A jen z nich zjistíte, jak váš web opravdu funguje.

Jak začít s BigQuery: první SQL dotazy

Pokud jste v SQL nováčci jako jsem tenkrát byla já, nebojte se. Začít můžete s jednoduchými dotazy a postupně se učit složitější věci. V případě BigQuery platíte za zpracovaná data, takže se nemusíte bát, že vás zrujnuje. Co je na začátek nejlepší - Google nabízí kredit zdarma a před spuštěním každého dotazu uvidíte, kolik dat bude dotaz zpracovávat.

Ve správě účtu se navíc dají nastavit limity, které vám pomohou kontrolovat náklady a zabrání nečekaným výdajům.

Jak propojit GA4 s BigQuery

A jak začít? Nejdřív si musíte BigQuery s GA4 propojit. Jak na to? Podívat se můžete např. na:

Důležité upozornění: Data se nedoplňují zpětně. Export začne až od chvíle propojení, což je další důvod nastavit vše co nejdřív.

Jak pracovat s GA4 daty v BigQuery (tabulka events)

Pár dní uběhlo, data máte a chcete se na ně konečně podívat. Jak na to?

Jak takový jednoduchý dotaz může vypadat? Třeba vás zajímá celkový počet zobrazení stránky v lednu 2025:

SELECT
  COUNT(event_name) AS pocet_pageviews
FROM
  `projekt.dataset.events_*`
WHERE
  _TABLE_SUFFIX BETWEEN '20250101' AND '20250131' 
  AND event_name = 'page_view'
;

Nebo vás zajímá, kolik uživatelů přišlo celkem na stránky? A z jakého zdroje?

-- přeformátování datumu z názvu tabulky
SELECT
  FORMAT_DATE('%Y-%m-%d', PARSE_DATE('%Y%m%d', _TABLE_SUFFIX)) AS den, 
  COUNT(DISTINCT(user_pseudo_id)) AS pocet_users, -- unikátní uživatelé

  -- vytahání utm parametrů
  traffic_source.source AS zdroj,
  traffic_source.medium AS medium,
  traffic_source.name AS kampan
FROM
  `projekt.dataset.events_*`
WHERE
  _TABLE_SUFFIX BETWEEN '20250101' AND '20250131'
GROUP BY
  den,
  zdroj,
  medium,
  kampan
ORDER BY
  den
;

Jestli si nejste jistí, jak na to, nebojte se podívat na oficiální dokumentaci Google BigQuery nebo SQL tutoriály na W3Schools. Existuje také spousta online kurzů a videí, které vás provedou základy SQL. A v době AI není nic snazšího, než si nějakého chatbota napromptovat tak, aby vám s konkrétními dotazy pomohl, nebo je zoptimalizoval.

Kolik BigQuery stojí a jak hlídat náklady?

BigQuery je velmi dostupná služba, pokud víte, jak s ní pracovat. Abyste se vyhnuli překvapením, držte se pár jednoduchých pravidel:

Co to je T0? Předpřipravená tabulka těch "sloupečků", které vás nejčastěji zajímají. Proč je to dobrá věc? Nemusíte pořád dotazovat na base events tabulku a do budoucna vám ušetří čas i peníze.

A věřte mi, jakmile se do BigQuery jednou vrhnete, budete se nořit hlouběji a hlouběji, chtít víc a dotazy budou větší, komplexnější a nedejbože až si nad nimi postavíte první dashboard v Lookerstudiu (o tom příště).

A kolik že to teda vlastně stojí? Pro běžný e-shop stojí používání BigQuery často jen pár korun měsíčně. Vyšší částky přichází až u velmi velkých datasetů nebo pravidelných komplexních dotazů.

Závěr: BigQuery není strašák

Workshop mi ukázal, že BigQuery není nástroj jen pro „datové hardcore analytiky“. Je to místo, kde konečně získáte data bez omezení, raw informace ze zákulisí vašeho webu a možnost tvořit si vlastní metriky bez kompromisů.

Pokud s GA4 teprve začínáte nebo vám v klasickém rozhraní něco chybí, BigQuery doporučuji vyzkoušet. Stačí pár základních SQL dotazů a začnete chápat, jak jsou vaše data skutečně poskládaná – a to je neuvěřitelně osvobozující.

Takže pokud jste to dočetli až sem, můj tip zní: Prostě začněte. Propojte GA4 s BigQuery, začněte s jednoduchými SQL dotazy. Na začátku to nestojí nic. Vaše budoucí já vám poděkuje.

A hlavně: není to magie. A je to návykové.

Kdyby vás kolem BigQuery zajímalo něco dalšího, dejte vědět. Třeba z toho vznikne další článek.