1 of 37

Web Analytics

...et si on reprenait depuis le début ?

Samedi 30 mai 2020

2 of 37

Xavier Naudeau

Enseignant en SEO et Web Analytics (Bachelor & MBA) depuis 2016

Consultant en web marketing depuis 2011

@Xav_Tyx

3 of 37

Reprendre

à zéro

4 of 37

Comment accède-t-on à un site ?

… qui souhaite aller sur Google.

Prenons l’exemple de votre ordinateur...

5 of 37

1ère étape

Vous allez tapez google.com dans votre barre de recherche.

google.com

2ème étape

Votre machine va alors devoir trouver l’adresse IP d’un serveur hébergeant le site web afin de récupérer les ressources nécessaires à l’affichage sur votre écran.

?

3ème étape

Pour se faire, votre machine va enfin interroger différents annuaires pouvant contenir cette adresse IP.

?

Cache navigateur

Cache FAI

Cache DNS

6 of 37

4ème étape

Votre machine connaît désormais l’adresse IP du serveur hébergeant le site voulu et va l’interroger

https://www.google.com/

IP=213.186.33.19

6ème étape

Votre navigateur va lire le contenu du fichier HTML et l’interpréter de haut en bas pour afficher à l’écran le contenu du site Internet.

“200”

5ème étape

Le serveur va alors répondre à votre machine avec un code indiquant si oui (200) ou non (404) la page demandée se trouve bien ici ou ailleurs (30x).

7 of 37

7ème étape

Votre navigateur va alors effectuer pour chaque ressource externe une requête aux différents serveurs les hébergeant.

Dernière étape

Après avoir effectué en quelques secondes des dizaines voire centaines de demandes, votre navigateur vous affiche la page web demandée.

javascript.js

video.mkv

image.webp

...

8ème étape

Le navigateur va ainsi récupérer toutes les ressources nécessaires à l’affichage de la page.

8 of 37

Comment traque-t-on avec GA ?

… retourné par le serveur.

Reprenons à la lecture du premier fichier HTML...

9 of 37

6ème étape

Votre navigateur va lire le contenu du fichier HTML et l’interpréter de haut en bas pour afficher à l’écran le contenu du site Internet.

6ème étape ter

Après avoir lu le tag, votre navigateur va construire une URL contenant les informations à transmettre à Google Analytics.

https://www.google-analytics.com/r/collect?v=1&_v=j79&a=519127574&t=pageview&_s=1&dl=https%3A%2F%2Fxavier.naudeau.fr%2F&ul=fr-fr&de=UTF-8&dt=Xavier%20Naudeau%20-%20Digital%20marketing%20consultant&sd=24-bit&sr=2560x1440&vp=1369x1298&je=0&_u=QACAAEADQ~&jid=944685157&gjid=282821229&cid=910713421.1572893391&tid=UA-35903501-1&_gid=851172244.1575757043&_r=1&gtm=2wgav9K7N9BRC&z=1843217761

6ème étape bis

Placé haut dans le code, votre navigateur va lire le tag Google Analytics ou sa version générée via le script Google Tag Manager.

10 of 37

7ème étape

Une fois l’URL construite, votre navigateur va requêter les serveurs de Google Analytics qui enregistreront la demande pour l’analyser a posteriori.

https://www.google-analytics.com/r/collect?v=1&_v=j79&a=1603587967&t=pageview&...

8ème étape

Suite à cette demande, le serveur GA va analyser les différentes requêtes pour en extraire des informations sur le comportement des utilisateurs.

https://www.google-analytics.com/r/collect?v=1&_v=j79&a=519127574&t=pageview&_s=1&dl=https%3A%2F%2Fxavier.naudeau.fr%2F&ul=fr-fr&de=UTF-8&dt=Xavier%20Naudeau%20-%20Digital%20marketing%20consultant&sd=24-bit&sr=2560x1440&vp=1369x1298&je=0&_u=QACAAEADQ~&jid=944685157&gjid=282821229&cid=910713421.1572893391&tid=UA-35903501-1&_gid=851172244.1575757043&_r=1&gtm=2wgav9K7N9BRC&z=1843217761

Nème étape

Vous pouvez consulter les données de navigation sur Google Analytics.

11 of 37

Intéressons-nous à cette requête

Afin que Google Analytics récupère des données, votre navigateur va requêter l’URL suivante :

https://www.google-analytics.com/r/collect

Toutes les requêtes (pages vues, event ou transactions) générées par Google Analytics contiendront cette URL.

12 of 37

Comment différencier les requêtes ?

Grâce aux paramètres que l’on va placer à la fin de notre URL précédente.

https://www.google-analytics.com/r/collect?v=1&_v=j79&a=519127574&t=pageview&...

Chacun des blocs ajouté contiendra une information qui sera ensuite déchiffrée côté serveur de Google Analytics.

13 of 37

Petit rappel des paramètres

Paramètre

Le texte se trouvant entre le point d’interrogation et le premier signe égal correspond à un nom de paramètre.

?param=1

https://www.monsite.com/?param_a=1&param_b=2&param_c=3&...

Attribution

Le signe égal va suivre le paramètre et précéder la valeur qui lui sera attribuée.

?param=1

Le texte situé après le signe égal correspondra à la valeur attribuée à notre paramètre.

Valeur

?param=1

Paramètre supplémentaire

Afin d’ajouter d’autres paramètres, le signe “&”, situé après la valeur d’un paramètre, va permettre d’indiquer qu’un paramètre supplémentaire est présent pour envoyer plus d’informations.

?param=1&p...

14 of 37

Que contient la “requête” à GA ?

https://www.google-analytics.com/r/collect?v=1&_v=j79&a=519127574&t=pageview&_s=1&dl=https%3A%2F%2Fxavier.naudeau.fr%2F&ul=fr-fr&de=UTF-8&dt=Xavier%20Naudeau%20-%20Digital%20marketing%20consultant&sd=24-bit&sr=2560x1440&vp=1369x1298&je=0&_u=QACAAEADQ~&jid=944685157&gjid=282821229&cid=910713421.1572893391&tid=UA-35903501-1&_gid=851172244.1575757043&_r=1&gtm=2wgav9K7N9BRC&z=1843217761

  • v=1
  • _v=j79
  • a=519127574
  • t=pageview
  • _s=1
  • dl=https://xavier.naudeau.fr/
  • dr=https://www.google.com/
  • ul=fr-fr
  • de=UTF-8
  • dt=Xavier Naudeau - Digital marketing consultant
  • sd=24-bit
  • sr=2560x1440
  • vp=1369x1298
  • je=0
  • _u=QACAAEADQ~
  • jid=944685157
  • gjid=282821229
  • cid=910713421.1572893391
  • tid=UA-35903501-1
  • _gid=851172244.1575757043
  • _r=1
  • gtm=2wgav9K7N9BRC
  • z=1843217761��+ via la requête elle-même, l’heure, le fuseau horaire, le navigateur, l’IP, …
  • version du protocole, par défaut:1
  • version du SDK
  • numéro aléatoire pour adsense
  • type de hit (pageview, event, transaction, …)
  • ordre des hits sur la page en cours
  • URL complète de la page en cours
  • source référente
  • langage du navigateur
  • encodage de la page
  • <title> de la page
  • couleurs de l’écran (24-bits, …)
  • résolution de l’écran
  • zone visible à l’écran
  • autorisation java (0 = FALSE)
  • code de vérification de GA
  • id du cookie DoubleClick (JoinID)
  • version du code de tracking
  • id du cookie de l’utilisateur
  • id de la propriété Google Analytics
  • user ID
  • non renseigné
  • id du compte Google Tag Manager
  • numéro aléatoire pour éviter la duplication

15 of 37

t

Quels paramètres regarder ?

Pour les 4 types d’interactions (hits)

Page Vue

Requête envoyée automatiquement à chaque chargement du script Google Analytics (le plus souvent au chargement de la page donc) permettant de savoir quelle page a été vue.

Événement

Requête à coder permettant de savoir qu’une action a eu lieu.

Exemple : clic sur une image, scroll dans la page, ajout au panier, …

Transaction

Requête à coder permettant de savoir qu’une transaction a eu lieu.

Interaction sociale

Requête à coder permettant de savoir qu’une action avec un bouton de Réseau Social a eu lieu (ex=partage sur Twitter d’un article depuis le site).

16 of 37

Quels paramètres regarder ?

Pour la source… ou son absence

Si l’utilisateur clique sur un lien d’un site tiers pour accéder à notre site, le paramètre “dr” aura une valeur.

dr = Google

dr

En utilisant des paramètres spécifiques à Google Analytics (utm) il est possible d’imposer une source quelle que soit la source initiale ou son absence qui sera attribué “après coup par Google Analytics)

dr = ø

+

?utm_source=test

Si l’utilisateur clique sur un lien depuis une application ou un logiciel non-navigateur, aucune information de site précédent n’existera, l’absence de source sera alors qualifié de trafic “Direct”.

dr = ø

Si l’utilisateur clique sur un lien du même site, le paramètre “dr” n’aura pas de valeur et ne sera donc pas présent dans la requête.

dr = ø

17 of 37

=

GA1.2.964770760.1583081841

_ga

Version du cookie (actuellement GA1)

Niveau de placement du cookie (1 = root, 2 = sous-domaine)

Timestamp de la pose du cookie (en secondes)

Nombre aléatoire sur 32-bits (de 1 à 2’147’483’647)

Les 2 derniers nombres (ici 964770760.1583081841) serviront d’identifiant unique à chaque navigateur pour attribuer chaque requête à un même “utilisateur”.

Un cookie est un fichier texte

=

Le cookie est lié au navigateur

+

Un cookie GA expire après 2 ans

Quels paramètres regarder ?

Pour le numéro de cookie

cid

=

GA1.2.964770760.1583081841

_ga

Version du cookie (actuellement GA1)

Niveau de placement du cookie (1 = root, 2 = sous-domaine)

Timestamp de la pose du cookie (en secondes)

Nombre aléatoire sur 32-bits (de 1 à 2’147’483’647)

=

GA1.2.964770760.1583081841

_ga

Version du cookie (actuellement GA1)

Niveau de placement du cookie (1 = root, 2 = sous-domaine)

Timestamp de la pose du cookie (en secondes)

Nombre aléatoire sur 32-bits (de 1 à 2’147’483’647)

18 of 37

Quels paramètres regarder ?

Pour la propriété Google Analytics

Compte Google (user)

Peut accéder jusqu’à 100 comptes Google Analytics.

Peut avoir jusqu’à 50 propriétés Google Analytics.

Compte Google Analytics

12345

Peut avoir jusqu’à 25 vues Google Analytics.

Propriété Google Analytics

UA-12345-1

Configuration et filtres permettant d’affiner les données et d’exclure le spamm.

Vue Google Analytics

tid

19 of 37

Quelques tips

Pour mesurer au mieux sur son site il faut à minima penser à :

Éviter les sites codés avec des librairies Javascript (NodeJs, AngularJs, BiduleJs, …) qui vont nécessiter des configurations custom pour faire fonctionner votre analytics.

Toujours ajouter des “utm” aux URL de destination de vos campagnes numériques.

Penser aux dimensions personnalisées qui permettent d’apprendre beaucoup de choses sur votre site et vos internautes.

20 of 37

Les quoi ?

Pour remonter n’importe quelle information

Valeur du panier

Permet de connaître la valeur du panier à chaque interaction pour retracer le parcours utilisateur.

Identifiant client

Permet d’identifier les interactions d’un client sur plusieurs supports informatiques (desktop, mobile, tablet).

Données CRM

Permet de remonter des informations liées au client comme le nombre d’achats, sa LTV, ...

Usage de bloqueurs

Pour les sites dont le business model est porté sur la pub, il est important de surveiller l’évolution des bloqueurs de pubs qui impactent directement vos revenus.

cdx

21 of 37

Création des visites

22 of 37

Que fait Google des requêtes ?

Attribution des données à la bonne propriété définies par le tid.

Filtrer les interactions de chaque cookie grâce au cid (cookies).

Regrouper les interactions (paramètre t)d’un même cookie en sessions (visites) suivant des règles pré-établies.

Ré-agréger ces données dans des “vues” prêtes à être analysées sur l’interface web de Google Analytics.

23 of 37

Que sont les sessions ?

Une session (visite) est un regroupement d’interactions (hits) pour un même cookie (utilisateur) suivant les critères suivants :

Le temps

Le temps entre chaque interaction va permettre de regrouper les interactions entre elles.

24 of 37

Temps entre chaque interaction

< 30min.

< 30min.

< 30min.

< 30min.

< 30min.

> 30min

> 30min

Session

Google Analytics, pour chaque cookie, va regrouper les “interactions” (hits) ayant moins de 30 minutes d’écart entre chacun pour former une session (visite).

Cas particuliers:

  • Il est possible de rendre les interactions (hits) non-interactives, ces interactions ne prolongeront pas le compteur de 30 minutes.�
  • Si un utilisateur ne génère que des interactions non-interactives, il n’y aura pas de session comptabilisée mais bien un utilisateur de compté.

Moins de 30 minutes

25 of 37

Que sont les sessions ?

Une session (visite) est un regroupement d’interactions (hits) pour un même cookie (utilisateur) suivant les critères suivants

Le temps

Le temps entre chaque interaction va permettre de regrouper les interactions entre elles.

L’heure va permettre de séparer les interactions entre chaque jour.

L’heure

26 of 37

La fin de la journée

À chaque fin de journée du fuseau horaire choisi, Google Analytics va clore toutes les sessions en cours.

La prochaine interaction va donc créer une nouvelle session.

Cas particuliers:

  • Il est possible de définir un fuseau horaire différent pour chaque vue d’une même propriété (site).
    • Ex: Site en Suisse avec des clients aux USA => vue dédiée pour les USA afin d’analyser les performances suivant les moments forts de la journée.

Minuit

Session

Session

0:00

27 of 37

L’heure va permettre de séparer les interactions entre chaque jour.

Que sont les sessions ?

Une session (visite) est un regroupement d’interactions (hits) pour un même cookie (utilisateur) suivant les critères suivants

Le temps

L’heure

Le temps entre chaque interaction va permettre de regrouper les interactions entre elles.

La source

Le changement de source va séparer les interactions.

28 of 37

Une nouvelle source par session

À chaque fois qu’une source différente de l’actuelle est détectée, toutes les interactions suivantes seront regroupées dans une nouvelle session.�

Cas particuliers:

  • Si l’on revient pendant la période de 30 minutes sans source (direct) ou exactement de la même manière, la session continuera.�
  • Si l’on revient par Google Ads de la même manière exactement, il y aura cependant 2 sessions distinctes étant donné que chaque clic incorpore un identifiant unique gclid.

Changement de source

Session

Session

Facebook

Google

29 of 37

Pour mesurer au mieux sur son site il faut à minima penser à :

Bien choisir la timezone de vos vues Google Analytics pour éviter l’accroissement artificiel de vos sessions.

Utiliser des évènements pour mesurer les interactions en plus des pages vues et prolonger la durée de vie d’une session.

Bloquer les sites de paiements en ligne dans vos listes d’exclusion de site référents pour éviter une mauvaise attribution des ventes.

Quelques tips

30 of 37

Take the

red pill

31 of 37

L’attribution non-directe

Google

Session

Mail

Session

Direct

Session

Une autre règle se cache dans la manière de gérer les sessions :

Toute session sans source sera attribuée à la dernière source.

S’il n’existe pas de visite précédente, la source sera directe.

Par défaut la dernière source expire après 6 mois.

Dans cet exemple, le rapport final de Google Analytics affichera :

  • 1 session depuis Google
  • 2 sessions depuis Mail

Google

Session

Mail

Session

Mail

Session

Direct

32 of 37

L’arnaque du�(not provided)

Octobre 2011, Google ne partage plus les mots-clefs aux outils de tracking.

Août 2012, plus de 90% des mots-clefs apparaissent désormais comme (not provided).

Au-delà d’une perte de données cruciales pour les équipes marketing, cela a également eu un impact sur la qualification des sources.

(not provided)

Google organique

Session

Google organique

Session

Google organique

Session

- de 30 min.

+ de 30 min.

Google organique

Session

Google organique

Session

Direct

Dans cet exemple, voici l’impact du (not provided) et de la règle cachée :

  • La 2ᵉ source étant similaire dans un délai <30 min, il n’y aura qu’une seule session.
  • La 3ᵉ source étant semblable dans un délai >30 min, il y aura une autre session “directe” réattribuée à Google organique.

33 of 37

La menace fantôme

Les règles externes

Plus d’infos ici : https://bit.ly/cookie_xn

Cookies tiers bloqués.

Après 7j ou 24h si lien tracké ou provenant d’un vendeur de pub.

Apple, à travers Safari 11, se lance dans la lutte contre l’invasion de la vie privée des utilisateurs sur internet via le projet Intelligent Tracking Prevention (ITP).

Apple, oui, eux :

34 of 37

À travers ces règles plusieurs conséquences :

Une impossibilité de comparer proprement les clicks de la Search Console avec les sessions SEO.

L’accroissement du nombre de sessions des leviers à forte rétention (ex: CRM).

Si on résume...

Avec Safari (ITP), la durée de vie des cookies étant réduite à 1 semaine max, on observe une hausse des Nouveaux Utilisateurs ainsi qu’une plus faible ré-attribution du Direct à d’autres leviers dont le SEO.

Une durée d’expiration de la dernière campagne à 6 mois rarement reconfigurée.

35 of 37

Le metric maudit

36 of 37

Qu’est ce que le taux de rebond ?

Une visite avec rebond est une visite avec une seule interaction.

Une seule page vue

Par défaut, une session avec une seule page vue sera considérée comme un rebond.�

L’ajout d’un événement “interactif” ou le déclenchement d’une seconde page vue annihile toute chance de rebond.

Un recalcul

En ajoutant des évènements “non-interactif” on conserve le taux de rebond tel quel.�

Cependant, on peut par la suite sélectionner les sessions avec rebond ayant déclenché ces événements et ainsi recalculer le rebond.

Un temps nul

Le temps d’une session qui rebondit sera toujours égal à 0s.�

Cela s’explique par le calcul qui est réalisé entre 2 pages vues d’une même session.

Le taux de rebond idéal

Outre son manque de fiabilité, analyser un taux de rebond à l’échelle d’un site voire pire le comparer à un concurrent rend ce metric totalement inutile.��Sa seule application possible est avec un contexte fort (type de pages, période de temps, campagnes, …)

42

37 of 37

À vos questions