Google Analytics vs XiTi: la mesure de l’origine des visites

Il y a quelque chose que j’ai toujours eu du mal à comprendre. Comment fait Google Analytics pour relever que la majorité de nos visites proviennent de… Google, quand n’importe quel autre outil de mesure de web analytics nous donne un pourcentage largement inférieur ?

Prenons un cas concret : chez Toprural, nous utilisons en parallèle XiTi (ATInternet) et Google Analytics (GA). Au mois de janvier 2009, GA indique que 71,8% des visiteurs ont accédé au site via un moteur de recherche alors que XiTi en rapporte 37,8%.

Origine des visites www.toprural.com, jan/09, selon Google Analytics

Origine des visites http://www.toprural.com, jan/09, selon Google Analytics

Origine des visites www.toprural.com, jan/09, selon XiTi

Origine des visites http://www.toprural.com, jan/09, selon XiTi

Comment s’explique une telle différence ?

Deux facteurs expliquent une telle différence.

1e partie de l’explication :
XiTi sépare les visites qui proviennent des moteurs de recherches en 2 groupes : "moteurs de recherche" et "notoriété". "Moteur de recherche" comprend les visites qui arrivent à votre site à partir des résultats de recherche génériques et "notoriété" représente les visites obtenues à partir de recherches de notre nom (par exemple: les utilisateurs qui ont recherché “toprural”, “top rural”, “www.toprural.com”, “toprural.com”, etc.).

Mais le fait que la "notoriété" soit mesurée à part n’explique pas un tel écart entre les résultats de Google et ceux de XiTi. Google Analytics donne un total de 71,8% de visites issues des moteur de recherche alors que XiTi obtient 54,3% en additionnant "moteurs de recherche" et "notoriété".

2e partie de l’explication :
Grâce au cookie __utmz Google Analytics attribue aux sources externes toutes les visites d’un utilisateur qui a accédé au site ne fut-ce qu’une seule fois par une source externe au cours des 6 derniers mois. Cette durée du cookie est configurable mais la valeur par défaut est de 6 mois.

Exemple : Pierrot visite votre site 2 fois de manière directe (il tape votre url dans la barre d’adresse du navigateur), après quoi il y vient une fois au travers des résultats d’une recherche sur Google. Puis il visite le site 3 fois encore en direct, sans repasser par Google, dans les 6 mois qui suivent.

Combien de visites depuis Google, GA indiquera ? 4 (1 + les 3 suivantes). Combien de visites directes indiquées ? 2 (les deux premières). Alors qu’en réalité il y a bien 1 visite par le biais de Google et 5 visites naturelles/directes.

XiTi est plus proche de ce que je considère comme la réalité : il indiquera 1 visite de Google et 5 visites directes vers votre site.

La politique de mesure de GA répond à une logique de marketing en attribuant à la source externe toutes les visites postérieures. Ce que personnellement je trouve plutôt douteux c’est que cette manière d’attribuer les visites n’est pas expliquée clairement pour les utilisateurs non-experts, et que la valeur par défaut du cookie soit de 6 mois, alors que la pratique générale en ce domaine est d’attribuer les visites à la dernière source externe pendant 30 jours.

Avinash Kaushik, un des experts en analyses web et Analytics Evangelist chez Google nous explique la politique de Google dans la version en espagnol de mon blog.

[...]
Voici une bonne façon de de penser le fonctionnement de Google Analytics : La dernière campagne reçoit le crédit
Pour les besoins de la discussion présente, désignons par campagnes email, recherche, affiliation, vidéo, médias sociaux, et tout ce que vous pouvez imaginer.

Voici quelques scénarios de comment ça marche (dans le cas de visites multiples)

Visite directe, email, conversion. Reçoit le crédit : l’email

Email, visite directe, conversion. Crédit : l’email

Email, accès par annonce publicitaire, moteur de recherches, conversion. Crédit : moteur de recherches

[lire la suite du commentaire en anglais]

Sur le même sujet, Pablo Román directeur de XiTi Espagne nous explique :

Dans le cas de XiTi, nous mesurons exactement comment tu l’expliques. Après, dans le cas de conversions, nous sommes capables de dire que les visites directes de Pierrot après la visite en provenance de Google sont des postclicks, des rémanences de la-dite recherche sur Google, mais nous allons comptabiliser les visites comme des accès directs.

Moralité : les données par défaut de Google Analytics nous incitent à penser que nous dépendons de Google pour 2 tiers des visites sur Toprural, alors qu’en réalité nous en dépendons pour 1 tiers des visites (moitié moins de ce que nous indique Google).

Google Analytics n’est pas un indicateur neutre. C’est une partie intéressée. Ils ont tout intérêt à à nous faire penser que Google est incontournable et il n’y a pas loin à penser qu’ils nous présentent les résultats comme ça les arrange.

Ce n’est pas une raison pour "jeter le bébé avec l’eau du bain" et abandonner Google Analytics, qui n’en est pas moins un outil très intéressant et gratuit alors que XiTi est payant. Cependant, je pense qu’il est important de ne pas dépendre que de GA pour étudier le traffic d’un site et de ne pas baser ses analyses sur les seules données fournies par GA.

Articles reliés:

About these ads

Tags: , ,

21 Réponses to “Google Analytics vs XiTi: la mesure de l’origine des visites”

  1. Arnaud Guerrand Says:

    Francois,
    Je vois que le theme a franchi les Pyrenees et passe au Francais: je lui souhaite autant de succes qu’a la version castillane.
    Je tiens au passage à mentionner l’excellence du cas d’ etude que tu as presente’, permettant avant tout l’education generale des utilisateurs d’outils de Web Analytics.
    Continue a dejeuner avec Nacho regulierement, si chaque rencontre peut nous permettre de mieux partager ces analyses.
    Merci!

  2. Olivier Says:

    Bonjour François,
    bonne analyse sur le fait que GA conserve la dernière campagne comme provenance alors que Xiti est capable de gérer la rémanence de sources.

    Attention en revanche aux conclusions : l’écart 1/3 – 2/3 est principalement lié à la séparation du trafic moteur marque VS hors marque, et non au retour des visiteurs en accès direct, qui peuvent représenter quelques % mais n’expliquent pas un écart du simple au double.

    Par ailleurs il faut préciser que sur Xiti le rapport de notoriété ne se fait pas tout seul : c’est à l’utilisateur de cocher les termes qui correspondent à du trafic de notoriété.

    Donc la comparaison entre les deux outils doit se faire plutot entre le trafic Google identifié par Google Analytics et le trafic moteur de Xiti + le trafic notoriété de Xiti

    Félicitations pour le blog et bonne continuation

  3. Arnaud Says:

    Olivier,
    je retournerai le commentaire sur les conclusions hatives sur la classification des sources de traffic.
    Pour GA, du fait de l´association (par cookie) des visites directes post premiere visite depuis un moteur Google, toutes les visites directes sont classees comme visite de moteur, et non pas en visites directes.
    Pour XiTi, l´association n´existe pas et une visiste directe est une visite directe, independemment d´une visite passee venant du moteur Google.
    Et ceci explique bien la difference observee par Francois.
    Le traffic (marque + hors marque) est juste une disctinction faite sur le traffic total de moteurs: aucune relation avec le traffic direct ici.

    Le theme ici est bien le traitement du moteur de recherche comme source de campagne avec "remanence automatique" de l´ensemble du traffic direct, dans le cas de GA.

    A bientot!

  4. Olivier Says:

    Hello,

    Et je suis d’accord avec le raisonnement, le thème principal du billet et le fait que GA n’écrase pas le cookie de campagne en cas de visite directe suite à une précédente visite. J’avais d’ailleurs écrit quelque chose sur ce sujet fin 2007 :

    http://www.wagablog.com/2007/11/les-cookies-geres-par-google-analytics/27

    Je dis juste que la part du trafic Google ne correspond pas à 1/3 et 2/3 selon les outils comme c’est écrit dans la moralité de l’histoire :)
    On est plus dans le cas présent sur du 55% / 70%.

    Bien sur, cela reste beaucoup et il faut avoir conscience de cet écart – surtout si on a un site avec un taux de retour élevé.

    L’objectif d’un tel traitement de la part de Google Analytics est de pouvoir attribuer une conversion à la dernière campagne trackée, hors accès direct. C’est donc bien d’une logique marketing comme le précise François dans son article. Il est même possible d’ajouter certains referer ou sources de trafic pour les traiter comme des accès directs. On peut par exemple demander à GA de ne pas écraser la dernière campagne avec du trafic moteur marque.

    Au plaisir de vous lire :)

  5. Julien Coquet Says:

    Ah la course à la dernière campagne ;-)

    Au-delà des visites en provenance de moteurs de recherche, il y a également toute la notion de re-marketing et campagnes ultérieures: ou comment mesurer la fidélisation.

    Alors effectivement, d’aucuns me diront qu’une solution d’e-mailing fait çà tout seul comme un grand mais c’est quand mieux plus pratique d’avoir cette information intégrée à son outil de web analytics :-)

    Amicalement,

    Julien Coquet
    Association Web Analytics – France

  6. Le referencement naturel Says:

    Bonjour,

    Article intéressant ; n’oubliez pas que Google Analytics associe sous le terme "trafic en provenance des moteurs" le trafic issu des résultats naturels et des liens sponsorisés. Ce qui n’est pas le cas de Xiti…

    Cordialement.

  7. Google Analytics meets a healthy dollop of cynicism « Long tale marketing Says:

    [...] he seems to imply, is why GA is [...]

  8. Does Google Analytics overstate the value of search? | rapid-DEV.net Says:

    [...] fantastic post by Francois Derbaix, CTO at top French travel site Toprural.com, tells us that Google is as susceptible as anyone else [...]

  9. Android Says:

    Bonjour,

    je viens de découvrir cet article fortement intéressant.

    Pour information, j’ai mis en place Google Analytics et Xiti Analyzer 2 sur un site ecommerce.

    Finalement je suis en train de me dire que GA serait plus "juste" quant à la répartition d’un CA par source. Je m’explique.

    Si Pierrot vient sur mon site via Google (via moteurs et non notoriété), bookmark le site et 20 jours après revient via le bookmark pour effectuer son achat.

    GA > CA provenant de Google
    XITI > CA provenant de l’accès direct.

    Dans ce cas, GA sera plus juste car c le levier référencement naturel qui a permis de déclencher une vente.

    A noter : les internautes comparent les prix et effectuent plusieurs visites. Le levier source est donc capital afin de mesurer l’efficacité des différentes actions.

    J’aimerais vraiment avoir votre sentiment.

    Merci bcp
    A

  10. stat-e-stik Says:

    Il me semble que l’analyse de notoriété est également disponible sur google analytics. Il est possible d’extraire le trafic de recherche afférent à certains mots clés liés à la notoriété et de le reclasser en trafic direct.
    (fonction _addIgnoredOrganic)

  11. Sébastien Brodeur Says:

    Merci!

    Je cherche une réponse à cette question depuis plusieurs mois.

  12. H5N1 Says:

    Bonjour,
    Android, quel intérêt il y a t il à connaître le CA généré par Google (ou un autre moteur) si on ne mise que sur le référencement naturel ?
    Si pierrot vient sur le site via moteur le 01/07 et qu’il est de nouveau comptabilisé le 15/07 alors qu’il provient par bookmark, il y a de grandes chances que les visites par moteur ne chutent pas dans les stat. Alors que 15j après le site peut très bien avoir chuté en référencement sur le même terme de recherche, et le webmaster n’aura pas l’info de cette chute, ou tout du moins la puce à l’oreille.
    Tous ces outils stat n’ont d’intérêt que pour le référencement. Le CA en découlera soit, mais en référencement naturel ça n’a aucun intérêt, puisqu’il n’y a pas de coût.

  13. Julien Coquet Says:

    @Android

    "en référencement naturel ça n’a aucun intérêt, puisqu’il n’y a pas de coût"

    Dites çà à l’annonceur qui doit rentabiliser un budget d’optimisation par une agence SEO…

    De toute façon, même si vous faites optimiser votre contenu par un stagiaire que vous ne payez pas, votre site web est un centre de coût pour votre entreprise, d’une manière ou d’une autre.

    Julien Coquet

  14. H5N1 Says:

    C’est tout à fait exact ! J’ai effectivement dit une ânerie
    Mais en partant de la logique d’Androïd on devra considérer que chaque visite sur le site sera lié directement ou indirectement à un moteur. Car même une visite via lien référant aura de forte chance de provenir à l’origine d’une recherche via un moteur. Enfin si Pierrot a mis le site dans ses favoris pour le revisiter 15 jours plus tard, ce n’est pas grâce à Google mais grâce principalement à l’intérêt du site à ses yeux. Donc en terme de CA, s’amuser à attribuer tel % part à Google, tel autres aux liens référant etc … c’est couper les cheveux en 4.

  15. Android Says:

    Bonjour et merci de vos réponses.
    Je confirme, étant référenceur en agence (mais bientôt à mon compte !!), tous nos clients aiment savoir ce que rapportent les différents investissements. 1 euro investi rapporte combien ?
    La remarque de H5N1 est juste : ce qui est important c’est d’arriver à estimer au maximum le ROI des actions y compris le SEO. La découverte se fait via Google mais la revisite via l’offre ou l’intérêt.
    Très bonne journée

  16. Google analytics bouchonné ? « Marc Roisin Says:

    [...] y a quelques mois, je lisais le post de François Derbaix intitulé Google Analytics vs. Xiti appliqué au guide de logements ruraux Toprural (les 144 réactions déclenchées par la version [...]

  17. Fab Says:

    [...] y a quelques mois, je lisais le post de François Derbaix intitulé Google Analytics vs. Xiti appliqué au guide de logements ruraux Toprural (les 144 réactions déclenchées par la version [...]
    +1000

  18. Thierry @ Services Cesu Says:

    Merci pour cet article ultra interréssant.
    Il y a une chose que je ne comprends pas, c’est pourquoi dans les résultats des expréssions cles des moteurs de recherche avec xiti, il y a ce [-] qui indique on ne sait pas quoi ( pour une partie d’entre eux ) ?

  19. Ouaieb Says:

    Merci pour ton article que je vais d’ailleur prochainement citer sur mon blog : ouaieb.wordpress.com

  20. Ouaieb ! Says:

    […] Pour vous faire une idée des deux outils un bloggeur a réaliser une comparaison intéressante à cette adresse (http://fr.francoisderbaix.com/2009/02/24/google-analytics-xiti-origine-des-visites/) […]

  21. Outils d'analyse WEB: Web analytiques et statistiques d'audience Says:

    […] par Xiti. Ces discordances dans les résultats sont rapportées et expliquées souvent du fait que Google Analytics n’est pas un indicateur neutre. Il est établi que les données Web analytiques ne sont pas exactes mais […]

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s


Suivre

Recevez les nouvelles publications par mail.

%d bloggers like this: