Utilisation des données brutes dans Google Analytics en pratique

Nous pensons depuis longtemps que les outils standard de Google Analytics sont le meilleur moyen d'obtenir des informations utiles. Parfois, j'ai dû faire face à certaines limitations et à des résultats plutÎt étranges, et il semblait que cela n'était pas fini, jusqu'à ce que certains analystes découvrent Google Analytics 360 et les mécanismes d'exportation des données brutes vers Google BigQuery.

AprĂšs seulement quelques heures de travail avec des outils plus avancĂ©s et des requĂȘtes SQL, nous avons pu extraire des informations que nous n'aurions jamais reçues en utilisant uniquement des rapports agrĂ©gĂ©s de Google Analytics. À partir de ce moment, nous nous sommes concentrĂ©s sur l'Ă©tude des caractĂ©ristiques des donnĂ©es brutes («brutes») et sur les avantages pratiques que les experts du Web peuvent en tirer.

Cet article répond aux questions suivantes:

  • Quelle est la diffĂ©rence entre les donnĂ©es brutes et les donnĂ©es rĂ©capitulatives?
  • Quels sont les avantages de l'utilisation de donnĂ©es brutes?
  • Comment accĂ©der aux donnĂ©es brutes?
  • Comment utiliser ces nouvelles donnĂ©es (exemples pratiques)?

Quelle est la différence entre les données brutes et récapitulatives dans Google Analytics


En utilisant la version gratuite de Google Analytics, vous ne pouvez obtenir que des données récapitulatives. Autrement dit, les informations de visualisation complÚtes pour une visite et un événement particuliers ne seront pas disponibles. Bien sûr, le rapport User Explorer contient de nombreuses informations utiles que l'analyse Web peut utiliser. Cependant, certaines restrictions sont imposées à ce fichier: il n'est pas évolutif et n'est pas disponible en téléchargement.

Dans la plupart des cas, il suffit de disposer de données résumées pour obtenir des réponses aux questions courantes:

  • Quelle campagne gĂ©nĂšre le plus de conversions?
  • Quelle est la frĂ©quence de la technologie d'apprentissage automatique de Feature X (sa base d'utilisateurs augmente-t-elle)?
  • D'oĂč viennent les visiteurs (principales sources de trafic)?
  • À quels appareils les utilisateurs vont-ils?



Vous n'avez pas besoin d'analyser les donnĂ©es brutes pour obtenir les rĂ©ponses aux questions ci-dessus. Les outils de crĂ©ation de rapports personnalisĂ©s ou par dĂ©faut dans Google Analytics peuvent facilement le faire. Le principal problĂšme avec les donnĂ©es rĂ©capitulatives est qu'elles sont agrĂ©gĂ©es. Vous mappez de nombreux types d'actions utilisateur qui peuvent ĂȘtre utilisĂ©s pour masquer des informations trĂšs utiles. Nous donnons un exemple avec des vues de plusieurs pages en une seule session. Nous avons deux sources avec six sessions avec le nombre suivant de pages vues en une seule session:

  • Source A: 1, 1, 2, 2, 2, 10;
  • Source B: 2, 2, 3, 3, 4, 4.

En utilisant la mĂ©thode des valeurs aberrantes statistiques, on peut dĂ©terminer que la source A caractĂ©rise un utilisateur avec un degrĂ© d'implication plus faible. Mais si nous considĂ©rons uniquement les donnĂ©es moyennes, nous pouvons conclure que la mĂȘme implication pour les deux sources, car le nombre de pages est le mĂȘme (la mĂ©diane peut ĂȘtre quelconque).

Pourquoi les rapports d'analyse standard ne contiennent-ils pas ces données? La raison principale est le coût de calcul. En ne fournissant que des données récapitulatives sélectives, il n'est pas nécessaire de traiter les millions de lignes contenues dans le rapport. Par conséquent, la version gratuite de Google Analytics ne contient pas d'outils pour effectuer gratuitement des calculs avancés.

Quelles informations peuvent ĂȘtre extraites des donnĂ©es brutes


Comprendre les limites des donnĂ©es rĂ©capitulatives, il est temps de dĂ©couvrir comment les donnĂ©es brutes peuvent ĂȘtre utilisĂ©es. ConsidĂ©rez plusieurs options pour leur application.

Durée de l'événement


L'une des limites auxquelles est confronté tout analyste Web utilisant des outils Google Analytics standard est que vous ne pouvez pas déterminer l'intervalle de temps entre le placement d'un article dans le panier et la réalisation d'un achat, que cette action se produise ou non en une seule session. Bien sûr, pour cela, vous pouvez utiliser des cookies et faire vos propres calculs. Mais cela est inutile, d'autant plus que Google Analytics a déjà fait ce travail pour nous.

AprĂšs avoir analysĂ© les donnĂ©es brutes, vous pouvez facilement dĂ©terminer l'heure exacte Ă  laquelle l'Ă©vĂ©nement s'est produit pour un utilisateur particulier, effectuer une analyse comparative avec un autre Ă©vĂ©nement pour le mĂȘme utilisateur. Vous pouvez Ă©galement agrĂ©ger les donnĂ©es Ă  votre discrĂ©tion, aprĂšs avoir obtenu une distribution moyenne, mĂ©diane ou centile, ou utiliser un autre modĂšle statistique avancĂ©. Le fait que 20% des utilisateurs effectuent l'action cible en 2 minutes et 10% - pendant toute la semaine, n'a-t-il pas d'importance? Avec ces connaissances, vous utiliserez diffĂ©rentes approches pour interagir avec ces deux catĂ©gories d'utilisateurs.

Analyse de la taille de l'audience


Les rapports Google Analytics et Google Analytics 360 contiennent des données de segmentation des visiteurs au cours des 90 derniers jours. Souvent, pour obtenir des données fiables, une analyse est nécessaire à de plus longues distances (en particulier pour les grandes entreprises). Sur la base de l'analyse des données brutes, vous pouvez obtenir des réponses aux questions suivantes:

  1. Est-il plus probable que les utilisateurs impliquĂ©s dans la pĂ©riode des fĂȘtes achĂšteront le produit en septembre que la probabilitĂ© de faire un achat par d'autres catĂ©gories d'utilisateurs au cours du mĂȘme mois?
  2. Quel est l'effet de regarder des vidéos tout au long de l'année et comment cela affecte-t-il le nombre de conversions?

En utilisant des données brutes, vous pouvez stocker des journaux d'événements pour une durée illimitée et les supprimer uniquement lorsque ces données sont déjà désespérément obsolÚtes.

Relations entre les données


Un coefficient de corrélation est introduit pour déterminer la relation statistique entre deux valeurs variables. Lors de l'analyse de grandes quantités de données, vous pouvez déterminer la relation entre deux types de comportement des utilisateurs:

  • Comment les pages vues affectent-elles les performances d'une action ciblĂ©e?
  • Existe-t-il un lien entre le type de contenu consommĂ© et le produit que l'utilisateur acquiert finalement?
  • Existe-t-il des produits associĂ©s? Par exemple, si quelqu'un achĂšte le produit A, quelle catĂ©gorie de produit lui est associĂ©e?

Données tierces


Enfin et surtout, les données brutes vous permettent d'obtenir beaucoup plus d'informations si vous connectez d'autres sources de données. Voici quelques exemples illustratifs:

DonnĂ©es de commerce Ă©lectronique. L'outil est plus utile si vous enregistrez l'ID client dans Google Analytics, qui a effectuĂ© toutes les actions Ă  ajouter au panier ou Ă  passer une commande. Cela vous permettra de calculer la valeur exacte du taux de conversion, mĂȘme si les outils de Google Analytics n'ont pas fonctionnĂ© (en raison des bloqueurs de publicitĂ©s utilisĂ©s par les clients, de l'absence de redirection depuis la page de paiement, du long temps d'attente pour le chargement de la page et d'autres raisons). De plus, en fonction de vos propres donnĂ©es, vous pouvez exclure les actions cibles annulĂ©es et les retours pour recalculer le profit rĂ©el. Il vous permet Ă©galement de calculer des indicateurs plus complexes et fermĂ©s, par exemple, la marge au lieu du revenu.

DonnĂ©es CRM. Quoi de pire que le fait qu'un grand nombre de leads contiennent un grand nombre de leads non pertinents? Il s'agit d'un problĂšme courant pour les services en ligne B2B. En exportant des donnĂ©es CRM avec des identifiants de prospects uniques (identifiant client chiffrĂ© Ă  l'aide de la messagerie SHA-256, identifiant gĂ©nĂ©rĂ©, etc.), vous pouvez facilement les associer Ă  des identifiants client dans Google Analytics. Cela vous permettra de calculer non seulement le pourcentage de leads gĂ©nĂ©rĂ©s, mais Ă©galement le taux de conversion. L'analyse multicanal nĂ©cessitera des requĂȘtes plus complexes, mais vous pouvez contrĂŽler entiĂšrement le processus de calcul.

ÉvĂ©nements hors ligne. Les affaires en ligne sont affectĂ©es par de nombreux facteurs externes: vacances, conditions mĂ©tĂ©orologiques, grĂšves, un virus mortel qui a envoyĂ© la moitiĂ© de la population mondiale Ă  l'auto-isolement. Google Analytics ne permet pas d'introduire de nouveaux paramĂštres Ă  Ă©tudier pendant une certaine pĂ©riode de temps. Quant aux annotations, elles ne sont pas impliquĂ©es dans les calculs et sont utilisĂ©es uniquement comme Ă©lĂ©ment d'interface utilisateur. Cependant, il serait utile de savoir comment les vacances affectent le nombre de ventes.



Pour effectuer une telle analyse, il est nécessaire de collecter des informations et de les fournir dans un format lisible. En faisant cela, vous aurez des données pertinentes et pertinentes.

Annonces, robots de recherche, journaux - toutes ces donnĂ©es doivent ĂȘtre stockĂ©es dans un seul rĂ©fĂ©rentiel.
En apprenant Ă  les comparer avec des donnĂ©es analytiques, vous pouvez rĂ©aliser vos rĂȘves les plus fous:

  • Un contenu plus long attire-t-il les utilisateurs? En choisissant le bon robot de recherche (par exemple, Screaming Frog), vous pouvez Ă©tablir la relation entre la longueur du contenu texte et le nombre de pages vues.
  • Le comportement des moteurs de recherche affecte-t-il l'optimisation du rĂ©fĂ©rencement? À l'aide des donnĂ©es du journal BigQuery, vous pouvez dĂ©terminer comment la frĂ©quence des visites du robot de recherche affecte les rĂ©sultats de la recherche.

Quelle est la véritable rentabilité de votre entreprise? AprÚs avoir effectué les réglages dans l'algorithme de calcul d'attribution, vous pouvez mesurer le retour sur investissement dans les campagnes publicitaires pour toutes les plateformes utilisées.

Outils d'extraction de données brutes


Les informations présentées ci-dessus privilégient les données brutes. Mais comment les obtenir? Considérez certaines des méthodes les plus courantes.

Google Analytics 360


Si vous avez la chance d'accéder à ce service ou si vous disposez d'un budget suffisant pour payer le coût de son utilisation, vous disposez du meilleur outil pour extraire des données brutes de Google BigQuery. Il vous permet d'exporter toutes les informations, y compris les données avancées de commerce électronique. Chaque ligne correspond à une session spécifique et vous pouvez utiliser un grand nombre de paramÚtres et de métriques.

Application Google Analytics + Web et Firebase


RĂ©cemment, l'analyse Web a pu exporter des donnĂ©es vers Google BigQuery sans avoir Ă  acheter Google Analytics 360. Firebase, qui est au cƓur de Google Analytics App + Web, prend en charge la fonctionnalitĂ© d'exportation vers Google BigQuery. Vous serez facturĂ© avec Blaze, qui utilise une approche par rĂ©partition. Si vous avez un grand portail Internet, vous devrez garder une trace de votre budget. Pour les petits sites, les coĂ»ts varient de rien Ă  quelques dollars par mois.

Chaque ligne correspond Ă  un Ă©vĂ©nement contenant un Ă©cran ou une page vue. Vous devrez vous habituer Ă  cette maniĂšre trĂšs spĂ©cifique de prĂ©senter les donnĂ©es, diffĂ©rente de celle utilisĂ©e dans Google Analytics. Cependant, ce service peut ĂȘtre la meilleure solution pour ceux qui souhaitent utiliser des donnĂ©es brutes.

Autres outils gratuits: Yandex.Metrica et Matomo


Je n'ai pas pu essayer tous les outils, car beaucoup d'entre eux sont payĂ©s. Chacun d'eux contient des fonctionnalitĂ©s pour exporter des donnĂ©es brutes. Cependant, il existe deux services en ligne absolument gratuits qui offrent les mĂȘmes fonctionnalitĂ©s et ne facturent pas leur utilisation.

Yandex.Metrica est un outil absolument gratuit qui permet d'accĂ©der aux donnĂ©es brutes via l'API de ses journaux. Matomo est un outil d'analyse open source qui doit ĂȘtre installĂ© directement sur votre serveur oĂč se trouvent les fichiers du site. Il exporte les donnĂ©es brutes directement dans votre base de donnĂ©es.

Pipeline de données


Une autre façon de télécharger des données Google Analytics directement dans votre entrepÎt de données est via le pipeline de données. OWOX BI organise un puissant flux de données entre Google Analytics et BigQuery. Pour implémenter la fonctionnalité, vous devez créer une tùche personnalisée dans Google Analytics. Il crée des copies de la charge utile de Google Analytics et la transfÚre vers l'entrepÎt de données final.

Possédant une expérience suffisante, vous pourrez créer indépendamment votre propre point de terminaison pour le téléchargement de données en utilisant la fonctionnalité du service cloud et sur la base de l'analyse du journal. Voici deux ressources utiles pour vous aider à comprendre cela:
Simo Ahab - "Comment construire un moniteur GTM." AprĂšs avoir lu cet article, vous apprendrez comment envoyer des donnĂ©es Ă  BigQuery Ă  l'aide des fonctions cloud. La quantitĂ© de donnĂ©es transmises est limitĂ©e Ă  100 000 lignes par seconde, qui peuvent ĂȘtre intĂ©grĂ©es au service BigQuery. Si le nombre de lignes dĂ©passe la valeur maximale indiquĂ©e ci-dessus, vous devrez regrouper les donnĂ©es de plusieurs journaux.

Centre d'aide Google Cloud - Architecture de suivi des pixels sans serveur Cette source explique le mécanisme de création de votre propre pixel de suivi, suivi de l'intégration dans BigQuery.

Exemples et cas particuliers d'utilisation de BigQuery


Vous connaissez maintenant les avantages de l'utilisation des données brutes et comment y accéder. Voyons maintenant quelques exemples qui démontrent clairement les principes de l'utilisation de ces données.

Établir une relation entre les sujets et les actions cibles dans Google Analytics 360 L'
analyse a été réalisée pour un site d'actualités avec des abonnés en ligne. L'objectif principal de l'analyse était d'établir une relation (corrélation) entre les sujets d'actualité lus par les utilisateurs et les actions ciblées réalisées.

Le résultat et les conclusions:

corr_culture 0.397
corr_opinion 0.305
corr_lifestyle 0.0468
corr_sport 0.009

La catégorie la plus probable de ceux qui s'abonnent au site sont les utilisateurs intéressés par les sections «Culture» et «Opinions». En revanche, si l'utilisateur s'intéresse aux rubriques «Lifestyle» ou «Sport», la probabilité de s'y abonner est minime.

RequĂȘte pour BigQuery
SELECT
CORR(culture,transac) AS corr_culture,
CORR(opinion,transac) AS corr_opinion,
CORR(lifestyle,transac) AS corr_lifestyle,
CORR(sport,transac) AS corr_sport
FROM(
SELECT
  SUM(IF(hit.page.pagePath LIKE'/culture%',
      1,
      0)) AS culture,
  SUM(IF(hit.page.pagePath LIKE'/opinion%',
      1,
      0)) AS opinion,
  SUM(IF(hit.page.pagePath LIKE'/lifestyle%',
      1,
      0)) AS lifestyle,-
  SUM(IF(hit.page.pagePath LIKE'/sport%',
      1,
      0)) AS sport,      
  COUNT(hit.transaction.transactionId) AS transac
FROM
  `mydatabase.view_id.ga_sessions_*`,
  UNNEST(hits) AS hit
WHERE
  _TABLE_SUFFIX BETWEEN '20191201' AND '20200301'
GROUP BY
  fullVisitorId
ORDER BY
  transac DESC
)


Analyse de cohorte Ă  l'aide de Firebase


Une application avec un contenu réguliÚrement mis à jour et un taux de saisonnalité élevé a été prise pour analyse. L'analyse est effectuée pour trouver des réponses aux questions suivantes:
Comment se comportent les utilisateurs qui ont installé cette application pour la premiÚre fois?

Quel est le meilleur moment pour attirer des clients qui utiliseront réguliÚrement l'application?

RĂ©sultat et conclusions: A en



juger par les données reçues, l'application est le plus souvent utilisée par les clients qui l'ont téléchargée pour la premiÚre fois en septembre et décembre.

RequĂȘte pour BigQuery
# change my-app.analytics_123456789 to your ID
WITH cohorte_september
AS
(
WITH
user_september AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
)
ORDER BY month ASC
),

#october

cohorte_october AS
(
WITH
user_october AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october)
)
)
ORDER BY month ASC
),

#november

cohorte_november AS
(
WITH
user_november AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
)
ORDER BY month ASC
),

#decembre


cohorte_decembre AS
(
WITH
user_decembre AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre )
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
)
ORDER BY month ASC
)

SELECT cohorte_september.sessions AS september_cohort,  
 cohorte_october.sessions AS october_cohort,  
 cohorte_november.sessions AS november_cohort,  
 cohorte_decembre.sessions AS december_cohort,  
 month

FROM cohorte_september
JOIN  cohorte_october USING (month)
JOIN  cohorte_november USING (month)
JOIN  cohorte_decembre USING (month)
ORDER BY month ASC


résultats


Il est fort probable que de sĂ©rieux changements se produisent dans un avenir proche, et Google App + Web deviendra quelque chose comme une norme de l'industrie. Cette approche offre une intĂ©gration plus Ă©troite entre les services Google tels que Marketing Platform et Google Cloud Platform, et en particulier BigQuery. Si vous avez perdu la possibilitĂ© de crĂ©er des requĂȘtes SQL (un langage pour travailler avec le SGBD), je vous recommande fortement de rafraĂźchir vos informations dans votre mĂ©moire et de les pratiquer.

L'analyse de donnĂ©es numĂ©riques avancĂ©es devient un outil de plus en plus puissant grĂące Ă  un accĂšs facile aux donnĂ©es brutes, Ă  des processus informatiques rapides et efficaces et Ă  une bonne visualisation des informations. Dans un avenir proche, une intĂ©gration encore plus Ă©troite avec d'autres types de donnĂ©es d'entreprise sera mise en Ɠuvre.

Depuis de nombreuses années, les experts soutiennent que l'analyse numérique et commerciale doit fonctionner ensemble. Lentement, mais avec confiance, nous nous dirigeons vers la concrétisation de cette idée.

All Articles