استخدام البيانات الأولية في Google Analytics عمليًا

لقد اعتقدنا منذ فترة طويلة أن أدوات Google Analytics القياسية هي أفضل طريقة للحصول على معلومات مفيدة. في بعض الأحيان ، كان عليّ التعامل مع بعض القيود والنتائج الغريبة نوعًا ما ، وبدا أنه لا توجد نهاية لها ، حتى اكتشف بعض المحللين Google Analytics 360 وآليات تصدير البيانات الخام إلى Google BigQuery.

بعد بضع ساعات فقط من العمل باستخدام أدوات أكثر تقدمًا واستعلامات SQL ، تمكنا من استخراج المعلومات التي لم نكن لنستلمها باستخدام التقارير المجمعة فقط من Google Analytics. منذ تلك اللحظة ، ركزنا على دراسة ميزات البيانات الأولية ("الأولية") وعلى الفوائد العملية التي يمكن لخبراء الويب الحصول عليها منها.

تجيب هذه المقالة على الأسئلة التالية:

  • ما الفرق بين البيانات الأولية والملخصة؟
  • ما هي فوائد استخدام البيانات الخام؟
  • كيفية الوصول إلى البيانات الخام؟
  • كيفية استخدام هذه البيانات الجديدة (أمثلة عملية)؟

ما الفرق بين البيانات الأولية والبيانات الموجزة في Google Analytics


باستخدام الإصدار المجاني من Google Analytics ، يمكنك فقط الحصول على بيانات الملخص. بمعنى ، لن تكون معلومات العرض الكاملة لزيارة وحدث معينين متاحة. بالطبع ، يحتوي تقرير User Explorer على الكثير من المعلومات المفيدة التي يمكن أن تستخدمها تحليلات الويب. ومع ذلك ، يتم فرض قيود معينة على هذا الملف: إنه لا يتغير ولا يتوفر للتنزيل.

في معظم الحالات ، يكفي وجود بيانات موجزة فقط للحصول على إجابات للأسئلة الشائعة:

  • أي حملة تحقق أكبر عدد من التحويلات؟
  • ما مدى شيوع تكنولوجيا تعلُّم الآلة في Feature X (هل تنمو قاعدة مستخدميها)؟
  • من أين يأتي الزوار (مصادر الزيارات الرئيسية)؟
  • ما الأجهزة التي ينتقل المستخدمون إليها؟



لست بحاجة إلى تحليل البيانات الأولية للحصول على إجابات للأسئلة أعلاه. يمكن لأدوات إعداد التقارير المخصصة أو الافتراضية في Google Analytics القيام بذلك بسهولة. المشكلة الرئيسية مع البيانات الموجزة هي أنها مجمعة. يمكنك تعيين العديد من أنواع إجراءات المستخدم التي يمكن استخدامها لإخفاء معلومات مفيدة للغاية. نقدم مثالاً على مشاهدات عدة صفحات في جلسة واحدة. لدينا مصدرين مع ست جلسات مع العدد التالي من الصفحات التي تمت مشاهدتها في جلسة واحدة:

  • المصدر أ: 1 ، 1 ، 2 ، 2 ، 2 ، 10 ؛
  • المصدر ب: 2 ، 2 ، 3 ، 3 ، 4 ، 4.

باستخدام الطريقة الإحصائية الشاذة ، يمكن تحديد أن المصدر أ يميز المستخدم بدرجة أقل من المشاركة. ولكن إذا أخذنا في الاعتبار البيانات المتوسطة فقط ، فيمكننا الاستنتاج حول نفس المشاركة لكلا المصدرين ، نظرًا لأن عدد الصفحات هو نفسه (يمكن أن يكون المتوسط).

لماذا لا تحتوي تقارير التحليلات القياسية على هذه البيانات؟ السبب الرئيسي هو التكلفة الحسابية. توفير بيانات تلخيصية انتقائية فقط ، ليست هناك حاجة لمعالجة ملايين الصفوف الواردة في التقرير. لذلك ، لا يحتوي الإصدار المجاني من Google Analytics على أدوات لإجراء العمليات الحسابية المتقدمة على أساس مجاني.

ما هي المعلومات التي يمكن استخلاصها من البيانات الأولية


من خلال فهم قيود البيانات الموجزة ، حان الوقت لمعرفة كيفية استخدام البيانات الأولية. فكر في عدة خيارات لتطبيقها.

مدة الحدث


أحد القيود التي يواجهها أي محلل ويب يستخدم أدوات Google Analytics القياسية هو أنه لا يمكنك تحديد الفاصل الزمني بين وضع عنصر في سلة التسوق وإجراء عملية شراء ، بغض النظر عما إذا كان هذا الإجراء يحدث في جلسة واحدة أم لا. بالطبع ، لهذا يمكنك استخدام ملفات تعريف الارتباط وإجراء الحسابات الخاصة بك. ولكن هذا لا معنى له ، خاصة وأن برنامج Google Analytics قد أنجز هذا العمل لنا بالفعل.

بعد تحليل البيانات الأولية ، يمكنك بسهولة تحديد الوقت المحدد لحدث معين لمستخدم معين ، وإجراء تحليل مقارن بحدث آخر للمستخدم نفسه. يمكنك أيضًا تجميع البيانات حسب تقديرك ، بعد الحصول على توزيع متوسط ​​أو متوسط ​​أو مئوي ، أو استخدام نموذج إحصائي متقدم آخر. هل حقيقة أن 20٪ من المستخدمين يؤدون الإجراء المستهدف في دقيقتين ، و 10٪ - خلال الأسبوع كله ، لا يهم؟ باستخدام هذه المعرفة ، ستستخدم أساليب مختلفة للتفاعل مع هاتين الفئتين من المستخدمين.

تحليل حجم الجمهور


يحتوي كل من تقارير Google Analytics و Google Analytics 360 على بيانات تقسيم الزائرين على مدار التسعين يومًا الماضية. في كثير من الأحيان ، للحصول على بيانات موثوقة ، مطلوب التحليل على مسافات أطول (خاصة للشركات الكبيرة). بناءً على تحليل البيانات الأولية ، يمكنك الحصول على إجابات للأسئلة التالية:

  1. هل من المرجح أن المستخدمين الذين يشاركون في موسم العطلات سيشترون المنتج في سبتمبر من احتمال إجراء عملية شراء حسب فئات المستخدمين الأخرى في نفس الشهر؟
  2. ما هو تأثير مشاهدة مقاطع الفيديو على مدار العام وكيف يؤثر ذلك على عدد التحويلات؟

باستخدام البيانات الأولية ، يمكنك تخزين سجلات الأحداث لوقت غير محدود وحذفها فقط عندما تكون هذه البيانات قديمة بشكل يائس.

العلاقات بين البيانات


تم إدخال معامل الارتباط لتحديد العلاقة الإحصائية بين قيمتين متغيرين. عند تحليل كميات كبيرة من البيانات ، يمكنك تحديد العلاقة بين نوعين من سلوك المستخدم:

  • كيف تؤثر مشاهدات الصفحة على أداء الإجراء المستهدف؟
  • هل هناك اتصال بين نوع المحتوى المستهلك والمنتج الذي يكتسبه المستخدم في النهاية؟
  • هل هناك منتجات ذات صلة؟ على سبيل المثال ، إذا اشترى شخص ما المنتج "أ" ، ما فئة المنتج المرتبطة به؟

بيانات الطرف الثالث


أخيرًا وليس آخرًا ، تتيح لك البيانات الأولية الحصول على مزيد من المعلومات إذا قمت بتوصيل مصادر بيانات أخرى. فيما يلي بعض الأمثلة التوضيحية:

بيانات التجارة الإلكترونية. تكون الأداة مفيدة للغاية إذا قمت بحفظ الرقم التعريفي للعميل في Google Analytics ، الذي نفذ أي إجراءات لإضافتها إلى سلة التسوق أو تقديم طلب. سيسمح لك ذلك بحساب القيمة الدقيقة لمعدل التحويل ، حتى إذا لم تعمل أدوات Google Analytics (بسبب أدوات حظر الإعلانات التي يستخدمها العملاء ، وعدم وجود إعادة توجيه من صفحة الدفع ، ووقت الانتظار الطويل لتحميل الصفحة ، وأسباب أخرى). بالإضافة إلى ذلك ، استنادًا إلى بياناتك الخاصة ، يمكنك استبعاد الإجراءات المستهدفة الملغاة والعوائد لإعادة حساب الربح الحقيقي. كما يسمح لك بحساب مؤشرات أكثر تعقيدًا وإغلاقًا ، على سبيل المثال ، الهامش بدلاً من الدخل.

بيانات CRM. ما الذي يمكن أن يكون أسوأ من حقيقة أن عددًا كبيرًا من العملاء المحتملين يحتوي على عدد كبير من العملاء المحتملين غير ذي صلة؟ هذه مشكلة شائعة لخدمات B2B عبر الإنترنت. من خلال تصدير بيانات CRM بمعرفات العملاء المتوقعين الفريدة (معرف العميل المشفر باستخدام البريد الإلكتروني SHA-256 ، المعرف الذي تم إنشاؤه ، وما إلى ذلك) ، يمكنك ربطها بسهولة بمعرفات العميل في Google Analytics. سيسمح لك هذا بحساب ليس فقط النسبة المئوية للعملاء المحتملين المولدين ، ولكن أيضًا معدل التحويل. سيتطلب التحليل متعدد القنوات استعلامات أكثر تعقيدًا ، ولكن يمكنك التحكم بشكل كامل في عملية الحساب.

الأحداث دون اتصال. تتأثر الأعمال التجارية عبر الإنترنت بالعديد من العوامل الخارجية: العطلات ، والظروف الجوية ، والإضرابات ، وفيروس مميت أدى إلى عزل نصف سكان العالم. لا يوفر Google Analytics القدرة على تقديم معلمات جديدة للدراسة لفترة معينة من الزمن. أما بالنسبة للتعليقات التوضيحية ، فهي لا تشارك في العمليات الحسابية وتستخدم فقط كعنصر واجهة مستخدم. ومع ذلك ، قد يكون من المفيد معرفة كيف تؤثر العطلات على عدد المبيعات.



لإجراء مثل هذا التحليل ، من الضروري جمع المعلومات وتقديمها بتنسيق قابل للقراءة. من خلال القيام بذلك ، سيكون لديك بيانات ذات صلة وذات صلة.

الإعلانات ، روبوتات البحث ، السجلات - يجب تخزين كل هذه البيانات في مستودع واحد.
من خلال تعلم مقارنتها بالبيانات التحليلية ، يمكنك تحقيق أحلامك الجامحة:

  • هل يجذب المحتوى الأطول المستخدمين؟ باختيار روبوت البحث الصحيح (على سبيل المثال ، Screaming Frog) ، يمكنك تحديد العلاقة بين طول محتوى النص وعدد مشاهدات الصفحة.
  • هل يؤثر سلوك محركات البحث على تحسين SEO؟ باستخدام بيانات سجل BigQuery ، يمكنك تحديد كيفية تأثير تكرار الزيارات إلى روبوت البحث على نتائج البحث.

ما هي الربحية الحقيقية لعملك؟ بعد إجراء الإعدادات في خوارزمية حساب الإحالة ، يمكنك قياس عائد الاستثمار في الحملات الإعلانية لجميع الأنظمة الأساسية المستخدمة.

أدوات استخراج البيانات الأولية


المعلومات المقدمة أعلاه تفضل البيانات الخام. ولكن كيف تحصل عليها؟ فكر في بعض الطرق الأكثر شيوعًا.

جوجل تحليلات 360


إذا كنت محظوظًا بما يكفي للوصول إلى هذه الخدمة أو إذا كانت لديك ميزانية كافية لدفع تكاليف استخدامها ، فلديك أفضل أداة لاستخراج البيانات الأولية من Google BigQuery. يسمح لك بتصدير أي معلومات ، بما في ذلك بيانات التجارة الإلكترونية المتقدمة. يقابل كل سطر جلسة محددة ، ويمكنك استخدام عدد كبير من المعلمات والمقاييس.

تطبيق Google Analytics + الويب و Firebase


في الآونة الأخيرة ، تمكنت تحليلات الويب من تصدير البيانات إلى Google BigQuery دون الحاجة إلى شراء Google Analytics 360. يدعم Firebase ، وهو جوهر تطبيق Google Analytics + ويب ، وظائف التصدير إلى Google BigQuery. سيتم إصدار فاتورة لك باستخدام Blaze ، الذي يستخدم نهج الدفع عند الاستخدام. إذا كان لديك بوابة إنترنت كبيرة ، فسيتعين عليك تتبع ميزانيتك. بالنسبة للمواقع الصغيرة ، تتراوح التكاليف من مجرد لا شيء إلى بضعة دولارات فقط في الشهر.

يتوافق كل سطر مع حدث يحتوي على شاشة أو مشاهدة صفحة. سيكون عليك التعود على هذه الطريقة المحددة للغاية لتقديم البيانات ، والتي تختلف عن تلك المستخدمة في Google Analytics. ومع ذلك ، قد تكون هذه الخدمة هي الحل الأفضل لأولئك الذين يرغبون في استخدام البيانات الأولية.

أدوات مجانية أخرى: Yandex.Metrica و Matomo


لم أستطع تجربة كل أداة ، لأن الكثير منها مدفوع الأجر. يحتوي كل منها على وظيفة لتصدير البيانات الأولية. ومع ذلك ، هناك خدمتان مجانيتان تمامًا عبر الإنترنت تقدمان نفس الوظيفة ولا تفرض أي رسوم مقابل استخدامها.

Yandex.Metrica هي أداة مجانية تمامًا توفر الوصول إلى البيانات الأولية من خلال واجهة برمجة التطبيقات لسجلاتها. Matomo هي أداة تحليلات مفتوحة المصدر تحتاج إلى تثبيتها مباشرة على الخادم الخاص بك حيث توجد ملفات الموقع. يقوم بتصدير البيانات الخام مباشرة إلى قاعدة البيانات الخاصة بك.

خط البيانات


هناك طريقة أخرى لتحميل بيانات Google Analytics مباشرة إلى مستودع البيانات الخاص بك وهي من خلال مسار البيانات. ينظم OWOX BI تدفقًا قويًا للبيانات بين Google Analytics و BigQuery. لتنفيذ الوظيفة ، تحتاج إلى إنشاء مهمة مخصصة في Google Analytics. ينشئ نسخًا من حمولة Google Analytics وينقلها إلى مستودع البيانات النهائي.

بعد الحصول على خبرة كافية ، ستتمكن من إنشاء نقطة النهاية الخاصة بك بشكل مستقل لتحميل البيانات باستخدام وظيفة الخدمة السحابية وبناءً على تحليل السجل. فيما يلي مصدران مفيدان لمساعدتك على معرفة ذلك:
Simo Ahab - "كيفية بناء شاشة GTM". بعد قراءة هذه المقالة ، ستتعلم كيفية إرسال البيانات إلى BigQuery باستخدام وظائف السحابة. يقتصر حجم البيانات المرسلة على 100000 صف في الثانية ، والتي يمكن دمجها في خدمة BigQuery. إذا تجاوز عدد الأسطر القيمة القصوى المشار إليها أعلاه ، فسيتعين عليك تجميع البيانات من عدة سجلات.

مركز مساعدة Google Cloud - هندسة تتبع البكسل بدون خادم يناقش هذا المصدر آلية إنشاء بكسل التتبع الخاص بك ، يليه الاندماج في BigQuery.

أمثلة وحالات خاصة لاستخدام BigQuery


الآن أنت تعرف فوائد استخدام البيانات الأولية وكيفية الوصول إليها. الآن دعونا نلقي نظرة على بعض الأمثلة التي توضح بوضوح مبادئ العمل مع هذه البيانات.

إنشاء علاقة بين المواضيع والإجراءات المستهدفة في Google Analytics 360
تم إجراء التحليل لموقع إخباري يضم مشتركين عبر الإنترنت. كان الهدف الرئيسي من التحليل هو إقامة علاقة (ارتباط) بين مواضيع الأخبار التي يقرأها المستخدمون والإجراءات المستهدفة التي يتم تنفيذها.

النتيجة والاستنتاجات:

corr_culture 0.397
corr_opinion 0.305
corr_lifestyle 0.0468
corr_sport 0.009

الفئة الأكثر احتمالا لمن يشتركون في الموقع هم المستخدمون المهتمون بقسم "الثقافة" و "الآراء". من ناحية أخرى ، إذا كان المستخدم مهتمًا بالعناوين "نمط الحياة" أو "الرياضة" ، فإن احتمال الاشتراك فيها ضئيل.

استعلام عن BigQuery
SELECT
CORR(culture,transac) AS corr_culture,
CORR(opinion,transac) AS corr_opinion,
CORR(lifestyle,transac) AS corr_lifestyle,
CORR(sport,transac) AS corr_sport
FROM(
SELECT
  SUM(IF(hit.page.pagePath LIKE'/culture%',
      1,
      0)) AS culture,
  SUM(IF(hit.page.pagePath LIKE'/opinion%',
      1,
      0)) AS opinion,
  SUM(IF(hit.page.pagePath LIKE'/lifestyle%',
      1,
      0)) AS lifestyle,-
  SUM(IF(hit.page.pagePath LIKE'/sport%',
      1,
      0)) AS sport,      
  COUNT(hit.transaction.transactionId) AS transac
FROM
  `mydatabase.view_id.ga_sessions_*`,
  UNNEST(hits) AS hit
WHERE
  _TABLE_SUFFIX BETWEEN '20191201' AND '20200301'
GROUP BY
  fullVisitorId
ORDER BY
  transac DESC
)


التحليل الجماعي باستخدام Firebase


تم تطبيق تطبيق مع محتوى يتم تحديثه بانتظام ومعدل موسمي مرتفع للتحليل. يتم إجراء التحليل للعثور على إجابات للأسئلة التالية:
كيف يتصرف المستخدمون الذين قاموا بتثبيت هذا التطبيق لأول مرة؟

ما هو أفضل وقت لجذب العملاء الذين سيستخدمون التطبيق بشكل منتظم؟

النتيجة والاستنتاجات:



بالحكم على البيانات الواردة ، غالبًا ما يتم استخدام التطبيق من قبل العملاء الذين قاموا بتنزيله لأول مرة في سبتمبر وديسمبر.

استعلام عن BigQuery
# change my-app.analytics_123456789 to your ID
WITH cohorte_september
AS
(
WITH
user_september AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
)
ORDER BY month ASC
),

#october

cohorte_october AS
(
WITH
user_october AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october)
)
)
ORDER BY month ASC
),

#november

cohorte_november AS
(
WITH
user_november AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
)
ORDER BY month ASC
),

#decembre


cohorte_decembre AS
(
WITH
user_decembre AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre )
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
)
ORDER BY month ASC
)

SELECT cohorte_september.sessions AS september_cohort,  
 cohorte_october.sessions AS october_cohort,  
 cohorte_november.sessions AS november_cohort,  
 cohorte_decembre.sessions AS december_cohort,  
 month

FROM cohorte_september
JOIN  cohorte_october USING (month)
JOIN  cohorte_november USING (month)
JOIN  cohorte_decembre USING (month)
ORDER BY month ASC


الموجودات


على الأرجح ، ستحدث تغييرات خطيرة في المستقبل القريب ، وسيصبح Google App + Web شيئًا مثل معيار الصناعة. يوفر هذا النهج تكاملاً أكثر إحكامًا بين خدمات Google مثل منصة التسويق و Google Cloud Platform ، وخاصة BigQuery. إذا فقدت القدرة على إنشاء استعلامات SQL (لغة للعمل مع DBMS) ، فإنني أوصي بشدة بتحديث معلوماتك في ذاكرتك وممارستها.

أصبحت تحليلات البيانات الرقمية المتقدمة أداة قوية بشكل متزايد بسبب سهولة الوصول إلى البيانات الأولية وعمليات الحوسبة السريعة والفعالة والتصور الجيد للمعلومات. في المستقبل القريب ، سيتم تنفيذ تكامل أوثق مع أنواع أخرى من بيانات الأعمال.

ظل الخبراء لسنوات عديدة يجادلون في أن التحليلات الرقمية والتجارية يجب أن تعمل معًا. ببطء ، ولكن بثقة ، نحن نتحرك نحو ترجمة هذه الفكرة إلى حقيقة.

All Articles