Menggunakan Data Mentah dalam Google Analytics dalam praktik

Kami telah lama percaya bahwa alat Google Analytics standar adalah cara terbaik untuk mendapatkan informasi yang bermanfaat. Kadang-kadang, saya harus berurusan dengan beberapa batasan dan hasil yang agak aneh, dan sepertinya tidak ada akhirnya, sampai beberapa analis menemukan Google Analytics 360 dan mekanisme untuk mengekspor data mentah ke Google BigQuery.

Setelah hanya beberapa jam bekerja dengan alat yang lebih canggih dan kueri SQL, kami dapat mengekstraksi informasi yang tidak akan pernah kami terima hanya dengan menggunakan laporan agregat dari Google Analytics. Sejak saat itu, kami fokus mempelajari fitur data mentah (“mentah”) dan pada manfaat praktis apa yang dapat diperoleh pakar web dari data tersebut.

Artikel ini menjawab pertanyaan-pertanyaan berikut:

  • Apa perbedaan antara data mentah dan ringkasan?
  • Apa manfaat menggunakan data mentah?
  • Bagaimana cara mengakses data mentah?
  • Bagaimana cara menggunakan data baru ini (contoh praktis)?

Apa perbedaan antara data mentah dan ringkasan di Google Analytics


Menggunakan versi gratis Google Analytics, Anda hanya bisa mendapatkan data ringkasan. Artinya, informasi penayangan lengkap untuk kunjungan dan acara tertentu tidak akan tersedia. Tentu saja, laporan Explorer Pengguna berisi banyak informasi berguna yang dapat digunakan analisis web. Namun, pembatasan tertentu diberlakukan pada file ini: itu tidak skala dan tidak tersedia untuk diunduh.

Dalam kebanyakan kasus, hanya memiliki data ringkasan sudah cukup untuk mendapatkan jawaban atas pertanyaan umum:

  • Kampanye mana yang menghasilkan konversi terbanyak?
  • Seberapa umumkah teknologi pembelajaran mesin Fitur X (apakah basis pengguna semakin berkembang)?
  • Dari mana asal pengunjung (sumber lalu lintas utama)?
  • Perangkat apa yang pengguna gunakan?



Anda tidak perlu menganalisis data mentah untuk mendapatkan jawaban atas pertanyaan di atas. Alat pelaporan yang disesuaikan atau default di Google Analytics dapat dengan mudah melakukan ini. Masalah utama dengan data ringkasan adalah agregat. Anda memetakan banyak jenis tindakan pengguna yang dapat digunakan untuk menyembunyikan informasi yang sangat berguna. Kami memberikan contoh dengan tampilan beberapa halaman dalam satu sesi. Kami memiliki dua sumber dengan enam sesi dengan jumlah halaman berikut dilihat dalam satu sesi:

  • Sumber A: 1, 1, 2, 2, 2, 10;
  • Sumber B: 2, 2, 3, 3, 4, 4.

Dengan menggunakan metode pencilan statistik, dapat ditentukan bahwa sumber A mencirikan pengguna dengan tingkat keterlibatan yang lebih rendah. Tetapi jika kita hanya memperhitungkan data rata-rata, kita dapat menyimpulkan tentang keterlibatan yang sama untuk kedua sumber, karena jumlah halamannya sama (median bisa berupa apa saja).

Mengapa laporan analytics standar tidak mengandung data ini? Alasan utama adalah biaya komputasi. Hanya memberikan data ringkasan selektif, tidak perlu memproses jutaan baris yang terkandung dalam laporan. Karenanya, versi gratis Google Analytics tidak mengandung alat untuk melakukan perhitungan lanjutan secara gratis.

Informasi apa yang dapat diekstraksi dari data mentah


Memahami keterbatasan data ringkasan, saatnya mencari tahu bagaimana data mentah dapat digunakan. Pertimbangkan beberapa opsi untuk aplikasi mereka.

Durasi Acara


Salah satu batasan yang dihadapi oleh analis web mana pun yang menggunakan alat Google Analytics standar adalah Anda tidak dapat menentukan interval waktu antara menempatkan item dalam keranjang dan melakukan pembelian, terlepas dari apakah tindakan ini terjadi dalam satu sesi atau tidak. Tentu saja, untuk ini Anda dapat menggunakan cookie dan membuat perhitungan sendiri. Tetapi ini tidak ada gunanya, terutama karena Google Analytics telah melakukan pekerjaan ini untuk kami.

Setelah menganalisis data mentah, Anda dapat dengan mudah menentukan waktu yang tepat peristiwa itu terjadi untuk pengguna tertentu, melakukan analisis komparatif dengan peristiwa lain untuk pengguna yang sama. Anda juga dapat mengumpulkan data sesuai kebijaksanaan Anda, setelah mendapatkan distribusi rata-rata, median atau persentil, atau menggunakan model statistik lanjutan lainnya. Apakah fakta bahwa 20% pengguna melakukan tindakan target dalam 2 menit, dan 10% - selama seminggu penuh, tidak masalah? Dengan pengetahuan ini, Anda akan menggunakan berbagai pendekatan untuk berinteraksi dengan dua kategori pengguna ini.

Analisis ukuran pemirsa


Laporan Google Analytics dan Google Analytics 360 berisi data segmentasi pengunjung selama 90 hari terakhir. Seringkali, untuk mendapatkan data yang andal, analisis diperlukan pada jarak yang lebih jauh (terutama untuk perusahaan besar). Berdasarkan analisis data mentah, Anda bisa mendapatkan jawaban atas pertanyaan-pertanyaan berikut:

  1. Apakah lebih mungkin bahwa pengguna yang terlibat dalam musim liburan akan membeli produk pada bulan September daripada kemungkinan melakukan pembelian oleh kategori pengguna lain pada bulan yang sama?
  2. Apa efek menonton video sepanjang tahun dan bagaimana hal ini memengaruhi jumlah konversi?

Menggunakan data mentah, Anda dapat menyimpan log peristiwa untuk waktu yang tidak terbatas dan menghapusnya hanya ketika data ini sudah usang.

Hubungan Antara Data


Koefisien korelasi diperkenalkan untuk menentukan hubungan statistik antara dua nilai variabel. Saat menganalisis sejumlah besar data, Anda dapat menentukan hubungan antara dua jenis perilaku pengguna:

  • Bagaimana tampilan halaman mempengaruhi kinerja tindakan yang ditargetkan?
  • Apakah ada hubungan antara jenis konten yang dikonsumsi dan produk yang akhirnya diperoleh pengguna?
  • Apakah ada produk terkait? Misalnya, jika seseorang membeli produk A, kategori produk apa yang dikaitkan dengannya?

Data Pihak Ketiga


Last but not least, data mentah memungkinkan Anda untuk mendapatkan lebih banyak informasi jika Anda menghubungkan sumber data lainnya. Berikut ini adalah beberapa contoh ilustrasi:

Data E-Commerce. Alat ini paling berguna jika Anda menyimpan ID pelanggan di Google Analytics, yang melakukan tindakan apa pun untuk ditambahkan ke troli atau melakukan pemesanan. Ini akan memungkinkan Anda untuk menghitung nilai pasti dari tingkat konversi, bahkan jika alat Google Analytics tidak berfungsi (karena pemblokir iklan yang digunakan oleh klien, kurangnya pengalihan dari halaman pembayaran, waktu tunggu yang lama untuk memuat halaman, dan alasan lainnya). Selain itu, berdasarkan data Anda sendiri, Anda dapat mengecualikan tindakan target yang dibatalkan dan kembali untuk menghitung ulang laba riil. Ini juga memungkinkan Anda untuk menghitung indikator yang lebih kompleks dan tertutup, misalnya margin daripada pendapatan.

Data CRM. Apa yang bisa lebih buruk daripada fakta bahwa sejumlah besar timah hitam mengandung banyak timah hitam yang tidak relevan? Ini adalah masalah umum untuk layanan online B2B. Dengan mengekspor data CRM dengan pengidentifikasi utama yang unik (pengidentifikasi klien dienkripsi menggunakan email SHA-256, pengidentifikasi yang dihasilkan, dll.), Anda dapat dengan mudah mengaitkannya dengan pengidentifikasi klien di Google Analytics. Ini akan memungkinkan Anda menghitung tidak hanya persentase lead yang dihasilkan, tetapi juga tingkat konversi. Analisis multichannel akan membutuhkan kueri yang lebih kompleks, tetapi Anda dapat sepenuhnya mengontrol proses perhitungan.

Acara Offline. Bisnis online dipengaruhi oleh banyak faktor eksternal: liburan, kondisi cuaca, serangan, virus mematikan yang mengirim setengah populasi dunia ke isolasi diri. Google Analytics tidak menyediakan kemampuan untuk memperkenalkan parameter baru untuk dipelajari selama jangka waktu tertentu. Adapun anotasi, mereka tidak terlibat dalam perhitungan dan digunakan hanya sebagai elemen antarmuka pengguna. Namun, akan bermanfaat untuk mengetahui bagaimana liburan mempengaruhi jumlah penjualan.



Untuk melakukan analisis seperti itu, perlu untuk mengumpulkan informasi dan menyediakannya dalam format yang dapat dibaca. Dengan melakukan ini, Anda akan memiliki data yang relevan dan relevan.

Iklan, robot pencarian, log - semua data ini harus disimpan dalam satu repositori.
Dengan belajar membandingkannya dengan data analitis, Anda dapat mewujudkan impian terliar Anda:

  • Apakah konten yang lebih lama menarik pengguna? Dengan memilih robot pencarian yang tepat (misalnya, Screaming Frog), Anda dapat membangun hubungan antara panjang konten teks dan jumlah tampilan halaman.
  • Apakah perilaku mesin pencari mempengaruhi pengoptimalan SEO? Menggunakan data log BigQuery, Anda dapat menentukan bagaimana frekuensi kunjungan ke robot pencarian mempengaruhi hasil pencarian.

Apa keuntungan nyata bisnis Anda? Setelah membuat pengaturan dalam algoritme perhitungan atribusi, Anda dapat mengukur laba atas investasi dalam kampanye iklan untuk semua platform yang digunakan.

Alat Ekstraksi Data Mentah


Informasi yang disajikan di atas mendukung data mentah. Tapi bagaimana cara mendapatkannya? Pertimbangkan beberapa metode yang paling umum.

Google Analytics 360


Jika Anda cukup beruntung untuk mendapatkan akses ke layanan ini atau jika Anda memiliki anggaran yang cukup untuk membayar biaya penggunaannya, Anda memiliki alat terbaik untuk mengekstraksi data mentah dari Google BigQuery. Ini memungkinkan Anda untuk mengekspor informasi apa pun, termasuk data e-commerce tingkat lanjut. Setiap baris berhubungan dengan sesi tertentu, dan Anda dapat menggunakan sejumlah besar parameter dan metrik.

Aplikasi Google Analytics + Web dan Firebase


Baru-baru ini, analisis web telah dapat mengekspor data ke Google BigQuery tanpa harus membeli Google Analytics 360. Firebase, yang merupakan inti dari Aplikasi Google Analytics + Web, mendukung fungsionalitas ekspor ke Google BigQuery. Anda akan ditagih dengan Blaze, yang menggunakan pendekatan pay-as-you-go. Jika Anda memiliki portal Internet besar, Anda harus melacak anggaran Anda. Untuk situs-situs kecil, biaya berkisar dari tidak ada yang hanya sampai beberapa dolar sebulan.

Setiap baris terkait dengan acara yang berisi layar atau tampilan halaman. Anda harus terbiasa dengan cara penyajian data yang sangat spesifik ini, yang berbeda dari yang digunakan di Google Analytics. Namun, layanan ini mungkin menjadi solusi terbaik bagi mereka yang ingin menggunakan data mentah.

Alat gratis lainnya: Yandex.Metrica dan Matomo


Saya tidak dapat mencoba setiap alat, karena banyak dari mereka dibayar. Masing-masing berisi fungsionalitas untuk mengekspor data mentah. Namun, ada dua layanan online gratis yang menawarkan fungsi yang sama dan tidak mengenakan biaya untuk penggunaannya.

Yandex.Metrica adalah alat yang benar-benar gratis yang menyediakan akses ke data mentah melalui API log-nya. Matomo adalah alat analisis sumber terbuka yang perlu diinstal langsung di server Anda di mana file situs berada. Ini mengekspor data mentah langsung ke database Anda.

Pipa data


Cara lain untuk mengunggah data Google Analytics secara langsung ke gudang data Anda adalah melalui jalur pipa data. OWOX BI mengatur aliran data yang kuat antara Google Analytics dan BigQuery. Untuk menerapkan fungsionalitas, Anda perlu membuat tugas khusus di Google Analytics. Ini membuat salinan muatan Google Analytics dan mentransfernya ke gudang data akhir.

Memiliki pengalaman yang memadai, Anda akan dapat secara mandiri membuat titik akhir Anda sendiri untuk mengunggah data menggunakan fungsionalitas layanan cloud dan berdasarkan analisis log. Berikut ini adalah dua sumber yang berguna untuk membantu Anda mengetahui hal ini:
Simo Ahab - "Cara Membangun Monitor GTM." Setelah membaca artikel ini, Anda akan belajar cara mengirim data ke BigQuery menggunakan fungsi cloud. Jumlah data yang dikirimkan dibatasi hingga 100.000 baris per detik, yang dapat diintegrasikan ke dalam layanan BigQuery. Jika jumlah baris melebihi nilai maksimum yang ditunjukkan di atas, Anda harus mengelompokkan data dari beberapa log.

Google Cloud Help Center - Arsitektur Pelacakan Piksel Serverless Sumber ini membahas mekanisme untuk membuat piksel pelacakan Anda sendiri, diikuti dengan integrasi ke dalam BigQuery.

Contoh dan kasus khusus menggunakan BigQuery


Sekarang Anda tahu manfaat menggunakan data mentah dan cara mengaksesnya. Sekarang mari kita lihat beberapa contoh yang dengan jelas menunjukkan prinsip-prinsip bekerja dengan data ini.

Membangun Hubungan Antara Topik dan Tindakan Target di Google Analytics 360
Analisis dilakukan untuk situs berita dengan pelanggan online. Tujuan utama dari analisis ini adalah untuk membangun hubungan (korelasi) antara topik berita yang dibaca pengguna dan tindakan yang ditargetkan dilakukan.

Hasil dan kesimpulan:

corr_culture 0.397
corr_opinion 0.305
corr_lifestyle 0.0468
corr_sport 0.009

Kategori yang paling mungkin dari mereka yang berlangganan situs adalah pengguna yang tertarik pada bagian “Budaya” dan “Opini”. Di sisi lain, jika pengguna tertarik dengan judul "Gaya Hidup" atau "Olahraga", kemungkinan berlangganannya adalah minimal.

Permintaan untuk BigQuery
SELECT
CORR(culture,transac) AS corr_culture,
CORR(opinion,transac) AS corr_opinion,
CORR(lifestyle,transac) AS corr_lifestyle,
CORR(sport,transac) AS corr_sport
FROM(
SELECT
  SUM(IF(hit.page.pagePath LIKE'/culture%',
      1,
      0)) AS culture,
  SUM(IF(hit.page.pagePath LIKE'/opinion%',
      1,
      0)) AS opinion,
  SUM(IF(hit.page.pagePath LIKE'/lifestyle%',
      1,
      0)) AS lifestyle,-
  SUM(IF(hit.page.pagePath LIKE'/sport%',
      1,
      0)) AS sport,      
  COUNT(hit.transaction.transactionId) AS transac
FROM
  `mydatabase.view_id.ga_sessions_*`,
  UNNEST(hits) AS hit
WHERE
  _TABLE_SUFFIX BETWEEN '20191201' AND '20200301'
GROUP BY
  fullVisitorId
ORDER BY
  transac DESC
)


Analisis Kohort Menggunakan Firebase


Aplikasi dengan konten yang diperbarui secara berkala dan laju musiman tinggi diambil untuk dianalisis. Analisis dilakukan untuk menemukan jawaban atas pertanyaan-pertanyaan berikut:
Bagaimana perilaku pengguna yang pertama kali menginstal aplikasi ini?

Apa waktu terbaik untuk menarik pelanggan yang akan menggunakan aplikasi secara teratur?

Hasil dan kesimpulan:



Dilihat dari data yang diterima, aplikasi ini paling sering digunakan oleh pelanggan yang mengunduhnya untuk pertama kali pada bulan September dan Desember.

Permintaan untuk BigQuery
# change my-app.analytics_123456789 to your ID
WITH cohorte_september
AS
(
WITH
user_september AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_september)
)
)
ORDER BY month ASC
),

#october

cohorte_october AS
(
WITH
user_october AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_october)
)
)
ORDER BY month ASC
),

#november

cohorte_november AS
(
WITH
user_november AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_november )
)
)
ORDER BY month ASC
),

#decembre


cohorte_decembre AS
(
WITH
user_decembre AS
(
SELECT DISTINCT user_pseudo_id AS user
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND
event_name="first_open"
)
SELECT sessions, month
FROM
(
(SELECT COUNT(DISTINCT user_pseudo_id) AS sessions,"201909" AS month
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20190901' AND '20190930'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre )
)
UNION ALL
(SELECT COUNT(DISTINCT user_pseudo_id),"201910"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191001' AND '20191031'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201911"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191101' AND '20191130'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"201912"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20191201' AND '20191231'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202001"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200101' AND '20200131'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202002"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200201' AND '20200229'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
UNION ALL
(
SELECT COUNT(DISTINCT user_pseudo_id),"202003"
FROM `my-app.analytics_123456789.events_*`
WHERE
_table_suffix between '20200301' AND '20200331'
AND event_name="session_start"
AND user_pseudo_id IN (SELECT user FROM user_decembre  )
)
)
ORDER BY month ASC
)

SELECT cohorte_september.sessions AS september_cohort,  
 cohorte_october.sessions AS october_cohort,  
 cohorte_november.sessions AS november_cohort,  
 cohorte_decembre.sessions AS december_cohort,  
 month

FROM cohorte_september
JOIN  cohorte_october USING (month)
JOIN  cohorte_november USING (month)
JOIN  cohorte_decembre USING (month)
ORDER BY month ASC


temuan


Kemungkinan besar, perubahan serius akan datang dalam waktu dekat, dan Google App + Web akan menjadi sesuatu seperti standar industri. Pendekatan ini memberikan integrasi yang lebih erat antara layanan Google seperti Platform Pemasaran dan Google Cloud Platform, dan terutama BigQuery. Jika Anda kehilangan kemampuan untuk membuat kueri SQL (bahasa untuk bekerja dengan DBMS), saya sangat menyarankan Anda menyegarkan kembali informasi Anda di memori dan mempraktikkannya.

Analisis data digital canggih menjadi alat yang semakin kuat karena akses yang mudah ke data mentah, proses komputasi yang cepat dan efisien, dan visualisasi informasi yang baik. Dalam waktu dekat, integrasi yang lebih dekat dengan tipe data bisnis lainnya akan diterapkan.

Selama bertahun-tahun sekarang, para ahli berpendapat bahwa analitik digital dan bisnis harus bekerja bersama. Perlahan, tetapi dengan penuh percaya diri, kami bergerak ke arah menerjemahkan ide ini menjadi kenyataan.

All Articles