ウェブアナリストのedagawaです。
Spotlightをメインで担当しています。組織横断でGoogle Analytics(以下GA)のサポートもしています。
今回はSpotlightでGAを使ってどのようなレポート・データ抽出をしているか一部紹介します。
データ活用観点でSpotlightに足りなかったこと
2016年8月からSpotlightにジョインしましたが、「データを活用してサービスを成長させたい」という強い思いを持ったメンバーが多く、すでにエンジニアが進んでログ実装をしてくれていたため、ログ設計はほとんど必要ありませんでした。
しかし、当時Spotlightはデータドリブンでの施策実装とその検証が十分ではありませんでした。
毎日のデータ入力作業に時間を割かなければいけなかったり、有益なデータを簡単に確認・取得できていなかったことなどが原因として考えられました。
そこで、レポート業務の自動化と、知りたいデータを誰でも簡単に出せる資料の作成から着手しました。
Spreadsheetの活用
GAデータは、Spreadsheetから取得することができます。
SpreadsheetからGAデータを取得する場合、「Spreadsheetのアドオン」と「Google Apps Script」のどちらかでデータを取得していますが、Spotlightでは「Google Apps Script」からデータを取得しています。
なぜ、GA管理画面をメインで使うのではなく、Google Apps Scriptを使ってSpreadsheetにデータを収集しているのかを以下にまとめました。
GA管理画面を使うことのデメリット
- データ量が多くなるとページの表示に時間がかかる
- すぐに相関関係が分かるデータを出せない
- ディメンションを同時に2つまでしか出せない(カスタムレポートを除く)
- データを自由に扱うことが難しい
Spreadsheetにデータを出力することのメリット
- CORREL関数を使えば、相関係数をすぐに確認できる
- 散布図やヒストグラムなどのグラフが作りやすい
- GAのAPIであれば、指標は最大10、ディメンションは最大7まで掛け合わせてデータを出せる
- Google Analytics 360(以下GA360)を契約していればGAだけでなくBigQueryのAPIも使えるので、GA APIでも出せないデータが出せる
- GAのUIや専門的な言葉に慣れていない人もSpreadsheetだとデータを確認してくれる
- 過去のGAデータをSpreadsheetに残しておける
特にGA管理画面では出せないデータをSpreadsheet(API)だと出せるようになる点に大きなメリットを感じています。
有償版のGA360を契約すると、BigQueryが使えるようになる点も魅力の一つです。扱えるデータの幅が広がり、GAデータだけでは得られない気づきが得られました。統計分析ツールのRなどで分析をする際にもBigQueryは役立ちます。
Spotlightでは主に「ユーザー単位でのデイリーレポート」と「記事単位のデータ抽出ファイル」を使ってデータの出力・確認をしています。
ユーザー単位のデイリーレポート作成
このデイリーレポートで、iOS/Androidアプリとウェブブラウザの各指標を確認しています。
毎朝10時過ぎにデータを自動で取得するように設定しています。
「ユーザー(新規/リピート)」「セッション」「全体PV」「記事PV」「記事の読了イベント」「翌日継続」などのデータと、ユーザー数を母数にした「記事PPU」や「読了率」などのデータも出しています。
2016年1月1日から遡ってデータを出したので、どんなタイミングで数字の増減があったかすぐに確認することができるようになりました。
※下図の数字はランダムにしています。正しい数字ではありません。
日単位だけでなく週単位と月単位のレポートも日単位と同様の形式で作っています。
記事単位のデータ抽出ファイルの作成
記事単位のレポートは、PVがどれくらいあるか、どこからの流入が多いか、などのデータを出しています。
「期間を変えて柔軟にデータを出したい」という要望もあったことから、自動でデータを出すのではなく手入力で「記事ID」と「計測開始日/計測終了日」をSpreadsheetに入力してもらってデータを出すようにしています。
※下図の数字はランダムにしています。正しい数字ではありません。
レポート作りの課題・大切なこと
レポートを作ってからは、手動でやっていたデータ入力作業も軽減され、データを簡単に出せるようになったことで、データ活用がより広まったかなと感じています。
レポートを作ることはデータの整理ができるので重要な業務ですが、レポートの使用目的が定まっていなかったり、セグメントやフィルタの認識が合っていないと修正やデータ出力を繰り返し、分析など次のタスクになかなか着手できなくなってしまいます。
レポート作成者自身の作業時間を確保するためにも、事前にデータ抽出作業を分担してもらうための交渉をしたり、コミュニケーションを取って認識を合わせながらレポートを作り上げていくことが大切だと思います。