こんにちは。技術本部:秋葉原ラボの数見です.Advent Calendar 2016 4日目では,Twitterデータを利用したAbemaTVの分析について紹介したいと思います。

所属は異なりますが,弊社アドテクスタジオ(アドテクブログはこちら)で開催されている自然言語処理ゼミに参加していました. ゼミ活動の一環で,Twitterのデータを利用することができたので,同じく秋葉原ラボの角田と一緒に, AbemaTVの立ち上げから3ヶ月間、Twitter上のユーザのAbemaTVに対する反響を調査した分析事例を紹介したいと思います.具体的には,以下の3点について分析を行いました.

  1. どういったツイートがリツイートされているか
  2. ユーザから,サービスに対してどのような要望があるのか
  3. どのようなことに興味のあるユーザがAbemaTVを利用しているのか

1. リツイート分析

ある期間における, AbemaTVの公式Twitterアカウントのリツイートランキングを作成して, どういったツイートが拡散しているかを確認してみましょう.

# URL トピック リツイート数
1 http://twitter.com/AbemaTV/statuses/720631591416934400 熊本地震 15621
2 http://twitter.com/AbemaTV/statuses/726061067227435008 ラブライブ一挙放送 11152
3 http://twitter.com/AbemaTV/statuses/727510588427902976 化物語一挙放送 9340
4 http://twitter.com/AbemaTV/statuses/732044898568785921 SHINeeと女芸人が対決 8741
5 http://twitter.com/AbemaTV/statuses/731133322227634176 渡辺直美さんが北海道から3時間生放送 7302
6 http://twitter.com/AbemaTV/statuses/731128246088011776 SHIROBAKO一挙放送 6452
7 http://twitter.com/AbemaTV/statuses/722403797922742273 でんぱ組.inc 6411
8 http://twitter.com/AbemaTV/statuses/726423400881606656 ソードアートオンライン一挙放送 5042
9 http://twitter.com/AbemaTV/statuses/701454682674171904 乃木坂46時間TV 4563
10 http://twitter.com/AbemaTV/statuses/732955211036168192 少女革命ウテナ 4192

最もリツイートされたツイートは,AbemaTVが「熊本地震の情報を配信している」という内容のツイートでした.立ち上げから間もない期間にも関わらず,ユーザがAbemaTVを災害時の貴重な情報源として期待していたことが伺えます.

また,このツイートには,多くのユーザからの反応がありました.ユーザからは「有益な情報」というポジティブな意見がある一方で,「(また,地震が起こったと勘違いしてしまうため,震度7の地震が起こったことを伝える)ツイートのサムネが毎回表示されるのはよくない」や「避難所の人たちを映しすぎ,迷惑している」などネガティブな意見があり,地震速報を中継するネットテレビのあり方に意見が多く寄せられるツイートになっています.

これらの反応は,災害時において,ユーザがAbemaTVへどのようなことを求めているかについて示唆を与えるものだと思います.

他のツイートも見てみましょう.上位10ツイートのうち,5ツイートがアニメの宣伝に関するツイートでした.アニメに関する宣伝ツイートは,多くリツイートされる傾向にあるようです.

2. 感情・要望分析

AbemaTVは,世間にどのように受け入れられてるのでしょうか? あるいは,どのようなことを求められているのでしょうか? これを明確にするために,ツイートの感情分析と要望分析を行いました.

2.1. 感情分析

第一に,感情分析を行います.ポジティブ(肯定的)なツイートと ネガティブ(否定的)なツイートを抽出してみましょう.抽出には,用言編の日本語評価極性辞書(小林, 2005)と名詞編の日本語評価極性辞書(東山, 2008)を利用しました(http://www.cl.ecei.tohoku.ac.jp/index.php?Open%20Resources%2FJapanese%20Sentiment%20Polarity%20Dictionary). ここでは,他の日と比較して,AbemaTVに関するツイート数が多い,2016年5月3日に投稿されたツイートに限定して分析を行います.

まずは,ポジティブなツイートです.下記の表には,拾ってきたポジティブなツイートを掲載しています. 「画質が良い」というツイートと,他サービスと比較をするツイートが多く見られました.画質の良さを売りにしているAbemaTVとしては,非常に良い結果ではないでしょうか.

# ツイート
1 ネット配信にしては画質が良いAbemaTV推せる。
2 abemaTVアニメのラインナップもいいし画質もいいし、ニコニコから絶対人流れてきてるよなー コメントを表示すると画面が埋まるのと付けっ放しだとたまに止まってるのだけ難点だけど、これはいいな
3 AbemaTV初めて見たけど結構画質いいんですね。
4 *より画質いいな @AbemaTV https://t.co/sFjqfZ8E3P
5 AbemaTVめっちゃステマされてるけどすげえ画質良いな

(注)*は他サービス名

次に,下記の表のように,ネガティブなツイートを取り出しました.「画質が悪い」というツイートや,CPU負荷や通信料を心配するツイートがありました.「画質」に関しては,ポジティブなツイートもありましたが,ネガティブなものもあるようです. 仮説ではありますが,画質についてポジティブな意見とネガティブな意見が存在するのは,視聴している環境によって画質が変わるためでしょうか.

他のネガティブな意見として,CPU負荷や通信量を心配するツイートを発見することができました.開発の優先順位を決める際の参考や,ユーザへの周知の方法についての参考になりそうです.

# ツイート
1 AbemaTVを初視聴してるんだけど、Chromecastでキャストするとやっぱ画質悪いな。無料だしこんなもんか https://t.co/vPjUaAE6tg
2 たまに画質がめっちゃよくなるけど、安定しない。惜しい。 #abematv
3 abemaTVって画面いっぱいで見られるけど、画質悪いのが難点よね。
4 画質若干しんどいなハルヒ @AbemaTV https://t.co/OcQKNtheM9
5 AbemaTVアプリ、Youtubeより画質悪いのにCPU負荷はかなり高いな…
6 AbemaTV の画質最低にしといた。2時間でどれくらい通信するか恐る恐るだ。
7 Abema TVでハルヒ見ようかと思ったけど、画質悪い上に重くてカクカクするのでやめた

まとめると,ポジティブなツイートやネガティブなツイートは,主に画質・CPU負荷・通信料・他サービスとの比較でなされていることがわかりました.

また,今回の分析では,競合サービスと比較しているツイートを発見できたので, AbemaTVの立ち位置を明確にする意味でツイート情報を役に立てることができそうです.

2.2. 要望分析

次に,ユーザがどういったことをサービスに求められているかを,ツイートから抽出してみましょう.

栗原 et al. (2015)を参考にして,ルールベースで要望を抽出しました. その結果,サービス全般・ブランド,課金,番組,デバイス対応,機能,画質などで,ユーザからの要望があることがわかりました.要望の一覧とそのボリュームをまとめると下記のようになりました.

twitter_demand

例えば,サービスに関することだと,「AbemaTV名前変えるなら早い方が良いと思う」など,サービス名に関係する意見があることがわかりました.(確かにAmebaとAbemaは間違いやすいですね…)

機能に関して,多くツイートされていたのは,録画とタイムシフトに関する機能でした. タイムシフト機能に関しては,「タイムシフト機能つけて」という要望ツイートが多く見られました. 当時はまだ実装されていなかったようなので,こうしたツイートが多くなっていたのでしょう.

一方,録画機能は,AbemaTVにはない機能です. タイムシフト機能では,一定期間を過ぎると番組を見れなくなってしまうため,保存した動画を永続的に見れる録画機能を多くのユーザが望んでいることがわかりました.録画を求めるユーザは,タイムシフトで,録画が補えることを知らないのかもしれません.もし,そうであるなら,タイムシフト機能が録画の代替になりえることを周知できるようにしなければなりません.

Twitterは自由形式のアンケートのようなものです.Twitter上でのユーザ分析を,うまくサービス活用まで結びつけることができれば,とてもパワフルなツールのように感じます.

3. ユーザの興味

最後に,AbemaTVに関心を寄せているユーザの,興味を探りたいと思います. これは,コンテンツを製作する,あるいはどのような経路で番組を宣伝するのかを考える上で重要です.

ここでは,あるユーザのツイート,あるいはリツイートに含まれるURLに注目します. それぞれのURLには,何かしらの話題が含まれていると仮定します. ある話題を含むURLをツイート,あるいはリツイートする行為を,その話題に興味を持っていると考えます. LDAを利用して,その話題を特定して,ユーザがどのようなことに興味を持っているか抽出します.

とあるトピックに弊社の社長が出てきました. このトピックに含まれる他のユーザに注目し, 他のトピックに含まれるユーザと比較すると,どうやら広告・ビジネスに興味を持っており,年齢層高めの男性ユーザが多いことがわかりました. 他にも男性アイドルに興味を持っているユーザ群や,アニメに興味を持っているユーザ群を抽出することができました.

ユーザごとの興味関心を抽出できれば,そのユーザに即した番組をレコメンドすることができそうです. どのような番組を作成し,誰にその番組を薦めるのかを決める問題で,Twitterのデータも活用できるのではないでしょうか?

4. まとめ

自然言語処理を含めたツイートの分析を通じて,Twitterをうまく調理すれば,サービスにとって有効な情報を取得できることがわかりました.

今回は,TwitterとAbemaTVの分析を行いましたが,今回の分析を応用すれば,ガールフレンド(仮)やアメブロなど,弊社の別のプロダクトのTwitter上での反響を調査することも可能だと思います.

5. 参考文献

  1. 小林のぞみ,乾健太郎,松本裕治,立石健二,福島俊一. 意見抽出のための評価表現の収集. 自然言語処理,Vol.12, No.3, pp.203-222, 2005. / Nozomi Kobayashi, Kentaro Inui, Yuji Matsumoto, Kenji Tateishi. Collecting Evaluative Expressions for Opinion Extraction, Journal of Natural Language Processing 12(3), 203-222, 2005.
  2. 東山昌彦, 乾健太郎, 松本裕治, 述語の選択選好性に着目した名詞評価極性の獲得, 言語処理学会第14回年次大会論文集, pp.584-587, 2008. / Masahiko Higashiyama, Kentaro Inui, Yuji Matsumoto. Learning Sentiment of Nouns from Selectional Preferences of Verbs and Adjectives, Proceedings of the 14th Annual Meeting of the Association for Natural Language Processing, pp.584-587, 2008.
  3. 栗原理聡, 佐々木彬, 松田耕史, 岡崎直観, 乾健太郎:“Twitterを利用した地域ごとの要望抽出”, 第 29 回人工知能学会全国大会, pp. 1–4 (2015).