みなさんこんにちは。
Ameba統括事業本部 広告部門 (MDH) でディレクターを担当しているkogetsuです。
最近は気温もぐっと下がってきて、本格的に冬が到来しましたね。
皆様体調を崩されてませんでしょうか?
前回に引き続きMDH社内勉強会「LT Thursday」が先日開催されました。
節目の10回目となる今回は、サイバーエージェントが誇る大規模データ処理及び機械学習の専門家集団である秋葉原ラボのメンバーが発表してくれました!
秋葉原ラボのメンバーとはサイバーエージェントメディア部門(MDH)のアドテクプロダクトであるA.J.A.を協働しながら作っています。
その模様をみなさまにお伝えしていきます。
- Tristan:「Glasgow広告ランキング」
はじめに発表してくれたのはイギリス出身のTristanです。
ビタミンDとK2、肝油をサプリメントとして摂取するのが最近の趣味だそうです。
広告をCPMに従ってランキングする際に活用されている事の多いバンディットアルゴリズムについてプレゼンをしてくれました。
バンディットアルゴリズムは、機械学習の強化学習の一種で、実績の無いまたは少ない広告の配信を調整(探索)しつつ、もっとも良い結果になるように広告を配信する(活用)アルゴリズムです。
具体的に、
ε-first
ε-Greedy
Thompson Sampling
を用いながら、如何に効果的に「探求」と「活用」のバランスを取っていくかについて説明がされました。
それから Contexual Bandit についての説明が続きました。
Contexual Bandit では広告アカウントに属する情報やユーザーに関する情報をインプットとしてCTRを予測しています。
ここでもいくつかの機械学習モデルのロジックを紹介しながら、現在どのようなアルゴリズムが利用されているかがプレゼンされました。
最後に紹介されましたが、現在の最新ロジックは従来よりも7%ほどCPMが高いようで、これからのリリースが楽しみです。
とても勉強になるプレゼンでした!
- 數見:オークションのちょっと詳しい話
続いて數見からオークション全般についての話がありました。
冒頭はオークションゲームから始まりました。
「少なくとも20枚以上の50円玉が入っている袋をいったいいくらで入札しますか?」というお題です。
自分の入札額をそのまま払うという前提でやったこのゲームですが、「入札をするにあたって自分の予測している値段でそのまま入札せず、損しない範囲で2位の人よりもちょっとだけ高い値段で入札したい」という感想を色んな人がもらしました。
落札者が本来よりも高い値段で落札してしまったことを後悔する現象を「勝者の呪い」というそうです。
先のオークションゲームの感想から、入札者は「勝者の呪い」を回避するために、考えているよりも低い値段で入札している可能性があります。
ただ、これは入札額と支払う金額が同じ場合に起こることで、この欠点の回避するオークション形式としてセカンドプライスオークションが紹介されました。
アドテクプロダクトで広く採用されているセカンドプライスオークションでは、落札者は2位の人の入札額プラス1円を支払います。
この形式では自分がほしい値段で入札する事が最適な戦略になります。
これで「勝者の呪い」から開放されるにもかかわらず、オークション開催者の期待収益はファーストプライスオークションと変わらないそうです。
続いて、VCGオークションが紹介されました。
VCGオークションでは「そのオークション参加者の参加によって他の人が被る迷惑料」を支払います。海外では電波オークションなどで広く利用されているようなのですが具体例を示しながらどのような価格決定方法なのかを学びました。
最終的には、他社で行われているオークションの工夫などを紹介しながら、メディア、広告主、ユーザーにとって最適なオークションを目指したいとの宣言で終了しました。
- 佐藤:Zero@Glasgow
3人目も秋葉原ラボのエンジニア佐藤の発表です。
佐藤からはレポートの速報値または配信制御のためのデータを提供している、Zeroと呼ばれるシステムが紹介されました。
このシステムは、実はMDHの広告配信システムよりも歴史が深いものです。
「IDのリアルタイムなマッピング」や「バンディットのためのデータ作成」などリアルタイムな処理を作るときに毎回新規でシステムを作っていたものの、まとめると「Flume sink でHBaseにデータを書く何か」であることに着目し、汎用的に使えるシステムとして誕生しました。
SQLライクなクエリ言語が独自に設計されており、管理画面から登録ができるようになっていて、それをすることによって任意の粒度と任意の時間単位でFlumeを通じて転送されてきたログの集計を取ってくれます。
広告配信ではこのシステムを通じてリアルタイム集計されているカウントをフリークエンシーキャップなどに利用しています。
こうした、広告分野だけではなく十分な利用実績のある共通基盤をラボが開発し、それを利用できるのがMDHにおけるアドテクプロダクト開発の強みになっていると再認識しました。
また、最後にはこれまで広告配信において起こった障害が紹介されみんな興味深々で聞きいっていました。
今回は非常にアカデミックな回となりました。
MDHではエンジニアにも機械学習を学ぶ機会を提供しており、
先日もメディアに紹介されています。
エンジニアがデータサイエンスにも挑戦できる組織を立ち上げたサイバーエージェントの試み
今後も勉強会や実務を通じて機械学習のスキルを磨く機会を
増やしていきたいと思います。
以上、第10回「LT Thursday」レポートでした。
次回もお楽しみに!