こんにちは、株式会社サイバーエージェント 秋葉原ラボの高野です。2017年11月30日に行われた「WWW2017論文読み会」のレポートをお届けします。

WWWは情報系トップカンファレンスのうちの一つで、その名の通りWebに関する国際会議でシステム・検索・機械学習から社会問題まで幅広いトピックを扱っています。 発表された全ての論文は以下のサイトで公開されています。

  • WWW2017 Proceedings
    この論文読み会では後述の弊社秋葉原ラボのエンジニアの6名がWWW2017のセッションからいくつか選び、各セッションを概観し、その中から特に興味深い論文を2つほどご紹介いたしました。また時間の都合上、当日は割愛いたしましたが以下のスライドでは他の論文についても2, 3文で簡単な解説をしています。当日は30名の方にお越しいただき、懇親会では紹介論文や国際会議の動向などについて議論が行われました。

ごあいさつ

このレポートでは各発表の概要をスライドともにご紹介いたします。

Ad Auctions

Ad Auctionsセッションは數見が担当いたしました。 オンライン広告を取引するプラットフォーム・そのプラットフォーム上で取引をする経済主体を対象として、実際の取引データを利用した研究が多く発表されていました。他のセッションと比較して企業の研究者からの方向がほとんどでした。

數見の発表の様子

 

Systems and Infrastructure

Systems and Infrastructureセッションは斎藤が担当いたしました。 このセッションは一言で言い表せないほどテーマが広く、中には火星から検索サービスを利用したとき何がおこるのかを真面目に考察する論文もありました。今回はWeb企業の現場の視点から2つの論文をご紹介しました。

斎藤の発表の様子

Computational Health

Computational Healthセッションは高野が担当いたしました。このセッションは計算機やインターネットの力を使って病気・健康上の問題の解決を目指すものです。ここではネット上の雑多なレシピから健康なレシピを選び出す研究、重度のうつ状態の徴候を把握し検知する研究の2つをご紹介しました。

高野の発表の様子

Information Cascades と Graph Algorithms

Information Cascades と Graph Algorithmsの2つのセッションは武内が担当いたしました。

Information Cascadesでは、SNS等で発生する情報の拡散現象(カスケード現象)に関する研究が扱われています。研究対象は、その発生メカニズムの解明からその予測方法や検出方法などがあり、本発表では、カスケードサイズ予測を通じて事象の理解を深める、やや理論的な研究をご紹介しました。

Graph Algorithmsでは、主にインターネットに関連する何らかのネットワークについて、その分析手法や可達性の計算手法などが提案されています。本発表では、その中から、比較的汎用的に活用できるネットワークの可視化手法に関する研究をご紹介しました。

武内の発表の様子

Spam Detection と Question Answering & Topic Modeling

Spam Detection と Question Answering & Topic Modelingの2つのセッションは角田が担当いたしました。各セッションから1報告ずつ取り上げて紹介しております。

Spam Detection は、いわゆるステルスマーケティングやアクセス数の水増しと言ったサービスの不正利用を「スパム」と捉え、スパムの分析と検出を目的としたセッションです。本発表では、このうち、レビューサイトでのステルスマーケティングを検出する研究をご紹介しました。

Question Answering & Topic Modeling では、質問応答システムの開発や質問応答ウェブサイトの情報整理を目的とした研究と、雑多な文書から分野・話題などを整理するトピックモデルに関わる研究の報告がされています。本発表では、このうち、StackOverflow と呼ばれるプログラミング技術に関わる質問応答コミュニティにおける重複質問を検出する研究をご紹介しました。

角田の発表の様子

 

[slideshare id=83304877&doc=www2017-171204084536]

Recommender Systems

Recommender Systemsは山本が担当いたしました。このセッションは推薦システムに関しての改良や新しい問題設定についての研究が扱われていました。ここではユーザー・商品を同じ次元の空間に写像してそれらの距離を学習する方法と、公平性の基準のもとでユーザー群に複数商品を割り当てる際のアルゴリズムの考察について紹介しました。

山本の発表の様子

おわりに

この読み会では上記のように8つの種類のセッションを取り上げ、セッションの概要とピックアップした2つの論文をご紹介いたしました。WWWはアイデア・切り口が興味深い論文が多く読んでいて・紹介を聞いていてワクワクする研究が多くありました。

この読み会では、発表者は担当セッションを決めて、まずは一通り論文を読んた後、紹介論文を決める形を取りました。WWWは非常に幅広いトピックを扱う国際会議ですので、自分の業務・研究とは少しズレた、普段読まないような論文も読むことになりました。これによって自身の業務・研究の幅を広げることができそうです。ご参加いただいた皆さまや上記の資料を御覧頂いた皆様の幅を広げるきっかけにもなれば幸いです。

参考

秋葉原ラボ 発表論文一覧

takano
技術本部 秋葉原ラボ所属。2011年にフロントエンドエンジニアとして中途入社。その後、データマイニングエンジニアとして自社サービスのデータ分析と計算社会科学の研究に従事。計算社会科学・複雑系・理論生物学・進化ゲーム・統計モデリングなどに興味。