はじめに

AbemaTV データテクノロジーズ所属の作花です.今回は,2020年2月7日から12日にニューヨークで開催された人工知能技術に関する国際会議であるAAAI-20の参加報告を行います.今年は約4,000名の参加登録がありましたが,コロナウイルスによる入国制限で約800名の方が会場に来ることができませんでした.会場に来ることができない発表者は,事前に撮影したビデオまたはリモートプレゼンテーションによる発表となりました.今回は全体で1,591件の論文が採択され,国別に見ると中国がもっとも多く全体の三分の一以上を占めていました.日本からも35件の論文が採択されていました.

AAAI-20会場
AAAI-20の会場

WorkshopとTutorial

学会前半の2月7日と8日には,全23テーマのWorkshopとTutorialが行われました.テーマの一覧を見ると,各要素技術を実社会の問題に応用するテーマが例年より多くなったと感じました.社会応用に伴い,機械学習を用いた手法の説明可能性や適切な評価方法に関する関心が集まってきていました.加えて,人工知能技術は従来のコンピュータ技術と異なるため,今後どのように向き合っていくべきかについてのガイドラインを紹介した発表も行われました.

上記に関するWorkshopやTutorialは以下のタイトルで行われました.

Explainable AI: Foundations, Industrial Applications, Practical Challenges, and Lessons Learned

Guidelines for Human-AI Interaction

Evaluating Evaluation of AI Systems

ここでは発表内容のうち一つを紹介したいと思います.

Going Beneath the Surface: Evaluating Image Captioning for Grammaticality, Truthfulness and Diversity

マルチモーダルなタスクとしてImage Captioningは関心が集まっているが,その評価方法はキャプション間の表面的な類似度を主に測っていました.そこで本論文では,文法的な正しさを表す”Grammaticality”,画像の内容とキャプションが一致しているかを表す“Truthfulnness”,キャプションの多様性を表す“Diversity”の3点を評価するフレームワークを提案した.そして,提案したフレームワークが既存のキャプション生成タスクにおいて,より詳細な解釈を得るための手助けとなることを確認した.

本会議

学会後半の2月9日から12日の期間で本会議が行われました.2月9日には2018年にACM Turing Awardを受賞したYann LeCun, Geoffrey E. Hinton,  Yoshua Bengioによる招待公演が行われました.それぞれ,40分程度の時間で最新の研究内容についてプレゼンテーションが行われ,その後会場からの質疑応答となりました.質疑応答では,企業と大学で研究することの違いや長期的な視点で深く考えてみることの大切さなどについて,企業と大学の両組織に所属する方々からの考えを聞くことができました.

Geffrey Hintonによる招待公演
Geffrey Hintonによる招待公演

 

 最後に私が興味を持った論文を3つ紹介します.

Rethinking Temporal Fusion for Video-Based Person RE-Identification on Semantic and Time Aspect

こちらはperson re-identification(ReID)と呼ばれるタスクに関する論文です.ReIDとは,異なるカメラや異なる場所で撮影された同一人物の画像を対応づけるタスクです.本論文では,単一フレームのみでなくビデオ全体の情報を用いることでセマンティックな側面と時系列的な側面の両者を考慮した手法を提案していました.具体的には,CNNの各層から抽出されるfeature mapを時系列方向に集約するネットワークを導入することでビデオ全体の情報を用いていました.加えて,ベンチマークデータセットであるPRID2011, iLIDSーVID, MARSに対して提案手法はstate-of-the-artの性能が示されました

 

Interpretable Rumor Detection in Microblogs by Attending to User Interactions

この論文では,twitterのようなmicroblogにおいて偽の主張を検出することを目的としています.偽の主張を検出することは,近年大きな社会問題にもなっているfake newsの拡散を抑える目的でも重要です.先行研究はconversational treeを用いた手法が主であり,関係性が特定のユーザに限定されていました.しかし,ソーシャルメディアでは多くの場合特定のユーザのみでなくスレッド全体に対して反応することが多いです.そのため,本論文ではtoken-levelとpost-levelでAttention Mechanismを用いることで投稿に関するスレッド内の離れた返信の関係性を考慮できる手法を提案しています.加えて,Attention Mechanismを導入することで偽の主張を検出した際に重要なtokenとpostを確認することもできます.

 

Reinforcing an Image Caption Generator Using Off-Line Human Feedback

この論文では,caption rating datasetを用いてcaptioning modelを学習する方法を提案しています.caption rating datasetでは,モデルが生成したキャプションに対して人が0から1のスコア付けを行っており,一つの画像に対してスコアが付いた複数のキャプションの候補が紐づくようになっています.そこでこの論文では,画像に紐付いた各キャプションのスコアを報酬とし,off-policyの強化学習の問題設定としキャプション生成を行っています.

おわりに

AAAIでの発表内容は,特定の専門領域に特化することなく幅広い領域を対象としています.そのため,普段自主的に論文を読まないような領域の発表も聞くことができ,各領域の現状や課題を知ることができました.また,多くのポスターセッションも開催されているため,大規模な学会ではありますがじっくり議論する機会もありました.次回は2021年2月2日から9日の期間でカナダのバンクーバーで開催される予定です.

2019年に新卒入社後、AbemaTV データテクノロジーズ所属。エンタメ領域に対して、データ解析および機械学習の手法を適用する業務を行っている。