こんにちは、技術本部秋葉原ラボソフトウェアエンジニアの數見です。

秋葉原ラボのエンジニアが、アメーバブログ、AWAやAbemaTVなどに代表される当社のメディア事業の発展とともに取り組んできた技術をまとめた「秋葉原ラボ技術報告書」を4/22開催の技術書典4にて頒布致します。

秋葉原ラボのミッションは、各サービスからの大規模なデータを収集・集計する基盤を中心として、検索、データ分析や機械学習などを活用しながらサービスの発展に寄与することです。本書は、こうしたミッションに基づいた秋葉原ラボの技術と成果をまとめたもので、主に下記のような3つのパートから構成されています。

  1. 大規模データ処理システム
  2. 機械学習システム
  3. データ分析

以下、それぞれ3つのパートの紹介と見どころを簡単に説明したいと思います。ご購入の際に参考になれば幸いです。

大規模データ処理システム

大規模データ処理システムでは、秋葉原ラボにおける大規模データを収集・蓄積・活用するための基盤システムの開発事例と運用について紹介しています。秋葉原ラボでは様々な基盤システムを開発・運用していますが、今回は、データ解析、検索、ストリーム処理のための基盤システムについてまとめました。いずれも当社で実際に利用されながら改善を続けてきたシステムなので、独特な内容になっていると思います。

機械学習システム

機械学習システムのパートでは、株式会社AJAに提供しているレコメンデーションシステムについて言及しています。大規模なテキストデータから類似している記事を高速に見つけるにはどうすればよいかについて、システム・アーキテクチャとアルゴリズムの2つの切り口から説明していることです。大規模なデータに耐えうるレコメンデーションシステムの開発事例として必見です。

データ分析

データ分析のパートでは、AbemaTVとAWAにおける分析事例と、Webにおける社会科学の研究事例を紹介します。本パートの分析事例や研究事例は国内の研究会や国際会議でも報告されています。メディアサービスにおけるユーザ行動の統計モデリングや社会科学のWeb社会への応用研究にご興味ある方はぜひご覧ください。

さいごに

以上、簡単ではありますが「秋葉原ラボ技術報告書」の紹介です。
尚、本書は1,000 円にて頒布予定ですが、WebDB Forum、情報処理学会、xSIGなどの学会、および秋葉原ラボが開催するイベントCADEDAなどにて無料で配布しております。購入の際には、ご了承頂きますようお願い致します。

トレンド検知システムやスパムフィルタの開発・運用、Amebaメディアの広告配信ロジックの開発などのデータ分析業務を担当。