こんにちは、Service Reliability Group(SRG)の鬼海 雄太(@fat47)です。

SRGは主に弊社メディアサービスのインフラ周りを横断的にサポートしており、既存サービスの改善や新規立ち上げ、OSS貢献などを行っているグループです。

本記事では、2026年度のサイバーエージェント新卒研修として実施した「サイバーエージェントのデータベース活用事例とパフォーマンス調査入門」について、その背景と内容の一部を紹介します。

昨年度の新卒向けデータベース研修

昨年度、当社では初めて新卒エンジニア全員を対象としたデータベース研修を実施しました。

データベースの種類に関する基礎的な内容からスタートし、サイバーエージェント社内で実際に採用されているデータベースの事例や、その選定の考え方へと内容を広げていきました。

後半はMySQLに焦点を当て、実際のインシデント事例を取り上げながら、Performance Insights、スロークエリログ、EXPLAINを用いた調査の進め方について扱いました。

詳細は、昨年度のブログ記事をご覧ください
https://developers.cyberagent.co.jp/blog/archives/55842/

昨年度の受講者アンケートで寄せられた声を踏まえ、今年度は研修内容の一部を見直しました。具体的には、次のような意見が挙がっていました。

  • DBのことをよく知らないので基礎用語の解説を増やしてほしい
  • MySQL以外の事例や調査方法も知りたい
  • NewSQLのことをもっと知りたい
  • データベースでのAI活用の話も知りたい

2026年度のデータベース研修で追加した内容の紹介

今年度も、「現場で使われているデータベースについて概要を把握できている状態」を研修のゴールとしました。

全体の章立ては昨年度から大きくは変えていませんが、受講者のフィードバックを踏まえ、内容を変更・拡充しています。

1章  データベース管理システムの種類

2章  社内でよく採用されているデータベースの事例

3章 データベース運用で起きやすい問題とその対応事例

4章 データベースのパフォーマンス悪化時の初動調査手法

1章 データベース管理システムの種類

基礎知識の補強を目的として、今年度は冒頭に用語解説を追加しました。

具体的には、トランザクションやスケールアップ、スケールアウトといった、後続の章を理解するうえで前提となる概念を扱っています。

トランザクションの説明資料

なお、1章はこの用語解説の追加を除き、基本的には昨年度と同様の内容です。

2章 社内でよく採用されているデータベースの事例

この章は昨年度のアンケートでも特に好評だったため、今年度は社内のデータベース採用事例を6件から9件に拡充しました。

たとえばWINTICKETでは、Spannerや社内ドキュメントのハイブリッド検索システムに関する事例を紹介しています。

WINTICKETのDB事例

 

また、AWAにおけるDocumentDB活用事例も取り上げました。詳細はAWS様のブログをご参照ください。

AWAのDB事例

 

全社横断で利用しているAIプラットフォームのDifyでは、ベクトルデータの保存先としてTiDB Cloudを利用している事例も紹介しています。

DifyのDB事例

3章 データベース運用で起きやすい問題とその対応事例

この章では、昨年度から扱っていたMySQLのインシデント事例に加え、Google Cloud Spannerに関する事例を新たに追加しました。

具体的には、新作スマートフォンゲームなどのサービス公開時にアクセスが集中し、データの自動分割や再配置が追いつかなくなるケースを紹介しています。

Spannerが詰まってしまう例

 

その対応策の一つとして、公開前に本番相当のトラフィックを与え、あらかじめデータの分割や再配置を進めておく「ウォームアップ」を紹介しました。

Spannerのウォームアップ

加えて、2025年にGAとなった Pre-splitting 機能についても解説しています。

事前に分割点を設定しておくことで、ウォームアップを行わなくても、split が分割されやすい状態をあらかじめ整えることができます。

Spannerの事前分割

また、インターリーブについても取り上げました。

関連するデータを物理的に近い位置に配置する仕組みの例として、Userテーブル、Orderテーブル、Itemテーブルの配置を図解しています。

Spannerのインターリーブ

 

フルマネージドで自動的に水平分割を行う NewSQL である Spanner であっても、事前準備が不十分な場合にはインシデントにつながり得ます。そうした点を含めて、運用時に意識すべきポイントを整理しました。

3章のまとめ

4章 データベースのパフォーマンス悪化時の初動調査手法

昨年度は、MySQLに特化した初動調査手法として、Performance Insights、EXPLAIN、スロークエリログの活用方法を比較的詳細に扱いました。

今年度はそれらの解説をややコンパクトに整理し、その分、Google Cloud Spanner における初動調査手法を新たに追加しています。

system insights

query insights

System Insights や Query Insights を用いて高負荷の要因となっているクエリを特定し、さらに Lock Insights や Key Visualizer を使って調査を深掘りしていく流れを解説しました。

key visualizer

 

また、データベース領域におけるAI活用の一例として、Aurora MySQL向けMCPサーバーの活用イメージも紹介しています。

Aurora MySQL MCPサーバーの利用イメージ

 

一方で、こうした仕組みは便利である反面、利用時に注意すべき点もあります。研修では、データベース系MCPサーバーを扱う際の留意点についてもあわせて説明しました。

DB系MCPサーバーの注意点

最後に、本研修全体のまとめとして、基礎知識、社内事例、運用で発生した事例、初動調査の考え方を振り返りました。

研修まとめ

おわりに

本年度の研修では、昨年度好評だった内容をベースにしながら、新卒エンジニアの皆さんがより幅広くデータベースの知識を身につけられるよう、内容をアップデートしました。

AIの進化が著しい現在、技術を学ぶ意義も改めて問い直されていると感じています。その中で重要なのは、AIからの提案をそのまま受け入れるのではなく、前提や妥当性を理解したうえで、自ら判断し、責任を持って活用できることです。

本研修が、これから新たな技術に挑戦していく皆さんにとって、データベースを学ぶきっかけの一つとなり、今後のキャリア形成の土台となれば幸いです。