2022年3月12日(土)に、IT企業6社(LINE/メルカリグループ/クックパッド/ディー・エヌ・エー/サイバーエージェントグループ/リクルート)が合同で、Site Reliability Engineering(SRE)領域の勉強会をオンライン開催します。本日はCAグループから登壇する2名より、各セッションの見どころをご紹介させていただきます。
目次
- 6社合同SRE勉強会について
- 【Track A/12:00-12:45】CyberZのSREにおけるプロダクト開発チームとの関わり方/藤井貴大
- 【Track B/14:15-15:00】横断的なSRE推進と成熟度評価/須藤涼介
- 各社の見どころご紹介記事一覧
6社合同SRE勉強会について
※ compassからコピペ
IT企業6社(LINE/メルカリ/クックパッド/ディー・エヌ・エー/サイバーエージェント/リクルート)が合同で開催する、Site Reliability Engineering(SRE)領域の勉強会です。
各社が特徴的な事例を共有し、各セッションのAsk the Speakerでは違う会社の登壇者がモデレーター兼聞き手を務めて、知見共有&深堀りを行なっていきます。
Opening Sessionでは、イベント開催の経緯やコンセプトや意気込みなどを簡単にお話しします。Closing Sessionでは、各登壇者がそれぞれのセッションに参加して感じたこと、気になった・良かったポイントなどをラフに話し合います。
現在SREという立場で業務に取り組む方、規模の大きい会社・サービスにおけるSREの事例や課題解決アプローチに興味がある方、今後のキャリアでSREという領域・役割を検討している方など、SREに興味がある方であればどなたでもご参加ください。
ご興味のある方は下記リンクから事前参加登録をいただければ幸いです。
Connpass : https://line.connpass.com/event/236497/
Twitter : https://twitter.com/SRE_GodoBenkyo
事前質問を受付中
それぞれのセッション対して気になっていること、より詳細にききたいことなどSlidoで事前に質問を受け付けています。また、投稿されているものに対して投票することも可能です。是非、お気軽にご投稿ください。
【Track A/12:00-12:45】CyberZのSREにおけるプロダクト開発チームとの関わり方
https://app.sli.do/event/69NsymbVyTo8ZMFvp17UEh
【Track B/14:15-15:00】横断的なSRE推進と成熟度評価
https://app.sli.do/event/3peBTvWA2y4Qqz44tMbQRD
【Track A/12:00-12:45】CyberZのSREにおけるプロダクト開発チームとの関わり方/藤井貴大
株式会社CyberZでSREをしている藤井です。今回は私が普段SREとしてプロダクト開発チームと関わり合いながら業務をしている中で、気をつけていることや導入した仕組み、体制などをお話しできればと考えています。
現在所属しているSREチームは、2018年にOPENREC.tv開発エンジニアのインフラエンジニア1名及びバックエンドエンジニア数名によってスタートしました。チームメンバーの多くがバックエンド経験があり、かつOPENREC.tvの機能開発にも携わっているため、オンコールローテーションをサーバーサイドチームと共同で行ったり、各種レガシーアプリケーションのEKS移行およびキャパシティプランニングなどをSREが行ったりしてきました。開発組織としてはSRE、サーバー、Web、アプリ、UIやCSのチームがあり合計で30名前後で、比較的小〜中程度の規模だと思います。2022年現在はOPENREC.tvのプラットフォームチーム的な活動に加え、CyberZ内の他の開発チームに対してもSRE的取り組みを広げ、横断的に活動を行い始めている段階です。
OPENREC.tvのサーバーチームと連携して進めたオンコールローテーションや障害対応設計、SLI/SLO、ポストモーテムなどに加え、Web/アプリクライアントチームへの障害対応フロー導入への展望、そしてチーム横断のDevOps導入施策などについて、小〜中規模開発組織におけるSREチームの立ち振る舞いにフィーチャーしながら発表できればと考えております。事前にご質問をいただければ可能な限り登壇内容に盛り込みたいと思いますので、宜しければ是非Slidoにてご投稿いただければ幸いです。
【Track B/14:15-15:00】横断的なSRE推進と成熟度評価/須藤涼介
技術本部 サービスリライアビリティグループ(SRG)でマネージャーをしている須藤 @strsk です。
CAのメディア事業ではアメブロからピグ、AWAや基盤システムなど含め30前後のシステムが運用されています。利用している技術スタックも運用開始した時期もプロダクトチームの体制もそれぞれ異なります。
「SREという言葉やプラクティスは知っているが何から始めていいかわからない、どのように進めるのが最適かわからない」と言った声も聞こえてきた中で、現状を把握し、推進していくためにSREに必要な要素を分類し、成熟度モデルを作成しました。これらを使い横断的に評価し改善していく取り組みに加え、実際のプロダクトチームへSREとして参画しSLO設定やアラート改善などSREのプラクティスをどう実行しているかについてお話できればと思います。事前に聞きたい部分などあればぜひSlidoにお寄せください。
各社の見どころご紹介記事一覧
- LINEの記事 : https://engineering.linecorp.com/ja/blog/sre-benkyokai-preblog/
- サイバーエージェントグループの記事(本記事) : https://developers.cyberagent.co.jp/blog/archives/34573/
- リクルートの記事 : https://blog.studysapuri.jp/entry/2022/02/17/sre-study-session
- ディー・エヌ・エーの記事 : https://engineering.dena.com/blog/2022/02/sre-joint-study-session/
- メルカリグループの記事 : https://mercan.mercari.com/articles/33154/
- クックパッドの記事 : https://techlife.cookpad.com/entry/2022/02/22/140204