技術本部 サービスリライアビリティグループ(SRG)の須藤 @strsk です。

 

2022年3月12日にLINE、リクルート、DeNA、メルカリグループ、クックパッド、CAの6社による合同SRE勉強会で登壇させていただきました。

登録者は1300人を超え、SREというワードの熱さを実感できたイベントでした。聴講していただいた皆さんありがとうございました!

ということで、忘れぬうちにその振り返りをしてみたいと思います。

イベント資料、アーカイブ動画はこちら

いち聴講者として

SREを軸に大規模なシステムやアクセスに対しての対策や、SREのプラクティス、少ないSREsでどう立ち回るかといった、各社示唆に富む内容ばかりで自分自身とても参考になりましたし、事情は違えどもみんな考えることは同じだな、という印象を受けました。

特に「縦と横の機能」、「SREのEnabling」、「運用の完結化」あたりは日本企業のSREのプラクティスとして今後より洗練されていくんだろうと期待しています。

いち登壇者として

今回のような規模の大きいイベントを進めるにあたって、LINE社をはじめとした各社人事やDevRelの方々の多くのサポートがありました。

イベントの広報戦略やAsk the Speakerによる内容の深堀りなど、ただただ私たちが拙いプレゼンをしただけでは届けることができなかった内容を多くの人に見てもらえたのはひとえに運営の皆さまのおかげです!ありがとうございました!

こんな時期でなければ打ち上げでもして積もる話をしてみたいものです。

発表セッション「横断的なSRE推進と成熟度評価」

発表では、以下3つの章立てで話を進めました。サマリーの確認にお使いください。

①インフラチームをSREsとしてコンバートするまで

②プロダクトへのSRE導入のススメ方

③横断的なSRE推進についての戦略

  • インフラチームのパフォーマンス改善
    • 担当制の廃止
    • プロジェクト制の導入
  • SREsとしての職務定義
    • Embedded SRE
      • プロダクトチームにジョイン
      • プロダクトニーズの実行とSREの推進
    • SRE Center of Practice
      • プロダクトでのノウハウを共通ナレッジに還元
        • ワーキンググループ結成
      • ベストプラクティス(ナレッジ、ツール)開発
    • どちらかをやるではなくどちらもやる
  • この組織でのSREを定義する
    • 信頼性を機能として扱うプラクティス
    • 改善するためのプラクティス
    • それらを実行していくための組織文化
  • 現在地を知る
    • 信頼性の階層
  • プロダクトでのSREのススメ方
    • 丁寧なコンセプト理解
    • 導入ステップ設計
    • 実行
  • 横断的なSRE推進
    • 能力成熟度モデル統合としてSREを定義
    • SREを構成する要素をシンプル化し評価
    • 全体最適の礎をつくる
    • ベストプラクティスを定義したLv.3作成

まとめ

SREは私の中でここ4,5年の大きなテーマであり、これを言語化するのに多くの試行錯誤がありましたし、まだ道半ばです。

今回このテーマにした理由としては、インフラチームをSREsとしてコンバートすることがネガティブに捉えられがちな印象を持たれていたり、SREの組織づくりについての経験を求められることが多くなってきたこともあって、現時点での自分の解とそれまでの道のりを公開することで、日本企業でのSREがより発展することの一助になればいいなと、大きめの理想を描いてそうしました。

おかげさまで(?)Twitterなどではたくさん良い感想をいただけたので、これを原動力にまたがんばりたいと思います。

他にも気になることなどあればTwitterやお近くの居酒屋、雀荘などで気軽にお声がけください!

某焼肉店の店長を経て、サイバーエージェントにカスタマーサポートのアルバイトとして入社。ネットワークエンジニアに寄り道をしながら、現在はAmebaのサービス全体のインフラ部門のエンジニア兼マネージャーをしています。