こんにちは、SREの青木です。
2020/01/25(Sat)に開催されたSRE NEXT 2020に参加・ブース出展してきましたので報告します。
SRE NEXTとは
SRE によるコミュニティベースのカンファレンスです。
同じくコミュニティベースのSRE勉強会である「SRE Lounge」のメンバーが中心となり運営・開催されます。
(引用元:https://sre-next.dev/#about)
スポンサーブース
今回はゴールドスポンサーということで、ブースには弊社の人気野菜ジュースのVegeelを並べ、
子安・青木・Hitesh・Shrutiがお迎えしました。*1
SRE Nextのスタッフ @saku_238 さんから許可をもらって引用!良い写真に感謝!><oisix様ブース!!
— sakutaro (@saku_238) January 25, 2020
野菜ネット販売サービスのご紹介とSREの取り組みをご紹介中です!!!#srenext #oisix #oisixradaichi pic.twitter.com/6IaD8bEAB2
SRE NEXT公式アカウントさん(@srenext)にもご紹介いただきました#srenext speeeさん、oisixさんでコーヒーとジュースのサービスがあります。
— SRE NEXT (@srenext) January 25, 2020
スポンサーブースまでお越しください pic.twitter.com/k71tQyiQQQ
参加者コメント
参加したメンバーのコメントをつらつらと書きます。
青木
半分くらいブースに立っていましたが、半分はセッションを聴きに行きました!
セッション
今回、聴きたいセッションがいくつも重なっていたので、選択が難しかったです。 また、どのセッションでもSRE本に書かれている原理に基づくものが多く、改めて考えさせられました。 大きく分けると以下の3つがキーワードだったと思います。
- アラート
- オンボーディング・教育
- 振り返り
個人的に印象的だったヤフー株式会社のgo_zen_chuさんの講演 40000 コンテナを動かす SRE チームに至るまでの道に基づくと以下の通りです。
アラート
アラート内容が細か過ぎると影響範囲が不明になるので、
サービス影響を可視化し、それを元にアラートを設定すること。
サービス影響が明確なアラートのみを設定する→メンバーの健康が守られる😆 #srenext
— あおきあおきめ (@meimei_aa428) January 25, 2020
オンボーディング・教育
メンバが成長するタイミングはアラート対応。
アラート対応をするメンバは固定することで、 オンコール担当者以外は自分の開発に集中できる環境を作る。
これに関しては最近弊社でも改善を始めたところです。 今までは昼間にSREチームへ問い合わせやインシデントがあった場合は取りあえず誰かできる人が拾って対応する方針でしたが、 これからは日替わりで窓口を担当し、有識者と一緒に対応していくことでできることを増やそう、という取り組みです。 比較的新メンバでもある私にとっても有り難いです。 (ちなみに夜間はもともと当番制です)
振り返り
ポストモーテムは全員が関わること。
大障害だけでなく、小さい障害も書くと練習にもなる。
また、ロールプレイで各自が障害対応を考える機会を設けることも大切。
この辺りはあまり実行できていない気がするので、何とかして改善したいものです。
懇親会
懇親会でいただいたこんなアドバイスもいただきましたので、共有です。がんばりましょう。
懇親会でいただいたアドバイス
— あおきあおきめ (@meimei_aa428) January 25, 2020
(ちゃんとした)スクラムは試しでもいいからやってみるべき(やってみて合わないならそれでもいい)。チームとしてどんなタスクを持ってるのか可視化して共有する。振り返りもやる。 #srenext
子安(@koyapig)
こんにちは!SREの子安です。 上記にもあるとおり、当イベントでスンポサーブースを出すことになったので、ブース担当として立っていました。 ほとんどの時間をブースで過ごしたので、あまりセッションは聞けていませんが、ブース経験もとても価値のある時間だったと思っています。 聞いたセッションの中で簡単に感想を書かせて頂きたいと思います。
freee のエンジニアは障害から何を学び、どう改善しているのか?
freeeさんの障害から何を学んで何を改善していったのか、という内容でした。ポストモーテムが残ってない、秘伝のタレ、根本対策は後回しってあたりは私も思い当たるところが少なからずあって胸が痛いという感想でした。 その後の取り組みとして行なっている、失敗.js(障害からの学びを共有する場)、割れ窓を改善し隊(小さな問題が大きくなる前に改善する有志の活動)、alertを振り返り隊(1週間のアラートを振り返し、ノウハウを共有する場)というのはとても素晴らしい活動だなと思いました。 「大きな障害は学びの宝庫」障害対応は大変ですが、学べると思って積極的に対応していこうと思います。(もちろんないに越したことはありません!)
懇親会
いろんな方とお話しました。私のお話しさせて頂いた方は、SREという部署やチームはなくSRE的な活動をしているという方が多かったです。外部の方とお話しする機会はそんなに多くないので、とても刺激になる時間でした。
Hitesh
Being a rookie at Oisix Ra Daichi and not very good at Japanese, my team uplifted me to attend SREnext. I had a wonderful time, I met a lot of experienced engineers, and more importantly, I learned a lot about SRE culture, and I’m very grateful to my company for providing me this wonderful opportunity.
Shruti
SREnext is the first event in which I participated. It was really an amazing experience for me. Because of SREnext , I can communicate with many people in different companies , they shared their work and ideas. It was really interesting. Thanks to my SRE team for giving me this opportunity to participate in event.
林(@morihaya55)
こんにちは、SREの林です。 ブースには時々しかいませんでしたが、多くのセッションを聞いてとても学びの多い1日となりました。 日頃から「SREチームとは名乗っているけど、ちゃんとSREできてるんだっけ?」と課題を感じながら過ごしていた中で、SRE Nextの多くのセッションがとても参考になりました。いくつか抜粋して感謝しながら感想をコメントします。
日経電子版SREチーム立ち上げ中
日経電子版という様々な意味で巨大なシステムに対し、新しくSREチームを立ち上げる挑戦についての話でした。冒頭のシステム概要図と開発チームの構成がほとんど同じで「コンウェイの法則...!!」とかなったりしつつ、縦割りな組織に横断的な動きを導入していったのは素晴らしいと感じましたし、SLI/SLOを細かく全てに適用しようとしたことで躓きがあったことはまさに今から私たちがやろうとしていたことの一つだったので、良い気づきを得られました。
余談ですがスピーカの高安さんの低くて渋い語り口も良かったです。
スクラムを1年回してSREと開発組織がどう変わったのか
ビズリーチさんのHARMOS採用*2のSREチームでスクラムを回したことに関しての話でした。 私も効率的にチームの生産性を高めるスクラムについて興味があって細々と学んでいるのですが、思想や効果は分かるものの、割り込みが多い現状を見ると適用が難しいと感じている中で貴重な知見を共有してもらえたのはとても素晴らしかったです。
権限移譲によってそもそもの割込みを減らす、ペアオペレーションでチーム内の属人化に対抗するなど実践可能な有益なプラクティスに気づかせてくれました。
セッション終盤で提示した「SREもスクラムも初めにやることは"計測"、計測できないものは"コントロール(改善)"できない」は実に至言だったと感じました。
ZOZO MLOps のチームリーディングとSRE(Engineering)
最も印象に残ったセッションがこちらでした。私はロールとしてのチームリーダーではありませんが、チーム力を高めて仕事をもっと楽しく生産的にやっていきたい思いを日々持っています。 このセッションではsnototsさんの強いリーディングが淡々と語られ、聴く側としては頷いたり感嘆したりするので忙しかったです。実に素晴らしい内容でした。
すぐにでも取り入れようと考えているのが「チームとしての方向性を定義する」ことで、会社のミッションに沿った自分たちのチームミッションを改めて定義し、アクションのための行動目標も見直します。
自分たちのチームを振り返る際の一つの指標として、今後もこのスライドは何度も拝見することになりそうです。
なお、このセッションの最後の拍手が数秒遅れる事象が発生したのですが、それはあの場にいた私を含む聴衆が内容に圧倒されたせいだったんだと思います。実に良いセッションでした(2回目)
パネルディスカッション
パネルディスカッションもとても楽しめました。元GoogleのSREを含むパネラーがめっちゃ強いのが印象的でした。
「(クラウド技術などの発展により)長期視野で見ればSREは考え方は残るが、専門職としては減っていくだろう」
のコメントはハッとさせられるものがありました。
懇親会
美味しいご飯とお酒を飲みながら、たくさんの方と話す機会を得られました。皆さん様々な課題や試みを行なっていたり、技術談議で盛り上がったりと楽しい時間を過ごせました。
ブースで配りきれなかった弊社野菜ジュースが、リッチな感じでサーブされているのも面白かったですね。
これは #srenext でサーブされてる弊社野菜ジュースです(実に良いカンファレンス&懇親会でした!!) pic.twitter.com/kV5eetbVzB
— もりはや (@morihaya55) January 25, 2020
まとめ
非常に有意義で学びの多いイベントでした。 また、ブース出展したことで、たくさんのエンジニアとお話する機会もいただき、楽しませていただきました。
得られた知見やいただいたアドバイスはチームで活かしていきたいですね!
最後にカンファレンスを開催してくれた全ての方(運営メンバー、登壇者、当日スタッフ、会場提供、ブース参加企業、etc...)に感謝です!!*3