Faber Company 開発ブログ

ファベルカンパニーと読みます。

【レポート】PagerDuty on Tour TOKYO 2024に参加しました!

PagerDuty on Tour TOKYO 2024 が2024年8月6日に開催されました。

Faber Company 開発運用チーム 金子が注目したセッションをピックアップして速報します!

注目したセッション

Keynote: 株式会社JR東日本情報システム 吉川様とPagerDuty Jennifer様の対談

登壇者

株式会社JR東日本情報システム 取締役
Suica・駅サービスソリューション本部長
吉川 眞之

PagerDuty
Chief Executive Officer
Jennifer Tejada

所感

現代では、多くのサービスが24時間365日運用することを期待されています。ただし、運用には常に『障害』というイレギュラーがつきまとい、ここに適切に対処できないサービスは信頼性が急速に低下していきます。さらに、PagerDutyをはじめとする障害検知システムや機構を導入する企業が増えているのは、サービスが事業成長に対してミッションクリティカルになってきたことも関係しているでしょう。

検知とアラートを自動化することにより、その時間を修正に充て、迅速な修正とお客様への対応を実施することが可能となります。もちろんツールを導入することはゴールではありません。ツールの導入によって生まれた時間を、さらなる究極課題の解決に充て、お客様に向けた付加価値の高い機能開発と信頼性の向上に向けてサービスを改善していくことが最重要です。

これらの変革を生み出すため、リーダーには組織やチームの振り返りを促進し、変化を生み出していくことが求められています。メンバーへの説明と協力を忘れず、ツール活用をはじめとする組織課題の解決に向けた活動をこれからも進めていきます。

Keynote: AIと自動化が実現するオペレーショナル・エクセレンス

登壇者

PagerDuty
Chief Product Development Officer
Jeffrey Hausman

所感

PagerDutyの将来的なリリース計画も交えながら、レジリエンスに対しての理解と必要性が高まっていることを紹介いただきました。 組織の限られたキャパシティ (人数、付加価値の高い機能開発など) で求められるSLA/SLOを達成し続けるためには、情報を一元管理し、可視化と自動化を通して運用に取り入れていくことが求められます。 PagerDutyではSlackと連携したAIアシスタントをリリースする(近日中に日本語版もリリース予定)とのことで、日々の業務とのシームレスな連携が進む印象を受けました。

また、障害の解決と文書化が終わった後には、その障害から学習し、組織として再発防止につなげることがとても重要です。ここでいう組織とは開発チームだけでなく、お客様とのやり取りをしているサポートチームなどの関係者も含みます。たいてい、日常業務の中で急に発生する障害対応に十分な時間を確保することは困難です。その振り返りと学習をAIによって自動化するソリューションも紹介されていました。とても興味深かったです。

Customer Showcase: トヨタCCoEのインシデント管理効率化に向けた挑戦

概要

トヨタでは「モビリティカンパニーへのフルモデルチェンジ」に向けて、クラウドを活用したサービス開発が全社的に広がっています。Cloud Center of Excellence (CCoE) ではトヨタのソフトウェア開発プロジェクトに対し、安心して開発運用できるプラットフォームを提供しています。今回、なぜトヨタCCoEがPagerDutyを使ってインシデントレスポンスの効率化に取り組むのか?今後どのようにプラットフォームとして展開していくのか?についてご紹介いたします。

イベントページから引用)

登壇者

トヨタ自動車株式会社
先進データサイエンス統括部 DS基盤開発室 主任
村瀬 友規

所感

当社開発チームでも、より多くのお客様に価値を提供すべく、新たな事業やサービスを展開していくことが増えていきます。 その中で、開発速度の観点からだけでなく、セキュリティレベルやガイドラインに準拠した開発を進めていくことが重要です。 今回は、その開発体制を構築するために村瀬さんを中心とするトヨタCCoEがどのように取り組んでいるのか、その中で生まれた課題にどのようにPagerDutyを活用しているのかをご紹介頂きました。

トヨタ生産方式(TPS)における「付加価値のない作業」と「ムダ」を自動化によって解消しているというケーススタディを伺い、これは当社内でも多くの作業に自動化の余地があると感じています。 また、自動化によってどのような課題を解消できるかを知ることは、今まで「仕方ない」と無意識に感じていた業務に再度目を向け、改善の可能性を検討するヒントにつながります。 これからも外部のケーススタディを学びつつ、どのように自社の課題を発見、解決していくかを日々継続して考えていきます。

Customer Showcase: センターオペレーション改革でのイベント管理業務の自動化について

概要

環境の変化に伴い多様化してきたシステム監視を、24時間/365日、人手により監視オペレーションを実施してきましたが、年々、オペレータの負荷が増加している状況が課題となっておりました。 この課題に対し、ANAシステムズでは2023-2025年度での運用の中期的な取り組みを進めており、その施策の1つとして、2023年度にセンターオペレーション改革に取り組みました。 具体的には、オペレータの負荷の軽減を図るために、イベント管理業務へPagerDutyを導入し、検知→初動の切り分け→通知の自動化を実現したため、この取り組みについて紹介します。

イベントページから引用)

登壇者

ANAシステムズ株式会社
品質・技術部 プロセス統括チーム テクニカルマネージャ
西田 哲也

所感

サービスの品質管理の観点から、リリース前には機能やUIのチェックが欠かせません。しかし、そのチェックをすべて人手で実行する体制が定常化すると、サービスの増加や支援領域の拡大に伴って人手不足やチェック漏れを引き起こし、ゆくゆくは事業成長に対するボトルネックとなっていきます。

ANAでは月5,000件報告されるアラートのうち、60%がマニュアル通りの対応で解消するものだったようで、それらを自動化することによりセンターオペレーション工数の削減を達成したとのことです。

我々も、上場という節目を経て、これまでに増して多くのサービス、機能を開発し、より多くのお客様のお困りごとを解決していきます。そのスピードに適応し、組織が常にスケールし続けられるよう、運用をシステム化していく視点を持ちながらこれからも開発フローを構築、改善していこうと思います。

今回お話いただいた中長期計画は以下のページにて紹介されているとのことでした。 https://www.anasystems.co.jp/company/plan.html

概要

PagerDuty を活用したマネージドサービスで、運用高度化のはじめの一歩を一緒に踏み出しませんか。長年全国で展開してきたオンプレミス保守・運用の経験をもとに、ハイブリット・マルチクラウド環境の運用ノウハウを融合して提供する ITOps Transformation サービス(ITOX,アイトックス)。人手対応中心の泥臭い運用現場から一歩一歩変わりゆく過程を、 PagerDutyを使い倒している具体例を交えながらご紹介いたします。

イベントページから引用)

登壇者

CTCテクノロジー株式会社
企画推進本部 ソリューションサービス企画部・エキスパートエンジニア
渡部 和

所感

実際のサポート業務ではどのようなワークフローが使われていて、そのどこに改善の余地があるかをサポート担当者と開発者が一緒に議論することが大事だと感じました。サポート業務の担当者にヒアリングするだけではなく、現場を見に行くことが重要ですよね。

また、渡部さんは運用を高度化する際の課題についても触れていました。品質維持が最優先とされる環境にツールを導入する場合、マネージドサービスを活用することで早く小さくトライし、少しずつ幅を拡げていくことが大事とのことです。

概要

アイレットはパブリッククラウドを中心に10年以上のマネージドサービスプロバイダーとしての実績があります。本講演では、運用監視の高度化を目指す企業様向けに、10,000台以上にマネージドサービスを提供するアイレットがPagerDutyを用いてどのように業務をスケールさせ、運用監視の高度化を進めてきたか、その軌跡をご紹介いたします。また、マネージドサービスとして自社内の利用に留まらず、多数の運用実績のノウハウを活かしたお客様のPagerDuty活用もご支援可能です。どのようなご支援ができるのか、併せてご説明いたします。

イベントページから引用)

登壇者

アイレット株式会社
クラウドインテグレーション事業部 MSPセクション セクションリーダー
蓮沼 翔悟

所感

今日伺った内容の総まとめとも言える、具体的な活用事例を紹介いただきました。

PagerDutyとチケット管理ツールを連携して起票を自動化する。AMSを用いてAWS上のリソースの問題を自動で修正する。対応が完了したあとには対応内容と改善ポイントをAIがまとめてポストモーテムに活用する。これらすべてのステップに1つの製品でアプローチできるツールはなかなかないと思います。

当社開発チームでは7,000台を超えるサーバを管理しています。今後の検知とアラート機構の改善に多くのヒントを得られた発表でした。

Special keynote: これからの企業のAI活用とビジネス戦略 〜AIが超加速する予測不能な未来をチャンスに出来る要諦と実例〜

概要

生成AIがどのようにして企業の競争力を強化し、イノベーションを促進するのか、その実用性と将来性について解説します。生成AIの技術的側面だけでなく、具体的なビジネス活用事例を通じて、実践的な視点からその可能性を探ります。さらに企業のインシデント管理の経験などをはじめ、数多くのIT企業や大手事業会社でのキャリアやコンサルティングの経験を踏まえた実践的な知見も紹介します。

イベントページから引用)

登壇者

IT批評家
尾原 和啓

所感

AIを取り巻く業界の進化やDXへの導入事例、これからの発展について、かなり濃厚なお話をいただきました。 かつては物理法則を考慮しなければ処理できなかったレイトレーシング技術や自動運転技術が、確率論的アプローチによって解消される事例が増えてきたという話から、このような「予測が難しい進化や革新」とどう向き合っていくか、また非形式的なデータや情報を取り扱えるようになったAIは今後どのような活用が増えていくのかという話はとても印象に残りました。

その中でも、今の日本でスタンダードになっている「正解主義(正解がすでに決まっていて、それにどれだけ早く失敗せずにたどり着くか)」という考え方ではなく、「修正主義(変化する業界や技術の中で、失敗を受け入れながらも成長を続けていく)」の考え方がメジャーになっていくだろう。そして、予測可能であることが求められる世界から操作(修正)可能であることを重視する変化が生まれてくるだろうということでした。

これは開発者ならなじみのある「アジャイル開発」に近い考え方かなと思います。変化を受け入れ、いかにその変化に柔軟に適応するかが重視される時代を私たちは過ごしています。開発者としてそのカオスを楽しみながら、デジタルマーケティングの世界のダイナミックな変化に適応できる組織を創り上げていきたいですね。

概要

企業がより速くビジネスを進めるために、ITの内製化が課題となっています。一方で、ITの重要性はますます高まっており、障害のアラートはますます増え、重大なトラブルに繋がるアラートを見逃さないことがより困難になっています。本セッションでは、DatadogとPagerDutyを組み合わせることで、障害の検出と応答時間、そして障害対応までの時間を短縮させるユースケースについて、デモを交えて解説いたします。

イベントページから引用)

登壇者

Datadog Japan 合同会社
Advocacy Team,Senior Developer Advocate
萩野 たいじ

所感

DatadogとPagerDutyの連携から、どのような付加価値が得られるのかをお話しいただきました。これらのサービスを連携することで1つの画面ですべてのデータを閲覧することができ、かつオンコール対応もシームレスに進められるとのことです。また、Slackとの連携なども組み合わせることで、組織内、チーム内にワンクリックで案内をブロードキャストできる機能は小さいながらも魅力的な機能だと感じました。

概要

様々な企業で生成AIを業務効率化で利用していますが、運用保守の領域においても生成AIの活用が進んでいます。本公演では、運用保守の領域における生成AIの利活用の事例と、PagerDutyの活用について発表をさせていただきます。

イベントページから引用)

登壇者

株式会社スリーシェイク
Sreake事業部・事業部長
尾張 厚史

所感

運用保守業務における人材育成の困難さを解消するため、まずは目の前の状況を改善するために自動化、省力化、可視化にアプローチしていくことが重要。その1つのアプローチとして生成AIの活用方法についてお話しいただきました。仕様書の作成や運用レポートの作成、ナレッジの共有など「時間が足りないときにできないこと」から生成AIによるアプローチを試すということで、これは当社開発チームとサポートチームの連携強化、そしてお客様の満足度向上をゴールとして積極的に取り組んでいきたいと思います(ちなみに今は社内ドキュメントの整備と要約のためにRAGを試験運用しています)。

全体の総括

PagerDuty主催のイベントでしたが、ツールの使い方にとどまらず、モニタリングやアラート、それらを通じたSREと顧客体験の改善といった幅広いカテゴリの発表が多かったです。

サービスを運用する開発組織は、不測の事態やイレギュラーに対しても可能な限り事前に対策を講じ、発生した事象に迅速に適応しつつ、経験した事象から学び、再発を防止するサイクルが不可欠です。

今後も当社開発チームにおける監視とアラートへの意識を高め、より良い利用者体験を追求する開発組織であり続けたいと思います。

Faber Company は一緒に働く仲間を募集しています

株式会社Faber Company にご興味のある方は、ぜひ採用サイトをご覧ください!

Faber Company について

「辺境の知から、“マーケティングゼロ”を実現する」をコンセプトに、企業のWebマーケティングを支援。2005年の創業以来、クライアント企業のSEO施策、コンテンツ制作などの事業を展開。2013年からSEOプラットフォーム「ミエルカSEO」の自社開発を開始し、2015年リリース。職人の手元を再現した「ツール」と高度専門人材による「リソース」支援を通じて、企業のマーケティング生産性を向上し、素晴らしい商品・サービスが、それを必要としている人に届く世界を実現する。