アラートの集約・精査により月間発報件数を約10分の1に大幅削減し、オンコールを自動化することで手順書ベースの対応を廃止
デジタルオペレーションマネジメントで業界をリードするPagerDuty株式会社(ページャーデューティー、東京都港区、代表取締役社長 山根 伸行、以下 PagerDuty)は、本日、株式会社NTTドコモ(本社:東京都千代田区、代表取締役社長:井伊 基之、以下NTTドコモ)のPagerDuty活用事例を公開しました。
■事例PDF:
https://www.pagerduty.co.jp/customers/docomo/
■事例動画:
https://www.pagerduty.co.jp/customers/docomo-video/
株式会社NTTドコモ
プロダクトデザイン部 ライフスタイルイノベーション・ヘルスケア担当 宮川 倫氏(写真右)
サービスデザイン部 クラウド推進担当 大石 悠起子氏(写真左)
■PagerDutyの導入理由
通信事業を土台として、消費者の多様なニーズに応えるべく積極的な事業拡大を推進するNTTドコモでは、デバイスのお試しサービス「kikito(キキト)」や、サービス開発の効率化を目的とした統合API基盤「RAFTEL(ラフテル)」などのインシデント管理にPagerDutyを採用しています。PagerDutyの導入以前は、複数の監視ツールから月間約10,000件に上るアラートが発報され、優先対応すべきアラートの特定から一次対応までに一定の時間を要していました。また、アラートの設定変更は各ツールごとに行う必要があり、システム開発委託先への設定変更依頼から、NOC(Network Operations Center)に提示する作業手順書の作成・更新まで、関係各所との調整に時間がかかり、スピード感のあるインシデント対応が困難な状況でした。PagerDutyでは、アラートを集約し、自動で優先順位を付け、緊急度に応じて所定の開発担当者に最適な手法で通知することが可能なため、一次対応を効率化することが可能です。また、直感的でわかりやすい操作性の高さから、約9割の設定作業はNTTドコモのチームで実施することが可能となり、アラートの発生状況についてチーム内で共通認識を持てるようになったことも高く評価されています。
■導入効果 (詳細は事例コンテンツをご覧ください)
- インシデントのMTTA(平均確認時間)/ MTTR(平均復旧時間)を大幅短縮
- 開発・運用チームに加えビジネスチームともアラート発生状況を迅速に共有し対応
- アラート件数の減少
- 学習コストの削減
■今後の展望
重要インシデントに紐づくアラートを見逃すことが無いよう、アラート集約・精査の品質向上に引き続き注力するとともに、PagerDutyの導入範囲をNTTドコモ内で拡げていくことで、連携システム間でインシデント状況を一元管理し、自動化していけるような運用環境の整備を目指しています。運用担当者一人一人の生産性向上により、サービス機能の改善・追加といった本来業務のリソース確保に向けて、運用業務の効率化を継続的に推進していきます。
■事例PDF:
https://www.pagerduty.co.jp/customers/docomo/
■事例動画:
https://www.pagerduty.co.jp/customers/docomo-video/