PagerDuty、システム障害による損害リスクと対応実態の調査結果を発表
~ インシデント対応自動化の遅れで52億円にのぼる年間累積コスト発生~
重大障害は過去12ヶ月で 37%増、解決までに6時間12分
本年7月19日(金)に発生したセキュリティソフト更新が引き金となった世界規模のインシデントを発端に、インシデント対応は経営課題として取り組む必要性があることが改めて認識されました。インシデント対応は『もし発生したら』ではなく『いつ発生するか』という問題であり、積極的な投資が求められる経営課題ですが、「システム障害対応ツールに十分な投資をしている」という回答は、グローバル(46%)に対し日本(12%)と約1/4であったことから、国内企業はインシデント管理および対応への投資意欲が低いことが顕在化しました。このような投資不足により、国内1企業あたりの累積コストは年間52億円にのぼることも明らかになりました。これは、グローバルの結果(28億円)に対し、約2倍にあたります。
過去12ヶ月で重大インシデントは37%増加
インシデントは急速に日常化しています。ITリーダーの約6割が重大なインシデントを経験しており、重大インシデントは過去12カ月で平均37%増加していることがわかりました。こうしたインシデントの背景には、ITインフラが複雑化し、デジタルサービスが急速に拡大する一方で、ITインフラ投資の不足が挙げられます。
迅速な修復ができないことで増大する被害コスト
日本のITリーダーは、インシデントに起因するシステムダウンタイムのコストを1分あたり74万円、1時間換算だと4,440万円と見積もっています。一方、障害の発生から解決までに要した平均的な対応時間(平均修復時間/MTTR)は6時間12分(372分)もかかっていることがわかりました。日本企業は過去12ヶ月間に平均19件の重大インシデントを経験していることを考慮すると、サービス停止など重大なインシデントが発生した際の累積コストは1企業あたり年間52億円にのぼると推定されます。特に、平均修復時間/MTTRはグローバルのそれと比較した場合、2倍以上の時間を要することがわかりました。
グローバルと比較し「インシデント対応は経営課題」との認識が薄い日本:急がれるインシデント対応への投資
日本における平均修復時間/MTTR(372分)、グローバル(175分)という結果から、日本は2倍以上の時間を要しています。これにより日本における重大インシデント発生時の累積コスト(年間)で52億円、グローバルでは28億円という大きな違いがでています。平均修復時間/MTTRから起因する被害コストの違いの大きな要因として、日本企業はグローバルと比較して、システム障害対応に十分な投資をしていないことが挙げられます。これには、インシデント対応の多くのタスクが自動化されておらず、マニュアル対応していることも含まれます。
グローバルでシステム障害対応ツールに十分な投資をしていると回答したITリーダーは46%いるのに対し、日本では12%でした。また、エンドツーエンドのシステム障害対応の自動化を進めていると回答した割合はグローバルで38%、日本では10%と、日本企業はインシデント対応に十分な投資をしておらず、結果として、グローバルの被害コスト平均よりも2倍近い被害コストが発生しています。
「システム障害対応ツールに十分な投資をしている」
「エンドツーエンドのシステム障害対応の自動化を進めている」
さらに、具体的なインシデント対応の様々なタスクを自動化または手動で行っているのかという問いでは、多くのタスクは未だ手動対応をしていることが判明しました。これらの作業は、インシデント対応ツールによって自動化が可能であり、大幅な効率化を実現できます。
「マニュアルで行っているインシデント対応作業」
一般的に、日本企業は海外の企業と比べてIT運用やソフトウェア開発をアウトソースする比率が高いと言われています。本調査においても、日本企業においてすべてのIT運用を自社で行っていると回答している企業は11%だけでした。これらから推測できる点として、インシデント対応は業務委託先の責任であり、インシデント発生が自社ビジネスにどのような影響を受けるかについて「自分ごと」として捉えておらず、インシデント対応への投資の優先順位が低くなっていることが垣間見えます。
インシデント発生による社員の疲弊に加え、イノベーションの停滞を懸念する上級管理職
既存顧客から見放されずに、事業を継続・成長させるためには、自社におけるイノベーションの創出が必要です。インシデントがビジネスに与えた影響に関する問では、ITリーダー全体では「システム障害に対応する社員の疲弊」を第一に挙げ、次いで企業が受ける「顧客損失や収益損失」「ブランドイメージの低下」がありました。一方で、ITリーダーを『部長職以上の経営層/上層管理職』と、『中間管理職/中堅層』に分けて同様の質問をしたところ、経営層/上層管理職は「イノベーションの停滞」も懸念点の上位にあることがわかりました。両者ともに「社員の疲弊」を最大の懸念としていますが、経営層は長期的な視点から「イノベーションの停滞」を危惧していることが明らかになりました。
「インシデントがビジネスに与えた影響」
インシデントは顧客からの信頼喪失を引き起こし、顧客損失や収益損失など、経営そのものに直結する課題として、その深刻度は今後さらに増していくと考えられます。それ故に、重大インシデントが発生した場合、修復対応と同時に、経営層は迅速な事実把握と情報開示を求められます。しかし、このたびの調査結果では、消極的なツールへの投資と手動対応が主流であるため、改善が困難な状況であると言えます。
【インシデント管理および対応として検討すべき具体策】
- 経営課題として認識を:インシデント対応を経営課題として認識し、適切な投資の検討と実施を行う。
- ITインフラのモダナイゼーション:単にインフラの近代化を進めるだけでは複雑性が増すだけとなるため、自社の環境に適した運用プロセスを定め、可視化・省力化を並行して進める。
- 自動化・標準化の推進:すべてのタスクを一度に自動化するのは現実的ではないため、自動化するタスクの優先順位をつけながら自動化や標準化を進める。
- 人材育成と体制強化:最新のAIツールを含む、容易に導入できる自動化ツールを活用し効率化を図りつつ、システム運用に携わる人材育成と体制強化を推進する。
- 経営層と現場の連携強化:システム障害がもたらす影響に対する認識を横断して共有できる仕組みのもと、一体となってインシデント対策に取り組む。
PagerDuty社について
PagerDuty, Inc. (NYSE:PD)は、デジタルオペレーション管理のグローバルリーダーとして、PagerDuty Operations Cloudを通して大規模なIT運用業務の効率化を支援しています。
PagerDuty Operations Cloudは、インシデント管理、AIOps、自動化、カスタマーサービスオペレーション、AI機能の技術基盤であるPagerDuty Copilotを統合した、柔軟で拡張性のあるプラットフォームです。Operations Cloudを採用することで、企業は運用障害のリスクやコストを軽減し、イノベーションの速度を高めることで収益を拡大できます。Fortune500の半数以上、Fortune100の70%近くがPagerDutyを現代の企業に不可欠なインフラストラクチャーとして利用しています。日本における顧客事例はこちら(https://www.pagerduty.co.jp/customers/)をご覧ください。
PagerDutyの日本語ウェブ、SNSはこちらをご覧ください。
https://www.pagerduty.co.jp/
https://www.pagerduty.co.jp/topics/
https://www.pagerduty.co.jp/careers/
https://www.facebook.com/pagerduty.japan/
https://www.linkedin.com/company/pagerduty-japan/
https://x.com/PagerDuty_Japan