Uptime Institute の 2022 年版 Outage Analysis 報告書によると、重大な障害の発生原因で最も多いのは電源障害だという
(
プレスリリース、
The Register の記事)。
報告書は複数の調査や Uptime Institute のメンバーおよびパートナーから提供された情報、公表された障害の情報をまとめたものだ。ダウンタイムや経済的損失を引き起こす重大な障害の 43 % が電源に関連する障害だといい、特に UPS の故障が多いそうだ。
その一方で、深刻度にかかわらず IT サービスのダウンタイムを引き起こした障害の原因はネットワークに関連する問題であり、ニュースとして報じられるような一般向けサービスの障害は 70 % がクラウドなど外部の IT プロバイダーに起因する問題だという。また、過去 3 年間に 40 % の組織がヒューマンエラーに起因する大きな障害を経験しているが、その 85 % はスタッフが手順を守らなかったことや手順自体の欠陥が原因とのこと。
過去 3 年間で重大な障害はわずかに増加しており、損害額が 10 万ドルを超える障害の割合は 2019 年の 39 % から 60 % に増加、損害額 100 万ドルを超える障害の割合も同期間で 11 % から 15 % に増加している。復旧までの時間も長くなる傾向がみられ、復旧に 24 時間以上かかった障害の割合は 2017 年の 8 % から 2021 年には 30 % 近くまで増加したとのことだ。スラドの皆さんのところはいかがだろうか。