【東芝】インフラ設備等の異常の「見逃し」・「誤検出」の抑制と、高い「説明性」を両立した時系列波形異常検知AIを開発
~高度な説明性を備え、異常検知性能が約7%向上、故障予知や保守業務の効率化に貢献~
当社は、工場などの製造装置やインフラ設備における異常を機械学習により検知・診断する技術において、時系列波形データをベースとした異常の「見逃し」・「誤検出」の抑制と、異常と判断した理由がわかる高い「説明性」を両立させた新たなAI技術「Learning Time-series Shapelets for optimizing Partial AUC(以下、LTSpAUC) 」を開発しました注1。これまで「見逃し」・「誤検出」を抑制した場合、「説明性」の確保が難しいといった課題がありありましたが、今般開発したLTSpAUCでは、現在の最先端技術と比較し、十分な「説明性」を維持しながら異常検知性能を約7%向上することに成功しました。
本技術の論文は、AI・データマイニング分野の難関国際会議SIAM International Conference on Data Mining (SDM2020)での発表論文に採択されました注2。
近年、インダストリアルIoTの普及に伴い、製造装置やインフラ設備に多数のセンサーを取り付け、振動、温度、圧力、電流等大量の時系列波形データを収集し、そのデータを機械学習により分析することで異常の検知や診断を行う機会が増えています。生産性向上や安定稼働のために装置や設備の状態監視は不可欠であり、その市場規模は2024年で約35億ドルと試算されています注3。
製造装置やインフラ設備の状態監視においては、「見逃し」や「誤検出」を低く抑える必要があります。高い安全性が求められる装置や設備においては、機器の故障や不具合の「見逃し」が深刻な事態につながる可能性があります。また、「誤検出」は、不要な修理部品や保守員の手配につながり不要なコストを発生させます。
「見逃し」・「誤検出」の抑制と同時に重要なのが「説明性」です。AIによる異常検知においては、専門家が時系列波形データを確認して原因究明や対策立案を行うのが基本です。そのため、AIの判断結果を専門家が理解しやすい高い説明性が求められます。
このように、AIによる異常検知の性能向上には、「見逃し」・「誤検出」の抑制と、高い「説明性」の両立が強く望まれています。
そこで当社は、時系列データをAIにより正常または異常に分類するクラス分類の手法をもとに、これらを両立する新たな分析技術「LTSpAUC」を開発しました。本技術は、正常または異常といったクラスを自動分類する分類器の学習に加えて、クラス分類に有効な部分波形パターンを同時に学習する手法を採用しています。今回この手法に、新たに「見逃し」または「誤検出」を特定の範囲に抑えた分類性能であるpAUC(partial Area Under the receiver operating characteristic Curve)を最大化する学習を導入しました。例えば、異常発生を避けるために「見逃し」を抑制する場合は、トレードオフの関係にある「誤検出」を許容できる数%以下の範囲に収めた上で、「見逃し」を最大限抑えるために必要な複数の波形パターンを学習します。これにより、従来困難だった「見逃し」または「誤検出」を低く抑える異常検知性能の向上が可能となります。加えて、本手法により、従来手法では、学習できなかった、稀にしか発生しない異常波形パターンであっても、漏れなく学習することが可能となりました。さらには、本技術では異常と正常を分類した部分波形パターンを提示できることから、AIが正常または異常と判断した根拠を波形パターンから確認することが可能です。
公開時系列データセット注4を用いた性能評価では、「見逃し」または「誤検出」を低く抑えた状態で、従来技術注5に比べて異常検知性能を示すpAUCの性能が約7%優れていることを確認しました注6。また、公開時系列データセットに含まれる半導体製造分野のセンサデータや、搬送器のローラーを劣化させる実験で得られたセンサデータに対して、pAUCの性能向上に寄与する部分波形パターンが発見され、高い「説明性」が両立できていることを確認しました。
当社はCPSテクノロジー企業となることを目指しており、これまでも、時系列波形データを活用して、製造現場やインフラ分野に特有の問題を解決する様々なAIの研究開発を推進してきました注7。
当社は今後、装置や設備の異常を精緻に検知・診断する技術として本技術の性能をさらに高め、製造現場やインフラなどの様々な装置や設備への適用を目指し、故障予知や保守業務の効率化につながるAI技術の開発を進めてまいります。
注1 Akihiro Yamaguchi et al., LTSpAUC: Learning Time-series Shapelets for Optimizing Partial AUC, SIAM International Conference on Data Mining (SDM20), pp.1-9, 2020/5. AUCはArea Under the receiver operating characteristic Curveの略。 https://epubs.siam.org/doi/pdf/10.1137/1.9781611976236.1
注2 Society for Industrial and Applied Mathematics (SIAM) International Conference on Data Mining (SDM) https://www.siam.org/conferences/cm/conference/sdm20 本会議での発表に加えて,Big Data special issue of Best of SDM 2020のジャーナルにも招待されています。
注3 http://researchstation.jp/report/MAM/10/Machine_Condition_Monitoring_2024_MAM1010.html
注4 UCR Time Series Classification Archiveの公開データセット等で評価しました。
注5 Cost Sensitive Time-Series Classification(Roychoudhury et al., ECML/PKDD 2017)
注6 統計分野のCritical difference diagramsを用いて、提案手法のpAUCが有意に向上したことを示しました。
注7 https://www.toshiba.co.jp/about/press/2018_12/pr_j1301.htm
https://www.toshiba.co.jp/about/press/2018_12/pr_j1201.htm