【機械学習】時系列データの異常検出手法

機械学習や深層学習を用いた時系列データの異常検出手法についてまとめました。

スポンサーリンク

【時系列データ】異常検出手法

手法 概要
K近傍法 k近傍法とは、学習データをベクトル空間上にプロットし、未知データ(入力データ)と学習データの距離が近い順に任意のK個を取得し、多数決でデータが属するクラスを推定するです。比較的シンプルなアルゴリズムですが、時系列データの異常検知にも活用できます。
Pythonの実装例
特異スペクトル変換法 時系列データの変化点を検出する手法の1つです。
Pythonの実装例
RNN RNN
LSTM Long short-term memoryの略。 RNNを発展させたもので、入力データから、次の時刻の値を予測します。十分なデータセット(異常値を含む)がある場合は、事前に学習した結果(作成した分類器)から予測を行います。十分なデータセットがない場合は、直前まで観測した時系列データから予測された値と現在の値を比較し、違いが大きいほど異常度が高いと判定します。
Autoencoder ニューラルネットワークを用いて次元圧縮を行います。入力データをそのまま出力 (=復元) させるように教師あり学習をす行い、特徴量を取得します。訓練データ、検証データともに正常な時系列データをデータセットとしてAutoencoderで学習し、元の形に近いデータ出力できます。また、この学習モデルに異常な時系列データを入力した場合、異常な時系列データに対する特徴量を学習していないため、出力データは大きく異なります。これを利用し、時系列データのある部分を入力し、それがうまく復元できたかどうかで異常判定を行います。

コメント