【機械学習】時系列データの異常検出手法

機械学習や深層学習を用いた時系列データの異常検出手法についてまとめました。

【時系列データ】異常検出手法

手法 概要
K近傍法 k近傍法とは、学習データをベクトル空間上にプロットし、未知データ(入力データ)と学習データの距離が近い順に任意のK個を取得し、多数決でデータが属するクラスを推定するです。比較的シンプルなアルゴリズムですが、時系列データの異常検知にも活用できます。
Pythonの実装例
特異スペクトル変換法 時系列データの変化点を検出する手法の1つです。
Pythonの実装例
RNN RNN
LSTM Long short-term memoryの略。 RNNを発展させたもので、入力データから、次の時刻の値を予測します。十分なデータセット(異常値を含む)がある場合は、事前に学習した結果(作成した分類器)から予測を行います。十分なデータセットがない場合は、直前まで観測した時系列データから予測された値と現在の値を比較し、違いが大きいほど異常度が高いと判定します。
Autoencoder ニューラルネットワークを用いて次元圧縮を行います。入力データをそのまま出力 (=復元) させるように教師あり学習をす行い、特徴量を取得します。訓練データ、検証データともに正常な時系列データをデータセットとしてAutoencoderで学習し、元の形に近いデータ出力できます。また、この学習モデルに異常な時系列データを入力した場合、異常な時系列データに対する特徴量を学習していないため、出力データは大きく異なります。これを利用し、時系列データのある部分を入力し、それがうまく復元できたかどうかで異常判定を行います。
この記事を書いた人
西住技研

学生時代はシステム制御理論や画像処理、機械学習を専攻分野として研究していました。就職後もプログラミング(Python)を活用したデータ分析や作業自動化に取り組み、現在に至ります。そこで得たノウハウをブログで発信しています。
YoutubeX(旧Twitter)でも情報発信中です

西住技研をフォローする
機械学習画像処理

コメント