【機械学習】時系列データの異常検出手法

機械学習や深層学習を用いた時系列データの異常検出手法についてまとめました。

【時系列データ】異常検出手法

手法	概要
K近傍法	k近傍法とは、学習データをベクトル空間上にプロットし、未知データ（入力データ）と学習データの距離が近い順に任意のK個を取得し、多数決でデータが属するクラスを推定するです。比較的シンプルなアルゴリズムですが、時系列データの異常検知にも活用できます。 ●Pythonの実装例
特異スペクトル変換法	時系列データの変化点を検出する手法の１つです。 ●Pythonの実装例
RNN	RNN
LSTM	Long short-term memoryの略。 RNNを発展させたもので、入力データから、次の時刻の値を予測します。十分なデータセット（異常値を含む）がある場合は、事前に学習した結果（作成した分類器）から予測を行います。十分なデータセットがない場合は、直前まで観測した時系列データから予測された値と現在の値を比較し、違いが大きいほど異常度が高いと判定します。
Autoencoder	ニューラルネットワークを用いて次元圧縮を行います。入力データをそのまま出力 (=復元) させるように教師あり学習をす行い、特徴量を取得します。訓練データ、検証データともに正常な時系列データをデータセットとしてAutoencoderで学習し、元の形に近いデータ出力できます。また、この学習モデルに異常な時系列データを入力した場合、異常な時系列データに対する特徴量を学習していないため、出力データは大きく異なります。これを利用し、時系列データのある部分を入力し、それがうまく復元できたかどうかで異常判定を行います。