【k-means法】クラスタリングのアルゴリズム

この記事では、k-means法(k平均法)によるクラスタリングの原理ついて解説します。

k-means法とは

k-means法は非階層的クラスター分析の代表的な手法です。
非階層的クラスター分析では、データを構成している各個体をグループ(クラスタ)に分けることで類似する物同士を分類します。

k-means法のアルゴリズムの流れ

k-means法のアルゴリズムの流れは次の通りです。

①k個の個体を適当に取り出します。
②取り出したk個の点の位置を、k個のグループの中心点とします。(初期化)
③各個体をk個の中心点のうち、最も近い点のグループに割り当てます。(グループ分け)
④各グループに属している個体の位置から重心を計算し、新しい中心点とします。(更新)
⑤手順③④を繰り返します。
 グループへの割り当てが1つ前の割り当てと等しい場合に終了します。
 (グループ分けに変化が生じなくなったら終了)

これにより作成されたk個のグループがクラスタとなります。

【関連記事】
機械学習入門
統計学入門

シェア&フォローお願いします!