【k-means法】クラスタリングの原理・計算式

この記事では、k-means法(k平均法)によるクラスタリングの原理ついて解説します。

k-means法(k平均法)とは

k-means法(k平均法)は非階層的クラスター分析の代表的な手法です。
非階層的クラスター分析では、データを構成している各個体をグループ(クラスタ)に分けることで類似する物同士を分類します。

アルゴリズム

k-means法のアルゴリズムの流れは次の通りです。

説明
k個の個体を適当に取り出します。
取り出したk個の点の位置を、k個のグループの中心点とします。(初期化)
各個体をk個の中心点のうち、最も近い点のグループに割り当てます。(グループ分け)
各グループに属している個体の位置から重心を計算し、新しい中心点とします。(更新)
手順③④を繰り返します。グループへの割り当てが1つ前の割り当てと等しい場合に終了します。(グループ分けに変化が生じなくなったら終了)

これにより作成されたk個のグループがクラスタとなります。

関連記事
1 【機械学習入門】アルゴリズム&プログラミング
2 【統計学入門】アルゴリズム&プログラミング

シェア&フォローお願いします!