【k-means法】クラスタリングの原理・計算式

k-means法(k平均法)によるクラスタリングの原理ついて解説します。

【はじめに】k-means法(k平均法)とは

k-means法(k平均法)は非階層的クラスター分析の代表的な手法です。
非階層的クラスター分析では、データを構成している各個体をグループ(クラスタ)に分けることで類似する物同士を分類します。

【処理の流れ】アルゴリズム

k-means法のアルゴリズムの流れは次の通りです。

説明
k個の個体を適当に取り出します。
取り出したk個の点の位置を、k個のグループの中心点とします。(初期化)
各個体をk個の中心点のうち、最も近い点のグループに割り当てます。(グループ分け)
各グループに属している個体の位置から重心を計算し、新しい中心点とします。(更新)
手順③④を繰り返します。グループへの割り当てが1つ前の割り当てと等しい場合に終了します。(グループ分けに変化が生じなくなったら終了)

【実装例】Python

【機械学習入門】アルゴリズム&プログラミング
機械学習のアルゴリズム(原理)やプログラミング方法について入門者向けにまとめました。

コメント