【数量化1類とは】目的変数と説明変数

数量化1類の計算式や目的変数と説明変数についてまとめました。

数量化1類とは

数量化1類とは、一言でいうと説明変数が「定性データ」の場合の重回帰分析です。
「定性データ(質的データ)」とは、「不満・やや不満・普通・やや満足・満足」といったものです。

数量化1類のデータ
目的変数 定量データ
説明変数 定性データ(質的データ、カテゴリデータともいう)

定性データをカテゴリデータに変換

例えば、以下のようなデータが与えられたとします。

満足度 性別 文理
5 理系
3 理系
4 文系
1 文系
2 文系

※目的変数・・・満足度
※説明変数・・・性別・文理

次のように説明変数を0以上の整数で数値化します。

説明変数(定性データ) 説明変数(カテゴリデータ)
性別 男:0 女:1
文理 文系:0 理系:1
満足度 性別 文理
5 0 1
3 1 1
4 0 0
1 1 0
2 0 0

あとはこれで重回帰分析してやるだけです。

重回帰分析の原理はこちら
1 【重回帰分析】原理・計算式・決定係数・例題

数量化1類 = 重回帰分析 + ダミー変数

数量化1類は、ダミー変数を導入した重回帰分析と等価になります。
ダミー変数を用いて先程の例を表にすると次のようになります。

満足度 文系 理系
5 1 0 0 1
3 0 1 0 1
4 1 0 1 0
1 0 1 1 0
2 1 0 1 0

※1なら真(YES)、0なら偽(NO)

カテゴリ変数を用いた場合、意図しない意味をデータに与えてしまい、予測がうまくいかないことがあります。
そのため、実際にはダミー変数を用いるのが一般的です。

関連記事
1 【機械学習入門】アルゴリズム&プログラミング
2 【統計学入門】アルゴリズム&プログラミング

コメント