数量化1類の計算式や目的変数と説明変数についてまとめました。
数量化1類とは
数量化1類とは、一言でいうと説明変数が「定性データ」の場合の重回帰分析です。
「定性データ(質的データ)」とは、「不満・やや不満・普通・やや満足・満足」といったものです。
– | 数量化1類のデータ |
---|---|
目的変数 | 定量データ |
説明変数 | 定性データ(質的データ、カテゴリデータともいう) |
定性データをカテゴリデータに変換
例えば、以下のようなデータが与えられたとします。
満足度 | 性別 | 文理 |
---|---|---|
5 | 男 | 理系 |
3 | 女 | 理系 |
4 | 男 | 文系 |
1 | 女 | 文系 |
2 | 男 | 文系 |
※目的変数・・・満足度
※説明変数・・・性別・文理
次のように説明変数を0以上の整数で数値化します。
説明変数(定性データ) | 説明変数(カテゴリデータ) |
---|---|
性別 | 男:0 女:1 |
文理 | 文系:0 理系:1 |
満足度 | 性別 | 文理 |
---|---|---|
5 | 0 | 1 |
3 | 1 | 1 |
4 | 0 | 0 |
1 | 1 | 0 |
2 | 0 | 0 |
あとはこれで重回帰分析してやるだけです。
– | 重回帰分析の原理はこちら |
---|---|
1 | ■【重回帰分析】原理・計算式・決定係数・例題 |
数量化1類 = 重回帰分析 + ダミー変数
数量化1類は、ダミー変数を導入した重回帰分析と等価になります。
ダミー変数を用いて先程の例を表にすると次のようになります。
満足度 | 男 | 女 | 文系 | 理系 |
---|---|---|---|---|
5 | 1 | 0 | 0 | 1 |
3 | 0 | 1 | 0 | 1 |
4 | 1 | 0 | 1 | 0 |
1 | 0 | 1 | 1 | 0 |
2 | 1 | 0 | 1 | 0 |
※1なら真(YES)、0なら偽(NO)
カテゴリ変数を用いた場合、意図しない意味をデータに与えてしまい、予測がうまくいかないことがあります。
そのため、実際にはダミー変数を用いるのが一般的です。
– | 関連記事 |
---|---|
1 | 【機械学習入門】アルゴリズム&プログラミング |
2 | 【統計学入門】アルゴリズム&プログラミング |
コメント