【Scikit-learn】ロジスティック回帰の使い方・分類

Python用機械学習ライブラリ「scikit-learn」を用いて、ロジスティック回帰する方法をまとめました。

ロジスティック回帰の使い方

ロジスティック回帰とは、説明変数が定量データ、目的変数が2値(あり、なしなど)をとる多変量解析の1つです。
線形回帰を応用(線形回帰の出力をロジット関数に入力)したもので、2分類問題(2値の目的変数をもつ問題)に対して利用します。
2分類問題数とは、例えば「生存・死亡」や「陽性・陰性」を判別するといったものです。

今回はこれをPython用機械学習ライブラリ「scikit-learn」で実装してみます。

動画解説

サンプルコード(Python3)

サンプルプログラムのソースコードです。


input.csv


test.csv


以下のようなルールのデータです。
x1とx2の和が10以上・・・x3は1
x1とx2の和が10未満・・・x3は0

検証結果は、4つともそのように判別していることがわかります。

【Python/scikit-learn】ロジスティック回帰の使い方(L1・L2正則化で過学習の改善・防止)
Pythonモジュール「scikit-learn」でL1正則化、L2正則化により過学習を改善しながらロジスティック回帰分析する方法についてまとめました。
【Scikit-learn】機械学習入門・使い方・読み方
この記事では、Pythonモジュール「Scikit-learn」で機械学習を行う方法について入門者向けに使い方を解説します。

コメント

タイトルとURLをコピーしました