【Scikit-learn】単回帰分析

スポンサーリンク

この記事では、Pythonと機械学習ライブラリ「scikit-learn」を用いて、単回帰分析を行う方法について解説します。

スポンサーリンク

単回帰分析とは

単回帰分析とは、以下のようなモデル(式)を用いて予測する手法です。

【単回帰直線の式】
\begin{eqnarray}
\widehat{y} = a * x + b
\end{eqnarray}

$\widehat{y}$ :目的変数(予測値)
y :目的変数(観測値)
x:説明変数(目的変数と相関のある観測値)
a:相関係数(重み、回帰係数)
b:切片(定数)
相関係数(重み)は、目的変数が説明変数に対してどのくらい影響を及ぼすかを示します。

(詳細)単回帰分析とは(式と意味、相関係数、直線、決定係数、例題など)

PythonモジュールPandasでは、「linear_model.LinearRegression()」を用いることで単回帰分析を行うことができます。
今回は、CSVファイルを読み込んで、そのデータから単回帰分析を行いました。

ソースコード

サンプルプログラムのソースコードは下記の通りです。

【data.csv】

実行結果

サンプルプログラムの実行結果は下記の通りです。

回帰係数: -0.0495480955455
切片: 20.1197546804
決定係数: 0.109433563543

今回はdata.csvのx2を説明変数、x1を目的変数として単回帰分析を行いました。
その結果、x2は以下の式で推測できるようになります。
x2 = -0.0495480955455 * x1 + 20.1197546804

【おすすめ関連記事】
Scikit-learn入門・使い方
Scikit-learnをインストールする方法
Python入門 基本文法

スポンサーリンク

シェア&フォローお願いします!