【Scikit-learn】単回帰モデルのファイルを読み込む(インポート)

この記事では、Pythonと機械学習ライブラリ「scikit-learn」を用いて、単回帰分析した結果を出力(エクスポート・ダンプ)する方法について解説します。

## 単回帰分析とは

単回帰分析とは、以下のようなモデル(式)を用いて予測する手法です。

単回帰直線の式

(1)   \begin{eqnarray*} \widehat{y} = a * x + b \end{eqnarray*}

変数 説明
\widehat{y} 目的変数(予測値)
y 目的変数(観測値)
x 説明変数(目的変数と相関のある観測値)
a 相関係数(重み、回帰係数)
b 切片(定数)

相関係数(重み)は、目的変数が説明変数に対してどのくらい影響を及ぼすかを示します。

(詳細)単回帰分析とは(式と意味、相関係数、直線、決定係数、例題など)

Scikit-learnでは、「linear_model.LinearRegression()」を用いることで単回帰分析を行うことができます。
今回は、CSVファイルを読み込んで、そのデータから単回帰分析を行い、生成して出力した回帰モデルを復元(インポート)しました。
(sklearn.externals.joblib.loadを使います)

## ソースコード

サンプルプログラムのソースコードは下記の通りです。

# -*- coding: utf-8 -*-
import pandas as pd
import numpy as np
from sklearn import linear_model
from sklearn.externals import joblib

clf = joblib.load('clf.learn')
# 回帰係数と切片の抽出
[a] = clf.coef_
b = clf.intercept_
# 回帰係数
print("回帰係数:", a) # 回帰係数: -0.0495480955455
pprint("切片:", b)  # 切片: 20.1197546804

【data.csv】


【学習ファイル】
single.learn

【おすすめ関連記事】
Scikit-learn入門・使い方
Scikit-learnをインストールする方法
Python入門 基本文法

コメント