【Pandas】データフレームの作成

この記事では、Python用データ分析モジュール「Pandas」でデータフレームを生成する方法をソースコード付きで解説します。

データフレーム

DataFrameとは各行・列に対してラベルが付いた2次元配列です。
各行・列のラベルにより、データの操作が可能である点が普通の配列と異なる点です。
そのため、データをデータフレームに変換することで統計解析がやりやすくなります。

Pandasでは、DataFrameメソッドを用いることで、データフレームを生成できます。

書式 pandas.DataFrame(data)
返り値 データフレーム

ソースコード

サンプルプログラムのソースコードです。

# -*- coding: utf-8 -*-
import pandas as pd

def main():
    # データフレームの初期化
    df = pd.DataFrame({
        'miho'  : [158, 82, 56, 84],
        'yukari': [157, 78, 58, 83],
        'saori' : [157, 85, 60, 86]
    })
    # 表示
    print(df)

if __name__ == "__main__":
    main()

実行結果

サンプルプログラムの実行結果です。

   miho  saori  yukari
0   158    157     157
1    82     85      78
2    56     60      58
3    84     86      83

miho,saori,yukariは各列のラベルです。
今回は各行のラベルは設定しなかったため、「0, 1, 2, 3」という行ラベルが自動で付加されています。

おすすめ記事
1 【Pandas入門】データ分析のサンプル集
2 Python入門 基本文法
関連記事