この記事では、Python用データ分析モジュール「Pandas」でデータフレームを生成する方法をソースコード付きで解説します。
データフレーム
DataFrameとは各行・列に対してラベルが付いた2次元配列です。
各行・列のラベルにより、データの操作が可能である点が普通の配列と異なる点です。
そのため、データをデータフレームに変換することで統計解析がやりやすくなります。
Pandasでは、DataFrameメソッドを用いることで、データフレームを生成できます。
– | – |
---|---|
書式 | pandas.DataFrame(data) |
返り値 | データフレーム |
ソースコード
サンプルプログラムのソースコードです。
# -*- coding: utf-8 -*- import pandas as pd # データフレームの初期化 df = pd.DataFrame({ 'miho' : [158, 82, 56, 84], 'yukari': [157, 78, 58, 83], 'saori' : [157, 85, 60, 86] }) # 表示 print(df) """ miho saori yukari 0 158 157 157 1 82 85 78 2 56 60 58 3 84 86 83 """
miho,saori,yukariは各列のラベルです。
今回は各行のラベルは設定しなかったため、「0, 1, 2, 3」という行ラベルが自動で付加されています。
【変換】辞書 ⇔ DataFrame
辞書型とDataFrame型の相互変換のサンプルです。

【Pandas入門】使い方とサンプル集
Pythonモジュール「Pandas」でデータ分析する方法についてサンプルコード付きで入門者向けに使い方を解説します。
コメント