【Pandas】データフレームの読み込み(CSVファイル形式)

この記事では、Python用データ分析モジュール「Pandas」でデータフレームをCSVファイル形式で読み込む方法をソースコード付きで解説します。

データフレームの読込(CSVファイル形式)

Pandasでは、read_csvメソッドを用いることで、データフレームをCSVファイル形式で読み込むことができます。

【書式】
pandas.read_csv(filepath_or_buffer, sep=’, ‘, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression=’infer’, thousands=None, decimal=’.’, ineterminator=None, quotechar='”‘, quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=False, error_bad_lines=True, warn_bad_lines=True, skip_footer=0, doublequote=True, delim_whitespace=False, as_recarray=False, compact_ints=False, use_unsigned=False, low_memory=True, buffer_lines=None, memory_map=False, float_precision=None)

【ドキュメント】http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

引数 内容
filepath_or_buffer 読み込むCSVファイルのパス
sep 区切り文字
delimiter sep の代わりに区切り文字を指定
header ラベル(ヘッダ行)の行数
names ヘッダ行をリストで指定
index_col インデックスとして扱う列番号
dtype 各行のデータタイプ
skiprows 先頭から読み込みをスキップする行数
skipfooter 末尾から読み込みをスキップする行数
nrows 読み込む行数
quotechar ダブルクォーテーションなどでクオートされている場合のクオート文字
escapechar エスケープされている場合のエスケープ文字
comment コメント行の行頭文字を指定(指定した文字で始まる行は無視)
index 行名も保存するか否か
encoding 文字コード(’utf-8′, ‘shift_jis’, ‘euc_jp)

ソースコード

サンプルプログラムのソースコードは下記の通りです。

【anko.csv】

実行結果

サンプルプログラムの実行結果は下記の通りです。

名前 身長
車長 西住みほ 158
装填手 秋山優花里 157
通信手 武部沙織 157
砲手 五十鈴華 163
操縦手 冷泉麻子 145

引数でインデックスの列番号を0に指定(index_col=0)しているため、1列目のデータをインデックスとして読み込んでいます。

【おすすめ記事】
【Pandas入門】データ分析のサンプル集
Python入門 基本文法

シェア&フォローお願いします!