【Python/pydub】mp3、wavのデータをNumPy配列に変換

Pythonモジュール「pydub」でmp3、wavファイルのデータをNumPy配列に変換する方法についてソースコード付きでまとめました。

音声データをNumPy配列に変換

Pythonモジュール「pydub」で読み込んだ音声データをNumPy配列に変換します。

サンプルコード

サンプルプログラムのソースコードです。

# -*- coding: utf-8 -*-
from pydub import AudioSegment
import numpy as np
import matplotlib.pyplot as plt

# 音楽データの読み込み
sound = AudioSegment.from_file("input.mp3", "mp3")

# NumPy配列に返還
data = np.array(sound.get_array_of_samples())

# ステレオ音声から片方を抽出
x = data[::sound.channels]

# グラフ化
plt.plot(x[::10])
plt.grid()
plt.show()

関連記事
1 【Python/pydub】音声ファイル処理Python入門 基本文法
関連記事