NumPy / pandas 2015/06/27
NumPyは行列などの数値計算を高速に行うためのPythonのライブラリ。
ndarray
というNumPyの多次元配列は、ベクトル計算やブロードキャストを高速に処理できるようC言語で実装された多次元配列で、
Pythonの組み込みの配列とは実装が異なる。行列計算や統計処理など豊富な関数が用意されており、Pythonのループよりも配列を高速に処理できるようになっている。
ndarray
がNumPyの目玉の1つ。
Pythonの組み込みの配列では2次元配列を表現しようと思うと配列の配列になるが、
ndarray
は多次元配列であり、次元ごとに要素数は統一されている必要がある。また、ndarray
は要素数が固定で原則として変更することができない固定長配列である。
pandasというライブラリは、NumPyがベースになっており、データ分析を簡単に行うためのツールが揃っている。
pandasではSeries
とDataFrame
という2つのデータ構造が提供されている。
Series
は1次元配列に似ている。インデックスは0
から始まる整数だけでなく、任意の文字列にもできるのでPythonのディクショナリ
(他の言語でいうと連想配列とかハッシュマップとか)にも似ているが、
Series
はPythoのリストと同様に順序を保存する点がディクショナリとは異なる。
目次
- インストール
- NumPy配列ndarrayの生成
- 特殊なNumPy配列の生成方法
- NumPy配列の属性
- NumPy配列の要素のデータ型
- NumPy配列のコピー
- NumPy配列の要素のデータ型の変換
- NumPy配列でのベクトル計算
- NumPy配列のインデックスでの要素参照と代入
- NumPy配列のファンシーインデックス参照と代入
- NumPy配列のブールインデックス参照
- NumPy配列のスライス表記の参照と代入
- NumPy配列のインデックス・ファンシーインデックス・スライシングの組み合わせ
- NumPy配列を対象としたユニバーサル関数
- NumPy配列での三項演算子ベクトル計算版
- NumPy配列の集計処理(合計/平均とか)
- NumPy配列の最大値/最小値に関する関数
- NumPy配列のファイル読み書き
- pandasのSeriesの概要と生成方法
- pandasのSeriesのインデックスでの要素参照と代入
- pandasのSeriesのファンシーインデックスで参照と代入
- pandasのSeriesのブールインデックス参照
- pandasのDataFrameの概要と生成方法
- pandasのDataFrameのインデックスでの要素参照と代入
- NumPy/pandasのDataFrameでの転置行列
- HOWTO