プログラミングと絵と音楽

コンピューター科学を専攻し、絵と音楽を趣味とするエンジニアのブログです。

統計学とプログラミング:1次元データの可視化

ヒストグラムを作成します。

環境

ヒストグラムの作成

ヒストグラム(棒グラフ)を作成します。

まず、必要なライブラリを読み込みます。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

scikit learn にサンプルデータがあるので、それを使います。今回はwineのデータを読み込みます。

from sklearn.datasets import load_wine
wine = load_wine()

pandasのDataFrameに変換します。

wine_df = pd.DataFrame(wine.data, columns=wine.feature_names)

中味を見てみます。

wine_df.head()

alcoholというカラムがアルコール度数のことでしょう。これをヒストグラムで表示します。

rwidthを1から減らして、棒グラフに隙間ができるようにして表示しました。

plt.hist(wine_df["alcohol"], rwidth=0.9)

f:id:tfull:20190424122122p:plain
wine - alcohol