度数分布表からPythonで平均値、中央値、標準偏差を推定する方法
データを代表する値として、もっとも使用されるのが「平均値(mean)」です。しかし、平均値がいつも代表値として適しているとは限りません。例えば、外れ値がある場合や分布が非対称なデータでは「中央値(me…
2019/7/29
データを代表する値として、もっとも使用されるのが「平均値(mean)」です。しかし、平均値がいつも代表値として適しているとは限りません。例えば、外れ値がある場合や分布が非対称なデータでは「中央値(me…
2019/7/29
Pythonでデータ分析を行うのに欠かせないのが、NumPy、pandas、Matplotlibの3つのライブラリです。今回はこの3つをpipでインストールする方法を紹介します。 以前は、この3つをW…
2019/7/24
データ分析で最初に行うことは、項目(変数)ごとに平均、標準偏差、ヒストグラムを知ることです。なかでも、ヒストグラムは「値の分布傾向」を視覚的に把握できるので重宝します。 例えば、今まで左右対称な山型の…
2019/6/22