高専のテスト期間はとても忙しいですね。

個人的な話ですが、僕の今回受けたテストがデータサイエンスも数学もたまたま統計とかそんな感じの範囲でした。

そんな中で標準偏差、分散、共分散、相関係数などの求め方が少し難しいなと思ったので、自分なりにまとめた解き方で解説していきたいと思います。

目次

標準偏差とは

標準偏差とは、各データが平均からどれだけ離れているかを表すものです。

値が大きいほどデータの散らばりが大きく、小さいほど平均の近くに集まっています。

テストなどの結果の分析から、機械学習や統計分析まで幅広い用途があります。

標準偏差には母集団の標準偏差標本の標準偏差があり、基本的には標本の標準偏差が使われていると思います。
母集団の標準偏差は、母集団の全体のデータが分かっている場合に使います。
標本の標準偏差は全体の一部のデータが分かっている時に使います。

アンケート調査とかの場合を考えるとわかりますが、全ての人間のデータを取ることは難しいですよね。
したがって、不偏分散による補正を行う標本の標準偏差が使われることが多いのです。

標準偏差の求め方

標準偏差というのは、分散の平方根です。分散を求められる人なら分散にルートをつけるだけで大丈夫ですね。

標準偏差は次の公式によって求めます。母集団と標本で求め方が少し違うのでみてみてください。

下で詳しい手順を解説します。

母集団の標準偏差に関して1からやり方を解説していきます。

  1. データの平均値を求める。
  2. 「データ」ー「1で求めた平均値」を全てのデータで行う。
  3. 2で出た全てのデータを二乗する。
  4. 3で出た値を全て足し合わせる。
  5. それをデータの数で割る。
  6. 最後にルートをつける。

標準偏差はこの手順で求めることができます。

標本の標準偏差の場合、この5番の時にデータの数を-1して割ると標本の標準偏差になります。

標準偏差の求め方は以上です。

ちなみに、Excelで標準偏差を求めたい時は、

母集団の標準偏差:STDEV.P()
標本の標準偏差 :STDEV.S()

で求められます。参考までに!

最後に

この分野は本当に難しい!!

出てくる単語が多いし難しいし大変ですね。

公式を出して箇条書きで手順を説明しただけですが、もし誰かの参考になったのなら嬉しいです。

最後まで読んでいただき、ありがとうございました!