logo

logo

メールマガジン・新着情報一覧

  1. TOP
  2. メールマガジン・新着情報一覧
  3. A-0015. 標準偏差をエクセルで計算すると・・・ — TT

2012.06.10

A-0015. 標準偏差をエクセルで計算すると・・・ — TT

◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇

標準偏差をエクセルで計算すると・・・

発行:エスオーエル株式会社
https://www.sol-j.co.jp/

連載「X線CTで高精度寸法測定!?」
2012年6月10日号 VOL.015

平素は格別のお引き立てを賜り、厚く御礼申し上げます。
X線CTスキャンによる精密測定やアプリケーション開発情報などをテーマに、
無料にてメールマガジンを配信いたしております。

◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇



測定機を使って測定データを集めた後は、
データを統計的手法によって解析するのが常です。

分布の広がり具合を表す指標として、標準偏差というものがあります。
統計学の教科書を開くと、最初の方に定義が載っていて、データ数がnのとき、

  (標準偏差)^2 = Σ( 各データ値 - 平均値 )^2 /n

であるとなっています。
そこで、現代にはエクセルという便利なツールがありますから、
この計算をさせてみます。

例として、(123, 124, 126, 128) という4つのデータから、
定義に従って、標準偏差を計算してみます。
結果は、1.920 となります。

しかし、毎回、データの平均値を求めて、各データから引いて、二乗して、
全てを足し上げた後、nで割って、平方根を取るというのは面倒です。

そこで、もっと便利な出し方はないものかと、調べてみると、
エクセルに一発で標準偏差を計算してくれる STDEV という関数があることに
気が付きます。

しめしめと思い、さっきの例で計算してみます。
すると、あれっ?答えが違います。2.217 になってしまいます。

どちらが正しいのでしょうか?

実は、教科書の定義式もエクセルも間違ってはいません。
標準偏差を計算しましたと言っても、冒頭の定義式とエクセルの STDEV は、
少し違うものを計算しています。
コンピュータは言われたとおりの計算をするだけなので、
どちらで計算すべきかは、人間がちゃんと考える必要があります。

エクセルの STDEV は、

  (標準偏差)^2 = Σ( 各データ値 - 平均値 )^2 /(n-1)

です。n ではなく、n-1 で割っているのがミソです。

与えられたデータが全てで、その標準偏差を計算しなさいと言われた場合、
n で割るのが正しい計算方法です。

一方で、手元のデータが全てではなく、
もっと多くのデータがあるところ(母集団)から無作為に拾ってきた標本
とみなせるとき、
n-1 で割るのが正しい計算方法です。

どうしてこうなるかというと、母集団の分散(標準偏差の二乗)が σ^2 のとき、
標本の分散 s^2 の期待値 E[s^2] を計算すると、

  E[s^2] = σ^2 - σ^2 /n

と少し小さくなってしまうからです。
この2つが一致すること、つまり無作為標本の標準偏差を計算することで、
母集団の標準偏差を正しく推定できるようにすることのために、
n ではなく n-1 で割って、E[s^2] = σ^2 となるようにしているのです。

ちなみに、エクセルでも n で割る標準偏差を計算する関数があって、
STDEVP です。
ただ、実用的に使う頻度が多いのは、STDEV の方ではないでしょうか。
推定の話は、統計学の教科書のちょっと後ろの方に出てくるので、
標準偏差の定義を n で割るで覚えて、推定の詳細はよく理解していないけど、
エクセルで STDEV を使って、正しい答えを得ている
というケースも多いのかもしれません。

普段便利に使っているツールの背後にある原理や理論を少し立ち止まって
見直してみるのも楽しいものです。


--
高野智暢


☆TomoScope専門サイトはこちら☆

一覧に戻る

お問い合わせ Contact

048-441-1133

お問合せフォーム