メールマガジン・新着情報一覧
- TOP
- メールマガジン・新着情報一覧
- A-0015. 標準偏差をエクセルで計算すると・・・ — TT
2012.06.10
A-0015. 標準偏差をエクセルで計算すると・・・ — TT
◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇ 標準偏差をエクセルで計算すると・・・ 発行:エスオーエル株式会社 https://www.sol-j.co.jp/ 連載「X線CTで高精度寸法測定!?」 2012年6月10日号 VOL.015 平素は格別のお引き立てを賜り、厚く御礼申し上げます。 X線CTスキャンによる精密測定やアプリケーション開発情報などをテーマに、 無料にてメールマガジンを配信いたしております。 ◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇ 測定機を使って測定データを集めた後は、 データを統計的手法によって解析するのが常です。 分布の広がり具合を表す指標として、標準偏差というものがあります。 統計学の教科書を開くと、最初の方に定義が載っていて、データ数がnのとき、 (標準偏差)^2 = Σ( 各データ値 - 平均値 )^2 /n であるとなっています。 そこで、現代にはエクセルという便利なツールがありますから、 この計算をさせてみます。 例として、(123, 124, 126, 128) という4つのデータから、 定義に従って、標準偏差を計算してみます。 結果は、1.920 となります。 しかし、毎回、データの平均値を求めて、各データから引いて、二乗して、 全てを足し上げた後、nで割って、平方根を取るというのは面倒です。 そこで、もっと便利な出し方はないものかと、調べてみると、 エクセルに一発で標準偏差を計算してくれる STDEV という関数があることに 気が付きます。 しめしめと思い、さっきの例で計算してみます。 すると、あれっ?答えが違います。2.217 になってしまいます。 どちらが正しいのでしょうか? 実は、教科書の定義式もエクセルも間違ってはいません。 標準偏差を計算しましたと言っても、冒頭の定義式とエクセルの STDEV は、 少し違うものを計算しています。 コンピュータは言われたとおりの計算をするだけなので、 どちらで計算すべきかは、人間がちゃんと考える必要があります。 エクセルの STDEV は、 (標準偏差)^2 = Σ( 各データ値 - 平均値 )^2 /(n-1) です。n ではなく、n-1 で割っているのがミソです。 与えられたデータが全てで、その標準偏差を計算しなさいと言われた場合、 n で割るのが正しい計算方法です。 一方で、手元のデータが全てではなく、 もっと多くのデータがあるところ(母集団)から無作為に拾ってきた標本 とみなせるとき、 n-1 で割るのが正しい計算方法です。 どうしてこうなるかというと、母集団の分散(標準偏差の二乗)が σ^2 のとき、 標本の分散 s^2 の期待値 E[s^2] を計算すると、 E[s^2] = σ^2 - σ^2 /n と少し小さくなってしまうからです。 この2つが一致すること、つまり無作為標本の標準偏差を計算することで、 母集団の標準偏差を正しく推定できるようにすることのために、 n ではなく n-1 で割って、E[s^2] = σ^2 となるようにしているのです。 ちなみに、エクセルでも n で割る標準偏差を計算する関数があって、 STDEVP です。 ただ、実用的に使う頻度が多いのは、STDEV の方ではないでしょうか。 推定の話は、統計学の教科書のちょっと後ろの方に出てくるので、 標準偏差の定義を n で割るで覚えて、推定の詳細はよく理解していないけど、 エクセルで STDEV を使って、正しい答えを得ている というケースも多いのかもしれません。 普段便利に使っているツールの背後にある原理や理論を少し立ち止まって 見直してみるのも楽しいものです。 -- 高野智暢 ☆TomoScope専門サイトはこちら☆