前回は、さまざまなバラツキを含むデータの多くは正規分布に従うというお話でした。
ものづくりについても、
原材料の性質、気温、測定誤差・・・といったさまざまなバラツキを含みます。
そして、それらの多くは正規分布に従うことがわかっています。
データが正規分布に従うとき、使える統計手法が沢山あります。
正規分布には、とても便利な特徴があるのです。
【その一】2つのパラメータだけで分布が描ける
2つのパラメータとは平均と標準偏差です。
平均は、データを足し合わせて、データ数で割った値。
標準偏差は、データのバラツキの大きさを表します。
正規分布は、平均を中央とした左右対称なベル型を描きます。
平均が同じでも、標準偏差によって分布の形が変化します。
標準偏差が大きいほど分布の裾が広く、平均から離れたところまでデータが分布します。
【その二】ある値がデータ全体の中でどの位置にあるかわかる
上の図は平均0、標準偏差1の正規分布です。
平均から、何標準偏差を離れると、どれくらいのデータが入ってくるでしょうか。
・平均±1標準偏差の間に 68.3%
・平均±2標準偏差の間に 95.4%
・平均±3標準偏差の間に 99.7%
のデータが入ってきます。
これを利用すると、たとえば
平均+2標準偏差より上側(右側)のデータは、分布の右端から約2.3%のところまでに存在することがわかります。
[お知らせ]
Minitab 公式トレーニングページがリニューアル!統計教育にお悩みではありませんか?
統計初心者~業務別のコースをご用意しました。
[統計小話] 偏差値
正規分布の特徴を使ったものとして、身近なところではテストの偏差値があります。
偏差値は平均50、標準偏差10の正規分布を考えています。
偏差値はまさしく全体の中での位置を知るための値・・・
各偏差値以上にはどれくらいの人がいるのでしょうか。
・偏差値60(平均+1標準偏差)以上の人は 16%
・偏差値70(平均+2標準偏差)以上の人は 2.3%
・偏差値80(平均+3標準偏差)以上の人は 0.14%
偏差値の計算方法について知ると、これまた便利で、統計の世界が広がります。
そのお話はまた次回に。
[K. NAGAI]
Commentaires