実際のデータとは違いますが、わかりやすくするために次のようなデータを
用いることにします。
●100個の値があり、1個だけ「1」で残り99個が「0」
このデータの平均値:X=1/100=0.01
平均偏差→(∑|x-X|)/100=(0.01×99+0.99×1)/100=0.0198
標準偏差→√({∑[x-X]^2}/100)=√({0.01^2×99+0.99^2×1}/100)≒
0.0995
となってほぼ1ケタ違います。同じ標本の散布度としてこんなに違っていても
いいものなのかと思いました。平均偏差より標準偏差の値の方が大きくなること
は
理論的に正しいことのようですが、それにしても1ケタも違っていてはどちらを
散布度として使えば良いのか迷ってしまいます。よろしくご教示ください。
いなだ
統計のことは良く知りませんが,
In article <abcml9$f...@news.nc.u-tokyo.ac.jp>
Yoshinobu Inada <in...@kawachi.rcast.u-tokyo.ac.jp> writes:
> 平均偏差より標準偏差の値の方が大きくなることは理論的に正しい
> ことのようですが、
Cauchy-Schwarz の不等式で, N 個のデータについては
Σ|x - X| ≦ (√N)(√(Σ(x - X)^2))
(等号は |x - X| が一定のとき) となりますから,
(Σ|x - X|)/N ≦ √((Σ(x - X)^2)/N)
ですね.
> それにしても1ケタも違っていては
違う統計量ですから, 値が離れる場合があっても不思議ではないでしょう.
> どちらを散布度として使えば良いのか迷ってしまいます。
目的によるのでしょう.
# 数学の方から言えば, 普通は標準偏差だろうと思いますが.
--
塚本千秋@応用数学.高分子学科.繊維学部.京都工芸繊維大学
Tsukamoto, C. : chi...@ipc.kit.ac.jp