2014年5月24日土曜日

標準偏差についての補足

Amato先生への質問で、
SDが大きいだの偏りがでるだのといってた話の補足。

だいたい、電話越しの調査だと、
アンケート的な質問は1から4とか
5までで答えることになる。
1:当てはまらない
2:時々ある
3:よくある
4:いつもある

こうした答えを何問か集計したとして
(あるいは一問しかなかったとして)
母集団の様子をあんまり精密には測定できない。
で、この図みたいなことになる。
もし母集団が赤い線みたいな分布をしていたとして、
この調査でわかってくるのは黒い線のヒストグラム。

この場合、ぜんぜん平気な集団が7割、
けっこう影響をうけているのが3割ということでシミュレーションしてみた。
こっちの集団の平均は25点、標準偏差はどちらのグループも10点で計算している。

この条件で、平均点は10点下がっている(平気な連中の平均はかわってない)。
だけど標準偏差は、10点から17点に上がっている。それだけ、データがばらけるように
なってきているということ。

Amatoさんが、いつも離婚家庭のほうが標準偏差が大きいと言っているのは、
たぶんこの(目立たないけど確実にある)もうひとつの成分、
適応が悪いグループのせいだと思われる。

0 件のコメント:

コメントを投稿