2014年7月3日木曜日

もう一回反論をこころみる

ぜんぶ間違ってたんじゃ?


標準化に失敗している以上、寄せ集めたデータはクズ。
いやこれがいちばんラクな態度ではある。そこから考えないで済む。


もし個々の標準化が失敗していたとして、考えられる理由は、標準偏差の算出の失敗。
まさか、コントロールとの差を引くところでまちがえるほど馬鹿じゃないだろう。

その場合、いろんな調査結果が、まちまちな標準偏差をもってでてくることになる。
ならば、異なる調査結果を合算したデータは、おそらく異なる分布をもつことになる。

。。。ならないんだなこれが。フィッティングしてみたときに、結局おなじくらいの
パラメータになることは気付いていた。

でも、もっとダイレクトに分布形式を調べる方法がある。それがQQplotというもので、
要は、上から何%のデータ同士をくらべるものだ。



これは、大人のデータで、
離婚前の家族の性質を考慮してある調査(with control)
とそうでない調査(without control)のデータの分布を比較したもの。
要は、調査そのものがちがってるわけ。

なのに、こんなにまっすぐ。まあちょっとした乱れはあるものの。

ちなみに、その片方を正規分布の理論値にしたものがnormal probability plotである。
あれ曲がってたでしょ。





たぶん、標準偏差を、ぜんぶの過程で算出を間違ってたか、
最後に出すときにへんなものを掛けたか、したのではなかろうか。
間違い方がわりと一定である印象を与える。

0 件のコメント:

コメントを投稿