2014年7月2日水曜日

前回のに反論してみる

ともかくも、ほんとに状況がひどい。そのくらいひどかったら、現場の人は気づかないか?
特に、あのマイナーグループ。4割の二級市民。

特定の測定に関してだけスケーリングを誤った可能性

最初にQQプロットをした段階で、


ああ、傾きがおかしいってことはわかる。ここは傾き1でなけりゃいけない場面。

もともとのデータはすべて論文から拾っている。
まさに拾っていて、ない数値は推定している。
そのどこかで、特定のデータだけ、ぜんぜん間違っていた可能性はないだろうか。
SDの異なるデータをミックスした結果があれなのでは?
たとえば、特定の測定だけ、SDを間違っていたとか。

たとえば4割のデータだけ間違ってなくて、6割がまちがっていたとする。
データを最後に割り忘れるわけだから、位置パラメータが、スケールパラメータと同時にずれる。

chanto <- rnorm(40*2, sd=1, mean=-1.3)
matigai <- rnorm(60*2, sd=1*0.2, mean=-1.3*0.2)
data <- c(chanto, matigai)
qqnorm(data)
abline(0,1)


だめ、似てない。これだと、全てがy=xのラインの下になってしまう。
特定の測定だけスケールし忘れたと考えても説明はつかない。

ふたつの、中心の異なるグループが必要なのだ。

SDを小さく見積もりすぎている可能性

ざっと、もとの論文にでてたSDは0.16とか。しかも正規分布は2つあったから、
それぞれの構成要素は0.12とかそんなもの。

これが小さすぎる推定ではないか?

そりゃないだろう。むしろ、ほんとうはこれもっとシャープだったかもしれない。

本来的には、もし対照区のデータが明らかにされていて、それが単一の山だったら、
それのSDをつかってた。
これは、離婚っていう影響を受けたメジャーグループから推定したSDである。
たぶん彼らは、特定の質問にだけ、コントロールとは違う答えをしている。
もしそうなら、SDはあまりコントロールと変わらないはず、というのが推定。
実際には、そんなことはないだろう。もちっと複雑なはず。
そのぶん、SDは大きくなってるはず。
だからその推定が小さすぎるってことは、たぶん、ない。

もうぜんぶ間違っていた可能性

うーん、、、、
いったいどのデータをつかったのかがわかんないんだ。
こんなの科学的な分野では有り得ねえーーー。

あれか? 文系だからか?
なんで四半世紀ちかく、これ信じられてきたんだ? 

ウォラースタイン博士がのこしたマーガレット・ミードの言葉、
再録します。ミードさんはこういってた。

「ジュディ、人々が共同体からの大きな圧力を受けずに
結婚生活を続けている社会は世界中のどこにもないのよ。
あなたがこれからどんな発見をするか、だれにも予測できないと思うわ」
"Judy, there is no society in the world where people have stayed married
without enormous community pressure to do so.
And I don't think anybody can predict what you will find"

これ、どっちにも意味をとれる。
・社会からの圧力がなくなればみんな離婚するだろう
・そんな圧力のない社会はなかった
ウォラースタインさんは後者としてとっている。
そこには未知なるものへの不安ないし畏敬があったとおもわれる。
ウォラースタイン博士は、離婚の影響をとても大きく考えていた。
彼女は分析を駆使するというよりも、感覚的なタイプだったのではないかと思われる。
面接で、だからn数はあまりとれてなかったはず。

結局しかし、彼女の感覚のほうが正しかったということなのかなあ。。。。

じゃあ、何がおきてたんだ?

・ふたつの分布が混じっていたためのアーティファクト
であってくれれば話は簡単なんだけど、たぶんちがう。
足りない。もっと極端に違わないとダメ。

・ただただ、計算をまちがった
ありえそう。だけど90年っていえばMacだって普及してて、Classicがでたのがこのころ。
Excelくらい使える環境になかったかなあ。。。


あと、あんまり考えたくない可能性がひとつ。 ・

0 件のコメント:

コメントを投稿