黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2022年02月04日(金)
#統計
t検定一般(1群のStudentのt検定、2群の等分散を仮定するがゆえに使うと危なそうなStudentのt検定、2群の等分散を仮定しないWelchのt検定)を「正規分布を仮定するパラメトリック検定」に誤って分類するスタイルがかなり普及しているという問題が結構酷そう。
分岐していたスレッドへ
↓ twitter.com/genkuroki/stat...
タグ: 統計
posted at 00:24:55
#統計 以下のリンク先に追加
あと、各検定法ごとに
* どのようなモデルでどういう仮説をテスト(検定=test)するのか
について、明瞭に説明することも必須だと思います。
例えば、Mann-Whitney検定について「中央値が等しいかどうかの検定」と説明するのは誤り。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 01:40:03
#統計 Brunner-Munzel検定(t分布を使う場合)が
(X<Yとなる確率) + (X=Yとなる確率)/2 = 1/2
という仮説の検定になっており、X軍とY軍の構成員の戦闘力の値を完全に無視する検定になっている点にも注意が必要だと思います。
本当にそういう検定を実行したいのか? twitter.com/genkuroki/stat...
タグ: 統計
posted at 01:45:15
#超算数 算数の小5の教科書は「504÷0.6」のようなわり算の式を書かせようとする教え方になっているので、「これがなんでわり算になるか?」という考え方を子供に押し付けるようになっているのです。
そのような教え方が割合に関する落ちこぼれを生産していることの証拠とみなせる研究もあります。
↓ twitter.com/genkuroki/stat...
タグ: 超算数
posted at 02:31:11
#超算数 このスレッドでも以下のリンク先でも説明されているように、教科書的な「これがなんでわり算になるか?」的な教え方がダメであることを認識していて、まともな教え方をしている小学校の先生達もいる。
過去の伝統に縛られた有害な算数数学教育専門家ではなく、そういう先生達に従えばよい。 twitter.com/yamazaksv2/sta...
タグ: 超算数
posted at 02:54:46
↓長文ですが、「クラシック音楽界」というものがどういうものであるか、全く縁がない人によくわかる文章になっている(全面的に同意するものではない)。特に社会学畑のポピュラー音楽研究者の人にはおすすめ。なぜ「あちらの方々」と話が合わなくなるのか(笑)がよくわかる。こういう世界なんです
タグ:
posted at 03:02:00
いや、話は逆で、政府の失政によって三十年も経済“不成長”が安定的に続くことこそ人類史上極めて稀な出来事なのでは。 twitter.com/____nouryusan/...
タグ:
posted at 05:54:24
@nekoryonya3456 @Tanuk_Ichi 本当にそう思います。
19歳の時に元彼が不全で、本人も私も傷つきました。
まずは生活改善から..で治りましたが、夫が不全で抱いてくれないと悲しむ女性の話も仕事で聞いた事があります。
タグ:
posted at 08:10:30
#統計 自明な誤りの訂正
【中心極限定理より、(n-1)S²/σ²の分布は、平均n-1、分散2(n-1)(1 + κ(n-1)/n) ≈ 2(n-1)(1+κ)の正規分布で近似される。】
❌分散2(n-1)(1 + κ(n-1)/n) ≈ 2(n-1)(1+κ)
⭕️分散2(n-1)(1 + κ(n-1)(2/n)) ≈ 2(n-1)(1+κ/2)
相対誤差は尖度κそのものではなく、その半分。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 09:29:25
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
ただ、別に日本の製薬会社がだめということは全く無く、
第一三共や武田はしっかりと地に足をつけて、正しいプロセスを踏んで治験を行っています。
今回の塩野義や、数日前に非臨床試験のプレスリリースを出した興和が、科学を無視したスタンドプレーで信頼を失っているだけです。 twitter.com/MIKITO_777/sta...
タグ:
posted at 22:39:02
@genkuroki ↑
これ、以前考えようと思ったのですが、サンプルの分布が正規分布でない場合は標本平均と不偏分散が独立でなくなるので、結構複雑な話題みたいです。
標本平均と不偏分散を1サンプルから取得した場合と、それぞれ独立に取得した場合の比較の例(一様分布の場合)を示します
twitter.com/tchaikovsky102...
タグ:
posted at 22:47:46
@tchaikovsky1026 2.0と2.2の違いは大した問題ではないと思いました。
こういう雑な感覚の続き↓
Z=(X̅-μ)/√(σ²/n) とS²=(不偏分散)は独立にはならないのですが、ZがS²の値と無関係に標準正規分布にほぼ従っているくらいnが大きいなら近似的に独立だとみなして良いと思います。
反例の計算があれば教えて下さい。
タグ:
posted at 23:04:08
@tchaikovsky1026 #統計 νが10以上では赤丸と黒丸がほぼ一致していますね。
中心極限定理を使うのでn=ν+1は10以上程度はないとまずそうなので、νが10以上での一致はうれしいニュースだと思いました。 pic.twitter.com/DjeMvmF7TB
タグ: 統計
posted at 23:12:11
@genkuroki 2.0と2.2を同等と見なすなら、正規分布の95%区間である1.96でもいいのでは(つまり、t検定でなくz検定でもいいのでは)とか思っちゃったりもするので、、、
黒丸と赤丸が非常に近いことが、「たまたまそうなる」のか、「他の対称な分布でも同じ傾向」なのかは、興味がありますね。
タグ:
posted at 23:19:22
@tchaikovsky1026 自由度が30程度以上のt分布を使うような段階ではt分布を使う必然性はあまりないと思います。
2群のWelchのt検定の場合(こちらはさらにどんぶり勘定な感じ)のデータから決める自由度の分布はどうなっているんですかね?小さくなる場合が結構ありそう。
タグ:
posted at 23:27:36
@tchaikovsky1026 上の1群のt検定の場合のt分布での補正では、母集団分布の尖度の影響が大きいです。
不偏分散/母分散の分散は母尖度κから2(n-1)(1+(1-1/n)κ/2)と決まるので、母尖度も推定してt分布での補正を改善できないのかなと思いました。しかし、母尖度の推定の誤差が大きく悪影響するとアウト。
タグ:
posted at 23:34:58
@tchaikovsky1026 私の予想は、以下の通りです。
* 標本平均と不偏分散の非独立性の問題は気にしなくてよい。
* 母尖度の不偏分散の分布の分散への影響が大きい。
そして
* 母尖度の不偏分散の分布の分散への影響を補正する実験を誰かやると面白いかもしれない。
と言いました。
色々間違っていたらごめんなさい。
タグ:
posted at 23:40:56
@tchaikovsky1026 #統計 不偏分散の分散が変わると、T統計量の裾の太さも変わります。
1群のStudentのt検定では、自由度n-1のχ²分布で決め打ちしていますが、それを平均がn-1、分散が「(n-1)²S²/σ²の分散の推定量」のガンマ分布で置き換えれば、補正の精度が上がる可能性があると思いました。
間違っていたらごめん。
タグ: 統計
posted at 23:45:49
#統計 誰かやると面白いのではないかと思った実験の中身の詳細は以下の通りです。 twitter.com/genkuroki/stat... pic.twitter.com/cuebDqE6vs
タグ: 統計
posted at 23:48:53
@tchaikovsky1026 黒丸と赤丸が近いのは、標本平均X̅と不偏分散S²が近似的に独立になっているからだと思います。
Z = (X̅ - μ)/√(σ²/n) の分布がS²の値によらずに正規分布でよく近似できているなら(よく出て来るS²の値の違いでZの分布が大きく変わらないなら)、ZとS²は近似的に独立になります。
タグ:
posted at 23:54:36
@tchaikovsky1026 #統計 訂正
「母尖度の不偏分散の分布の分散への影響が大きい」は予想ではなく事実。
予想は、
母尖度の不偏分散の分布の分散への影響が大きいことから来るT統計量の裾の太さの違いも、母尖度の推定で補正できるのではないか?
です。
タグ: 統計
posted at 23:57:54