黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2022年04月28日(木)
#統計 これ、全くその通りで、竹村さんの超有名な教科書に限らず「数理統計」と題された教科書には書いてあることなのに、学部生向けの教科書を見ると、P値や検定と全く無関係であるかのような信頼区間の解説が載っている。信頼区間の解釈で悩む人が多いことの主原因の1つかもしれないと思います。 twitter.com/umaruyama/stat...
タグ: 統計
posted at 04:18:40
#統計 以前は私も以下のリンク先で紹介されているように、サンプルを大量発生させて、信頼区間をサンプルを生成した分布のパラメータ値が含まれる確率=割合を計算したり、沢山の信頼区間を同時プロットして見せることには、何の批判もなかったのですが、現在では少し注意を要すると思っています。続く twitter.com/umaruyama/stat...
タグ: 統計
posted at 04:26:05
#統計 一方、以下のリンク先のリンク先資料にもある正規分布モデルを使った分散の区間推定は、現実の母集団分布が正規分布から離れていると全く信用できないものになります。
学部生向けの教科書では同列に並べられている平均と分散の信頼区間では頑健さが全く違う。 twitter.com/umaruyama/stat...
タグ: 統計
posted at 05:21:04
#統計 私がプロットしたP値函数のグラフの例 twitter.com/genkuroki/stat... pic.twitter.com/cHTYVI0VNT
タグ: 統計
posted at 05:59:03
#統計 余談
添付画像①は論文 www.nejm.org/doi/full/10.10... での事後分布のプロット(添付画像②)の私による再現。
github.com/genkuroki/publ...
私の再現の側では右側のグラフの線が原論文の図よりもなめらかになっています。モンテカルロ法をやめて数値積分で処理した。こういう遊びをたまにやっている。 twitter.com/genkuroki/stat... pic.twitter.com/t4VBwZsh7n
タグ: 統計
posted at 06:16:33
#統計 原論文ではベイズ統計での事後分布をプロットしていて(添付画像②)、私は対応する場合の通常の信頼区間を与えるP値函数もプロットしてみました(添付画像①)。
これらを比較すれば、P値函数と事後分布がほぼ同じような情報を持っていることが分かります。 pic.twitter.com/3F5TSQB2T8
タグ: 統計
posted at 06:19:43
#統計 通常の検定では、統計モデルのパラメータについてθ=0やθ=1のような単独の仮説を扱いますが、信頼区間の場合にはθ=θ₀型のすべての仮説すべてについて一挙に検定行い、棄却されなかったθ₀全体の集合を信頼区間と呼んでいる。
信頼区間の解釈は検定での「棄却されない」の解釈に帰着します。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 07:38:38
HAYASHI Tomohiro @SokoranoKumasan
ありがとうございます。マスメディアも「風評被害が問題だ」といいつつ、自分達が積極的に風評を解消しようとはしていない。
むしろ過去の公害病被害者団体を持ち出したり、偏った意見の住民や団体ばかり取材してきた。
書籍ではこうした欺瞞に対し、ファクトを突きつけて告発しなければと考えました twitter.com/Led_OriduruP/s...
タグ:
posted at 07:59:29
記事自体は他愛もない内容だが、冒頭部分から、筆者は、ハジキで教わり、それが世間一般でも当たり前のもの、と思っていることが分かり興味深い
母驚愕! 小学生姉妹の通学時間がリアル“算数の問題”状態に 「あれが現実になるとは…」(Hint-Pot)
#Yahooニュース
news.yahoo.co.jp/articles/5f63c...
タグ: Yahooニュース
posted at 08:16:54
そのタイトルは教師が自分の無脳さを吐露してるだけ。
>「教師は模範解答だけ見て合ってるかどうかで採点してるんだから。」 togetter.com/li/1878862#c10...
「「教師は模範解答だけ見て合ってるかどうかで採点してるんだから。」」togetter.com/li/1878862 にコメントしました。
タグ:
posted at 10:21:40
@0kkus0 #統計 いいえ。何を言っているか理解できないのですが、原理的に「いいえ」です。
同一の統計モデルと同一の仮説θ=θ₀について、検定法と信頼区間の構成法はただ一つではなく、沢山あります。
検定での棄却領域を与えることと、すべての信頼区間を与えることが、自明に一対一対応しています。続く twitter.com/genkuroki/stat...
タグ: 統計
posted at 15:43:55
@0kkus0 #統計 検定と信頼区間が自明に表裏一体であることに関する有名教科書群での解説については以下のリンク先の引用を見て下さい。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 15:45:22
@0kkus0 #統計 任意に95%信頼区間の計算法が与えられたとき、検定法を「パラメータ値θ₀が信頼区間に含まれていなければ仮説θ=θ₀を棄却し、そうでなければ棄却しない」で定めることができます。
逆向きも可能。
こうなっているので、検定法と信頼区間は完全に同じだと自明に言えてしまいます。 twitter.com/genkuroki/stat... pic.twitter.com/iEG91ww0Q6
タグ: 統計
posted at 15:57:32
#統計 分岐
検定と信頼区間が表裏一体で実は完全に同じものだということについて納得できていない場合には、以下のリンク先スレッドのリンク先を見て下さい。
おっそろしく自明な話です。
鉄板で自明な話なのに、どうして入門的教科書に書かれていないかが不思議なくらいです。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 16:02:23
#統計 どうも、検定法と信頼区間の表裏一体性を無視するという慣習が昔からあるようで、例えば、#R言語 のfisher.testが表示するP値と信頼区間は対応していない組み合わせになっていて、不整合です。その問題を解決するためにexact2x2パッケージが開発された。詳しくは→ academic.oup.com/biostatistics/...
posted at 16:12:31
@genkuroki ご返事ありがとうございます。説明不足申し訳ありません。お聞きしたかったのは以下のリンクにある母比率の推定・検定の場合のことです。sphweb.bumc.bu.edu/otlt/mph-modul...
ただご指摘の通り、一つの検定法と一つの信頼区間の構成法を比較していたのが誤りだということが分かりました。もっと勉強します。
タグ:
posted at 16:15:24
#統計 #R言語 のbinom.testが表示するP値と信頼区間の組み合わせも不整合です。検定法と信頼区間の表裏一体性をこの手の超有名な基本統計ソフトも無視していたりする。
binom.testのその問題はexactciパッケージのbinom.exactを使えば解決します。 twitter.com/genkuroki/stat...
posted at 16:16:39
信頼区間の話でこんがらがってきた時にはこの動画をみてる
youtu.be/vz9cZnB1d1c
45:44~ twitter.com/genkuroki/stat...
タグ:
posted at 16:19:12
#統計 #R言語 のexact2x2パッケージのexact2x2やexactciパッケージのbinom.exactは、plot=TRUEをつけて使うとRothmanさん達の超有名な疫学の教科書がすすめているP値函数をプロットしてくれます。
P値や信頼区間を表示するあらゆる統計ソフトにP値函数のプロット機能があってほしいと思います。 twitter.com/genkuroki/stat... pic.twitter.com/yLN3CTXmiX
posted at 16:22:13
@0kkus0 #統計 ああ、なるほど。
sphweb.bumc.bu.edu/otlt/mph-modul...
も
P値と信頼区間の表裏一体性を完全に無視した解説
の典型例になっていますね。
その解説でのP値と信頼区間の整合的にするとどうなるかについては
github.com/genkuroki/publ...
を参照。 #Julia言語 による実装付き。
twitter.com/0kkus0/status/... pic.twitter.com/va5lTWkcEw
posted at 18:50:15
@0kkus0 #統計 2つのP値函数のアニメーション n=20 の場合
github.com/genkuroki/publ... #Julia言語 pic.twitter.com/kDDwLSV1NJ
posted at 18:51:43
@0kkus0 #統計 2つのP値函数のアニメーション n=100 の場合
nを大きくするとP値の定義の多彩さが気にならなくなります。(全部ほぼ一致するようになる。)
github.com/genkuroki/publ... #Julia言語 pic.twitter.com/TrR36RJdHa
posted at 18:53:09
@0kkus0 #統計 で、既出の
sphweb.bumc.bu.edu/otlt/mph-modul...
で採用している信頼区間は、私なら使いたくないと思うP値函数に対応する信頼区間なのですが、性質が悪いという欠点はありますが、シンプルな式で計算できるというメリット(これも結構重要)があります。
いつでもこの手のトレードオフがある。
タグ: 統計
posted at 19:01:10
ごまふあざらし(GomahuAzaras @MathSorcerer
#Julia言語 面白いんだけれど国内にユーザーが文字通り離散してる
タグ: Julia言語
posted at 20:40:17
ごまふあざらし(GomahuAzaras @MathSorcerer
@HShinaoka ちなみにこういうのもあります.
jldev.connpass.com/event/246382/
タグ:
posted at 21:34:01