黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2022年07月10日(日)
非公開
タグ:
posted at xx:xx:xx
#統計 WAIC, LOOCV, WBIC, ...と違って、P値の類似物は階層モデルでも数値積分を使わずに計算できる。
↓ twitter.com/genkuroki/stat...
タグ: 統計
posted at 23:11:11
#統計 このスレッドの話題は、「差はゼロである」という特殊な仮説の検定をできるだけでは不十分で、「差は○○である」という無数の仮説達の検定もできるようにしておくべきだという以下のリンク先の話題に繋がっている。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 23:05:56
#統計 比率の差のWaldの信頼区間とZou-Donner 2004での比率の差の信頼区間(およびそれらに対応するP値函数)の実装例
↓
github.com/genkuroki/publ... twitter.com/genkuroki/stat... pic.twitter.com/QkF7zTZZiD
タグ: 統計
posted at 23:02:58
どなたか、教えてください‼️
フォロワーさんからこのような動画が届きました。「沼津の海で拾ったのですが、これは何でしょう?」と。
サッパリわかりませぬ💦でも、めちゃくちゃおもしろいですね、これ😆
僕には中国の花巻にしか見えないのですが…硬いそうです。わかる方、いらっしゃいますか? pic.twitter.com/JZayDtaRbR
タグ:
posted at 22:59:17
#統計
ZDは比率の差のZou-Donnet 2004の信頼区間に対応するP値
Waldは比率の差のWald検定のP値
chisqはオッズ比のスコア検定のP値
の第一種の過誤の確率。
github.com/genkuroki/publ...
以下の典型的な場合を見ると、ZDの方がWaldより45度線に近い。ZDの側を使うべき。 pic.twitter.com/ofysHTor0M
タグ: 統計
posted at 22:58:28
#統計
scholar.google.co.jp/scholar?cluste...
Zou-Donner 2004
で提案された比率の差の信頼区間に対応するP値函数を実装して、第一種の過誤のモデル内確率を計算してみました。45度線に近い方が好ましいです。
github.com/genkuroki/publ...
典型的な場合
↓ pic.twitter.com/ujIGYtBOC6
タグ: 統計
posted at 22:58:26
@nouhuhoumei 分析のための公式の問題ではないです。
必要なデータがないと当確予想を出すのは無理。
問題:インターネットで手に入る公開情報だけでどれだけ速く正確に当確予想を出せるか?
↑
これは興味ある問題。
タグ:
posted at 21:34:06
#統計
⭕️点推定だけではなく、区間推定もしましょう。
と同じように、
⭕️「差はゼロ」の型の特殊な仮説のP値のみを求めるのではなく、「差は○○である」の型の無数の仮説達のP値達も求めましょう。
ということにすればよいのではないか?
↓
journals.sagepub.com/doi/10.1177/02...
タグ: 統計
posted at 21:25:13
#統計 論文 journals.sagepub.com/doi/10.1177/02... で提案されていることはシンプルで、
モデル+パラメータ値とデータの数値の
整合性の指標の値全体を
すべて使うようにした方が良い
です。私はこれは非常に自然な考え方だと思います。
タグ: 統計
posted at 20:51:25
ごまふあざらし(GomahuAzaras @MathSorcerer
私も書きました✏️
皆さんの素直な意見が今後の Julia の発展に寄与することができます. twitter.com/MathSorcerer/s...
タグ:
posted at 20:23:16
twitter.com/kayoka_yo/stat...
#超算数 教育実習で分数の足し算が怪しくても問題無いと主張する小学校教諭。
小学校教諭に学力を期待するのは絶望的なのか。 pic.twitter.com/LPWFOIp5lN
タグ: 超算数
posted at 20:17:05
#統計 論文 journals.sagepub.com/doi/10.1177/02... は、P値を使った検定はどこでまずいことになっているかについて非常に良い解説になっています。
熟慮にかけた破壊的な批判になっておらず、非常に建設的な提案をしており、教育的にも害のないP値の説明法を提案しています。
タグ: 統計
posted at 19:40:36
#統計 論文
journals.sagepub.com/doi/10.1177/02...
の意味での、compatibilityの日本語訳をどうするべきか悩んでいる。consistencyに近いニュアンスで使われている。
この場合に「互換性」と訳すのはまずいと思う。
「適合性」だと、fitと紛らわしい。
「両立性」または「整合性」が現在の候補。
タグ: 統計
posted at 19:33:26
#統計 最近繰り返し紹介している論文
journals.sagepub.com/doi/10.1177/02...
では
信頼できるかどうかではなく
単に整合性を見ているだけ
という点を分かり易くするために、
❌信頼区間(confidence interval)
ではなく、
⭕️整合区間(試訳、compatibility interval)
という言い方を提案している。
タグ: 統計
posted at 19:26:55
#統計 ひどい!これはひどい!訂正します。意味が逆になっている。
❌「95%信頼領域」のような言い方に権威を感じてしまう心の持ち方を潰すことは、非科学的な頭の使い方なので要注意。
⭕️「95%信頼領域」のような言い方に権威を感じてしまう心の持ち方は、非科学的な頭の使い方なので要注意。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 19:22:02
#統計(w, r)=(4816, 801)でP値函数は極大になっている。
github.com/genkuroki/publ... pic.twitter.com/o8TyaZimJo
タグ: 統計
posted at 19:15:21
#統計 続き。しかし、私がテキトーに定義したP値は真ん中あたりで膨らんでいる。
github.com/genkuroki/publ... pic.twitter.com/bFF8DZQt96
タグ: 統計
posted at 19:13:46
#統計 尤度が真ん中あたりで膨らんでいるかをチェックするために、直線 5000-x : 1000-y = 24 : 26 の上の尤度をプロット。
添付画像を見れば分かるように、真ん中あたりで膨らんでいない。
しかし~続く
github.com/genkuroki/publ... twitter.com/takotakot/stat... pic.twitter.com/qO3WzbtuOF
タグ: 統計
posted at 19:12:37
#統計 P値が5%以上の領域を95%信頼領域と呼ぶ。95%信頼領域はこんな感じ。
github.com/genkuroki/publ... pic.twitter.com/p402ZcYgvD
タグ: 統計
posted at 18:32:48
#統計 P値が黒くない部分と尤度が黒くない部分が似た領域になっていることが分かる。
P値も尤度も、モデル+パラメータ値(w,r)とデータの数値の整合性の指標とみなされる。
この場合はどちらでも判断してもそう変わらない。 pic.twitter.com/Xz9a6Vm9hX
タグ: 統計
posted at 18:28:16
#統計 これはP値のプロット。
モデルは超幾何分布×超幾何分布で、P値は各々の超幾何分布のClopper-Pearson型P値の積で定義。
github.com/genkuroki/publ... pic.twitter.com/wLRHVKH1eo
タグ: 統計
posted at 18:25:28
#統計 元の話題に戻る。
Aの箱の中に入れた白ビーズをw個、赤ビーズをr個としたときの尤度のグラフ。右上の端の尤度が高過ぎるので頭をちょんぎってヒートマップにしています。
github.com/genkuroki/publ... twitter.com/genkuroki/stat... pic.twitter.com/Nq1N1q4zWv
タグ: 統計
posted at 18:21:54
GLMM, Juliaでやる場合はMixedModels.jlを使えばいいんですね.Pythonのライブラリは未だに知らない…
juliastats.org/MixedModels.jl...
タグ:
posted at 17:48:19
#統計 P値をデータとモデルの整合性(compatibility)の指標と見る話については、最近の論文
twitter.com/genkuroki/stat...
が非常に分かり易い。この論文及びこの論文で仕掛けた論争の相手との間で、「統計的有意」という言い方をすることは全面的に止めるべきだという点では意見が一致している。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 16:40:40
非公開
タグ:
posted at xx:xx:xx
#数楽
これは当然あるべき疑問。極端な位置でない所で尤度函数はどういう様子をしているか?
別の自然な疑問に尤度ではなくP値を見たらどうなるかとかもある。
なにはともあれ計算してみれば答えが分かる。😁
気軽に計算できる道具の使い方をマスターしていると人生の楽しみ😊が増えると思う。 twitter.com/takotakot/stat...
タグ: 数楽
posted at 16:15:29
よっこらせ…
A, B の中身がそれぞれ 43:7, 24:26 に近い値のときが、生成確率が最も高いかと予想していたんだが、違った。極大でもなかった。
一応 A 4798 ,781, B 202, 219 が近いはずと計算していたのだが…
B が 24, 26 のとき、B から当事象が観測できる確率が1なので、それがかなり強いようだ twitter.com/genkuroki/stat...
タグ:
posted at 12:49:24
#統計 モデルのパラメータθに関する仮説θ=θ₀の(両側検定の)通常のP値のベイズ統計での類似物として、
min(1, 事後分布においてθ≤θ₀となる確率の2倍, 事後分布においてθ≥θ₀となる確率の2倍)
が取れます(別の変種もある)。
MCMC法で事後分布のサンプルが得られているならば、~続く twitter.com/cakkby2/status...
タグ: 統計
posted at 11:30:35
Stefan Karpinski @StefanKarpinski
Glad that this can’t happen in #JuliaLang: packages are served by the pkg server network which persists all registered package versions and artifacts so even if the origin got repo disappears, old versions can be installed forever twitter.com/balloob/status...
タグ: JuliaLang
posted at 02:55:47
#Julia言語
配列やタプルの配列であるという理由で激遅になることはないです。
型不安定(型の伝搬がうまく行っていない状態)になると激遅になることがあります。
内容の型や長さが固定されていないタプルは要注意。
@ code_warntype や @ code_typed などで繰り返し確認することが重要。 twitter.com/stunniita/stat...
タグ: Julia言語
posted at 01:18:24