黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2022年06月21日(火)
#統計 しかし、個人的には、連続補正版のχ²検定はいかなる場合も使わない方がよいと思う。
連続補正版のχ²検定のP値はClopper-Pearson型の(tsmethod="central"型の)Fisher検定のP値をよく近似するようになります。
連続補正版のχ²検定を使うくらいなら、CP型Fisher検定を使った方がよいと思う。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 07:45:47
#統計 色々あるFisher検定のP値と信頼区間とP値函数のグラフをRで見たい人は、exact2x2パッケージを入れるとよいです。これ、P値函数をプロットしてくれるところが、fisher.testよりもずっと便利です。
添付画像は #Julia言語 から #R言語 のexact2x2を使ってP値函数のグラフを表示させている様子。 pic.twitter.com/V5gwzmINhU
posted at 07:57:11
#統計
教えて!
2×2の分割表でのχ²検定版の信頼区間を表示してくれるRのパッケージがあれば教えてください!
Jerome Cornfield (1956)
projecteuclid.org/ebooks/berkele...
に連続補正入りのχ²検定版の信頼区間の計算の仕方が書いてあります。
私はそれを知らずに再発見しました(再発見は易しい演習問題)。
タグ: 統計
posted at 08:02:49
非公開
タグ:
posted at xx:xx:xx
#統計 「ベイズ」とか言っている人達のどこがひどいか
添付画像の左側のグラフを見せて、「5戦4勝」の側の勝率の事後分布が右寄りなので、「5戦4勝」の側が優れていると判断できる、とあっさり言えてしまうところがひどい。
もしかして、主義思想イデオロギーにハマり込んでも恥じない習慣がある? pic.twitter.com/24vCTcw1MZ
タグ: 統計
posted at 09:51:15
#統計 本当は、事前分布も含めてモデルの妥当性について最初に何も言及しようとしていない(していればまずいと気付くはず)時点で完全にアウトなのですが、その点を「これは遊び」という理由で見逃してあげても相当におかしなことになっている。続く pic.twitter.com/7HZEsKQsEe
タグ: 統計
posted at 09:53:58
#統計
連続性補正無しのχ²検定における仮説p=qのP値は37.1%になります。
添付画像中にある事後分布で測ったp>qの確率の76.2%と比較されるべき値は
1 - P値/2 = 81.5%
です。これはベイズ版の76.2%に結構近い。 pic.twitter.com/4xIZd1P6hf
タグ: 統計
posted at 10:02:46
#統計 二項分布モデルの場合には、
仮説p≥p₀片側検定のP値
=事前分布Beta(1,0)の事後分布で測ったp≥p₀となる確率
仮説p≤p₀片側検定のP値
=事前分布Beta(0,1)の事後分布で測ったp≤p₀となる確率
がぴったり成立しています。片側検定の方向によって事前分布を変える必要がある。続く pic.twitter.com/3Px1nQNuXF
タグ: 統計
posted at 10:35:37
#統計 この場合の事後分布の慎重な解釈法について
「事後分布で測るとp>qとなる確率は76.2%である」と言われると「p>qの確率が76.2%もあるのか!」という印象を受けがちになると思う。
何の確率を意味するかが不明の事後分布で測った確率に過ぎないのにそういう判断の仕方をするのは非常にまずい。 pic.twitter.com/FIAKkvPjAa
タグ: 統計
posted at 11:20:52
#統計 P値の無難な解釈の仕方は「P値に関するASA声明」www.biometrics.gr.jp/news/all/ASA.pdf に書いてあります。P値は
モデル(+パラメータ値+背景にあるすべての仮定)と
データの数値の整合性の指標
だとされている。モデルもデータもどちらも怪しいものであっても、それらの間の整合性の指標は計算できる。
タグ: 統計
posted at 11:27:01
#統計 P値は、モデル(およびその背後にあるあらゆる前提)と観測データの数値の整合性の指標でしかないと考えれば、P値の行き過ぎた利用を防ぎ易くなります。
詳しくは
↓
www.biometrics.gr.jp/news/all/ASA.pdf
タグ: 統計
posted at 11:29:40
#統計 例えば、添付画像の事後分布のグラフは、
一様事前分布の下での
p, qの値は~であるという仮説とデータの数値の整合性、
p/qの値は~であるという仮説とデータの数値の整合性
を表すグラフだとみなせます。 pic.twitter.com/XHvgZYx4hh
タグ: 統計
posted at 11:35:10
#統計 例えば、左側のグラフからは、一様事前分布の下では、
* p=0.4という仮説と「5戦4勝」というデータの数値に整合性は全然ゼロではない。
* q=0.4という仮説と「100戦60勝」というデータの数値の整合性はほぼゼロである。
のような情報を読み取れる。続く pic.twitter.com/pO6RhBhYOn
タグ: 統計
posted at 11:38:05
#統計 例えば、右側のグラフからは、一様事前分布の下で、
* p/q=1 すなわち p=q という仮説とデータの数値の整合性は結構ある。
のような情報を読み取れます。 pic.twitter.com/eDjN5HOjOo
タグ: 統計
posted at 11:40:05
@Idesan "Pathology"というのは、引用されているMinka(1999)の論文 "Pathologies of Orthodox statistics" tminka.github.io/papers/minka-p... を踏まえた表現かも知れないと思いました。頻度主義にも良いところがあるので、検定はともかく、もし全員ベイズだと逆に一面的すぎて怖い気がしますね。
タグ:
posted at 11:54:12
ロッシュローブ中のテスト粒子の運動を計算してみました。Juliaで綺麗な軌跡を描くのにこだわっています。どうしてこのような軌道を描くのかは下のリンクからどうぞ↓
github-nakasho.github.io/compact/roche pic.twitter.com/tMZTTY3Wh6
タグ:
posted at 11:55:48
「勝つ確率を比べる」という分析をしたいとして、最も重要な直感は
「5回挑戦して3回勝った」という世界も十分あり得たのではないか
ということだと思う。 twitter.com/genkuroki/stat...
タグ:
posted at 12:03:52
#統計 二項分布モデルではlogit変換してから正規分布近似をするといいよということを示すグラフの例。
通常のWald検定のP値函数の台は0未満にはみ出している。
Wilsonのスコア検定のP値とlogit変換WaldのP値はほぼぴったり一致しています。
github.com/genkuroki/publ... twitter.com/genkuroki/stat... pic.twitter.com/3HdvPf93PP
タグ: 統計
posted at 12:06:48
#統計 この場合には、事後分布のプロットと通常のP値函数のプロットから同じ結論が得られることを示すグラフを作りました。
上段がJeffreys事前分布から得られる事後分布のグラフ。
下段が事後分布に対応するP値函数(実線)の類似物と通常のP値(破線)の同時プロット。
nbviewer.org/github/genkuro... twitter.com/genkuroki/stat... pic.twitter.com/VjVAJgBacI
タグ: 統計
posted at 13:01:59
#統計 下段のグラフを見れば、事後分布をP値函数に変換すれば、通常のP値函数とほぼ一致していることがわかります。
逆にロスマンさん達の疫学の教科書を読んでP値函数の使い方をマスターした人はこのグラフを見れば事後分布の使い方もすでに理解していたことに気付くことになる。 pic.twitter.com/RN3xq0qzL9
タグ: 統計
posted at 13:06:12
#統計 以上のグラフはJeffreys事前分布Beta(0.5,0.5)の場合です。一様事前分布にすると「5戦4勝」側のデータが小さいせいで、そちらではずれが大きくなりますが、傾向は同じです。
添付画像①はJefreys事前分布で②は一様事前分布Beta(1,1)の場合。 pic.twitter.com/y7ZXh7187n
タグ: 統計
posted at 13:10:28
#統計 最初の方の話に戻るが、
問題:Fisher検定を与える統計モデルについて説明せよ。どのようなモデルから、どのようにしてFisher検定が導出されるか?
という問題は結構難しい問題かもしれません。
大雑把に答えることもそう簡単じゃないかも。
入門的教科書でもまともに説明されていない。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 13:32:40
#統計 以下のリンク先の添付画像では、通常のFisher検定に対応する仮説「オッズ比パラメータは1である」のP値だけではなく、仮説「オッズ比パラメータはωである」のP値をωを動かしてプロットしています。
「オッズ比パラメータはωである」という仮説のFisher検定について普通の教科書に説明はない。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 13:40:46
#統計 P値に関するASA声明 www.jstage.jst.go.jp/article/jjb/38... の説明の仕方にはちょっとだけよくない部分がありますが、次の動画を見ればクリアに理解できると思います。P値と信頼区間の両方が開設されています。
youtu.be/vz9cZnB1d1c
タグ: 統計
posted at 13:59:28
QR algorithm is a gem of numerical algebra: iterative QR decomposition converges to a triangular matrix. Converges to a diagonal matrix for symmetric inputs. en.wikipedia.org/wiki/QR_algori... pic.twitter.com/BidTW60uf0
タグ:
posted at 14:00:00
#超算数 興味深い内容もあったので紹介しておきます。
第5学年の正式な割合指導前における児童の倍・割合の捉え方
山田 篤史
aue.repo.nii.ac.jp/?action=pages_...
タグ: 超算数
posted at 17:55:04
ARグラス行く前に、スマホショルダーというウェアラブルデバイスになる進化を辿っている?笑
news.yahoo.co.jp/articles/f67fd...
タグ:
posted at 18:56:57
"本結果はHPVワクチン副反応のネガティブキャンペーンにより積極的なワクチン接種勧奨の差し控えが続き、ワクチン接種率が1%未満(2002 年度以降生まれの女性)という日本がいかに世界の潮流からかけ離れた危機的な状況にあるかを、改めて浮き彫りにする内容"
www.carenet.com/news/general/c...
タグ:
posted at 18:59:35
PDFを読むときにDeepL使うためにJuliaで改行消すGUIツール作った|KB砂糖 zenn.dev/kb_satou/artic... #zenn
タグ: zenn
posted at 20:01:32
非公開
タグ:
posted at xx:xx:xx
#統計 宣伝
パラメータの事後分布とP値函数のグラフを並べて比較できるようにプロットしてある図は自分で作ったもの以外に見たことがないので、結構貴重かも。
ソースコード #Julia言語
↓
github.com/genkuroki/publ... twitter.com/genkuroki/stat... pic.twitter.com/YRihVvgyp1
posted at 20:32:52
ごまふあざらし(GomahuAzaras @MathSorcerer
飼い主のN年前に書いたQiita記事が参考文献に使われてるでキュ。
飼い主役に立ってるでキュ。
zenn.dev/kb_satou/artic...
タグ:
posted at 21:27:48
#統計 「信頼区間わからん」という声はよく聞こえて来ますが、添付画像下段のようにP値函数をプロットできれば、
信頼区間=有意水準の高さでのP値函数のグラフの切断
で理解できます。
添付画像右下に、p/qの信頼区間とベイズ信用区間をプロットしておきました。 pic.twitter.com/bhKO1HAaBR
タグ: 統計
posted at 21:30:04
#統計 添付画像右下の95%BCI(ベイズ信用区間)と95%CI(信用区間)を比較すれば、この場合にはほぼ一致していることが分かります。
2つのP値関数がほぼ一致しているので、当然そうなります。 pic.twitter.com/UfGmMaypjv
タグ: 統計
posted at 21:31:53
#統計 このスレッドでクズ扱いしている「頻度論はダメなのでベイズを使おう」と言うような人達は、「信頼区間の解釈は難しいが、ベイズ信用区間の解釈は易しい」のように、ミスリーディングなことをよく言います。
しかし、このスレッドで使った2つの二項分布モデルではCIとBCIはほぼ一致。 pic.twitter.com/5NyCwcC34m
タグ: 統計
posted at 21:40:34
#超算数 センス(先天的かつ選択的な技能・概念のことか)がないと割合や速さが分からないと思い込まされるほどに、分かり難い指導法(三用法)が当たり前化しているという可能性の方が高いと思います。
例)算数で1や2を取る子供が生み出したのが比をうまく使った方法だった8254.teacup.com/kakezannojunjo...。 twitter.com/koharunya/stat...
タグ: 超算数
posted at 21:51:59
#統計 添付画像は2つのP値函数と2つの95%(B)CIのプロットです。P値はモデルのパラメータ値(横軸)とデータの数値の整合性の指標です。
例えば、添付画像は、p/q=0.5はデータとの整合性がゼロに近く、p/q=1の整合性はひどく小さくはない、のような情報を読み取れます。続く pic.twitter.com/zIaXxfmo2b
タグ: 統計
posted at 21:54:24
#統計 95%(B)CIは、データとの整合性の指標であるP値が5%以上になるパラメータ値の範囲です。
「パラメータ値とデータの数値の整合性が無さすぎる」と閾値5%を使って決めれば、95%信頼区間が得られるわけです。
信頼区間についてはこのように理解して使えばよいです。 pic.twitter.com/ZSBUnzmk5q
タグ: 統計
posted at 21:58:41
#超算数 さらに補足。みはじくもわなどを円の中に丁字を配したようなOT図に書き込む技法は、おそらくオームの法則の学習に関連して開発されました。最初期の資料(1922)が既にtwitter.com/temmusu_n/stat...、オームの法則の三形態が一つの図に表されることを誇っていました。電流、電圧、抵抗のような
タグ: 超算数
posted at 22:09:23
#統計 閾値として5%が使われることが多いのですが、閾値としてそれを使う必然性はない。そこは要注意。
このスレッドで信頼区間が書き込まれていないP値函数だけのグラフを沢山見た人達の多くは「P値函数のグラフがあれば信頼区間はいらないんじゃないか?」と思うだろうし、私はそう思っています。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 22:12:49
#統計 信頼区間を書き込まない方が見易いと思う。
必然性がない閾値の設定に煩わされることがなくなる方がすっきりしている。
そして、統計学がお墨付きを与える道具でないことも信頼区間無しの方が明瞭になる。 pic.twitter.com/wC9hPaTlLq
タグ: 統計
posted at 22:15:50
#統計 1つ前の添付画像の実線は一様事前分布の事後分布に対応するP値函数のグラフ。
以下はJeffreys事前分布の場合で、点線の通常のP値との違いが小さくなっている。 pic.twitter.com/m6kGZLUyxw
タグ: 統計
posted at 22:19:28
#超算数 割合、速さは、日常生活に豊富に実例が存在するので、3用法とかOT図のような画一的で人工的な手法をとる意義がとても薄いです。教科書にあるような定型的な課題で正解させるためにも裏マニュアルが必要な上twitter.com/temmusu_n/stat...、そうまでしても簡単につまづくとtwitter.com/temmusu_n/stat...。
タグ: 超算数
posted at 22:22:31
#統計 P値函数はまだ普及しているとは言えない感じなので、「なんじゃこれは?」と思っている人も多いと思うのですが、
あらゆる信頼区間の上には
とんがり帽子型のP値函数が乗っかっている
と覚えておけばきっと役に立つと思います。
そして重要なのは信頼区間よりもとんがり帽子の方🥳 pic.twitter.com/ZUK7JEr9g8
タグ: 統計
posted at 22:29:11
#統計 これは回帰直線の信頼区間(区間は縦方向で無限に並んでいる)の場合のP値函数のヒートマップです。
3次元グラフにすると、てっぺんが尖った山脈型になるはず。 twitter.com/genkuroki/stat... pic.twitter.com/GygqF3aokW
タグ: 統計
posted at 22:34:37
#統計 回帰直線のP値函数の3次元グラフのアニメーション
nbviewer.org/github/genkuro... pic.twitter.com/QhEgZXJavI
タグ: 統計
posted at 23:23:23
非公開
タグ:
posted at xx:xx:xx
「3で割れば0.5mあたりの重さが出る」ってことが確認できてないと、「3で割って2を掛ければ良い」なんてできねぇと思うけどな。 twitter.com/w2Y3lkPhWhOwuq...
タグ:
posted at 23:48:34
なんか見た.こういうのわざわざ小数で計算するよりも比で計算する方が簡単なので積分定数さんと同じようにするなぁ.
小数の割り算とかも基本的に比を使えば小数で割り算しなくても良いし pic.twitter.com/BkA14Ly7J7
タグ:
posted at 23:53:27