黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2022年04月03日(日)
あれ? 今気が付いたんだけど、スレッド最初のAJHの論文、1月にツイートしてるわ。ファイザー製ワクチンで血栓が増えていないという接種後調査のおまけつきで。 twitter.com/ymori117/statu...
タグ:
posted at 23:55:45
Thrombosis Reasearch「nCoV-19ワクチン接種後の凝固亢進の欠如:観察パイロット研究」 www.thrombosisresearch.com/article/S0049-... イタリア190名(アストラゼネカ製101名、ファイザー製89名)対象。凝固時間に変化認めずと。 pic.twitter.com/gkVBF5ZGZo
タグ:
posted at 23:50:01
子宮頸がん検診に過剰診断や過剰治療の害があるのは事実です。検診にはそうした害を上回る利益がありますが、害は小さいほうが望ましいです。HPV感染や子宮頸がんの前がん病変を減らす予防法があれば、検診の害を小さくできるのですがねえ。以上。
タグ:
posted at 23:36:06
ちなみに、総死亡はともかく、子宮頸がん検診が子宮頸がん死や浸潤子宮頸がん罹患を減らすというエビデンスは十分にあるというのが世界のコンセンサスです。いまさら検診なし群を対照にしたランダム化比較試験は倫理的にできないぐらいは効果があるとみなされています。
タグ:
posted at 23:33:20
ただ、そのような立場に立つのなら、新型コロナに対するイベルメクチン使用なんてとんでもなく、とうてい認められないはず。「イベルメクチンをお守り的に考えてるのではないでしょうか」なんて擁護するわけがありません。擁護するとしたら味方に激甘なだけ。それとも利益相反?
タグ:
posted at 23:33:07
きわめて確固たるエビデンスがない限り医療行為を否定するという立場はあるでしょう。だったら子宮頸がん検診も否定しなければなりません。鳥集徹氏は「子宮頸がん検査はエビデンスが乏しく、過剰診断が多いと考えられるので、否定的です」なのだそうで、その点では一貫性があります。
タグ:
posted at 23:32:38
共通テストへの「情報」の拙速な導入中止の訴えへのご賛同の署名数が350に達しました。ありがとうございます。
さらに多くの方からご賛同の声をいただくために締切を2022年5月末日まで再延長します。引き続きよろしくお願いいたします。
docs.google.com/forms/d/e/1FAI...
タグ:
posted at 21:48:04
リバウンドで次の波が来るのがほぼ確定。年度替わりで人が動く前に、減らしきれなかったのが痛い。 #新型コロナウイルス
保健所や医療の人たちは、一休みできないまま次の波に突入だ。ベテランが抜けて新人教育しながらの対応は大変そう。
>宮城県の新型コロナデータ (NHK)
www3.nhk.or.jp/news/special/c...
タグ: 新型コロナウイルス
posted at 21:46:05
次のURLのツイートで紹介されている本の図、Watanabe, 2018 MTBS にあるような渡辺先生の図にとてもよく似てますね...
archive.ph/8w3O5 pic.twitter.com/gQkDzCw9jW
タグ:
posted at 21:38:32
#統計 #R言語
binom.testとfisher.testで表示されるP値と信頼区間の不整合は、それらの代わりに、
library(exactci)のbinom.exact
library(exact2x2)のexact2x2
を使えば解決する。plot=TオプションをつければP値函数をプロットしてくれる優れもの! twitter.com/genkuroki/stat...
posted at 21:21:47
訂正案
❌ただし、算数では、倍数に0を含めないので、公倍数にも0を含める.
⭕️日本の文部科学省が検定した算数の教科書には倍数に0を含めない誤った説明があるので注意すること。0はあらゆる数の倍数になる。
タグ:
posted at 20:51:52
ja.wikipedia.org/wiki/%E5%85%AC...
公倍数 - Wikipedia
これはひどい! pic.twitter.com/7Txc5ap3Kz
タグ:
posted at 20:47:59
#統計 #R言語
Rのbinom.testが表示するP値はSterneの流儀で、信頼区間はClopper-Pearsonの流儀なので、整合性がありません。
Rのfisher.testが表示するP値と信頼区間にも同様の不整合がある。
どうしてこういう整合性に欠ける仕様にしたかが不思議。論文での報告のための道具としてはひどい欠点。 twitter.com/genkuroki/stat...
posted at 20:41:47
「公倍数」のウィキペディアがひどい状態にされたまま放置されている。 twitter.com/hgn_no_otaku/s... pic.twitter.com/iGHmSPU6sL
タグ:
posted at 20:33:26
macOS 12.3でPythonが削除されて動かなくなったAutomatorのPDF結合アクションに代わり,最近 macOSに導入された「ショートカット」アプリを利用してPDFを結合するショートカットを作ってみました。ショートカット→シェルスクリプト→AppleScriptObjCという長い迂回路ですが。doratex.hatenablog.jp/entry/20220403...
タグ:
posted at 19:44:02
#統計 添付画像はSterneの信頼区間の原論文
Sterne (1954)
www.jstor.org/stable/2333026
より。
母比率のClopper-Pearsonの信頼区間は片側確率の2倍という確率にならない値を正確に計算する流儀のせいで、Sterneの信頼区間と比較すると多くの場合に無駄に広くなります。
実装はCPの側が圧倒的に楽。 pic.twitter.com/rQ636qi27e
タグ: 統計
posted at 19:32:02
#統計 母比率の信頼区間では古典的な
Clopper-Pearsonの信頼区間
が
P値を片側確率の2倍で定義する流儀
に対応しており、
Sterneの信頼区間
が
P値を以下の添付画像の②で定義する流儀
に対応しています。Sterneの信頼区間の方が大抵狭くなります。 pic.twitter.com/pDwREAWZec
タグ: 統計
posted at 19:29:03
遊びでもそれなりに真剣に考えるという状況はあった方が楽しいんじゃないかなと思うので、ちょっと真剣になれそうなぷよ碁のちょっと変わった遊び方の案。
#囲碁
#ぷよ碁 pic.twitter.com/I6ZU8DtFZr
posted at 19:26:15
#統計 上では両側検定のP値のベイズ的類似物を「事後分布における片側確率に2倍」で定義しましたが、添付画像の下段のように定義することもできます。
一般に確率の2倍は確率ではなくなるので、P値の類似物を確率にしたければ後者がよいのですが、前者と比較して実装がかなり面倒になります。 twitter.com/genkuroki/stat... pic.twitter.com/iRu8aqjl8q
タグ: 統計
posted at 18:38:10
テスラボット、歩き方が「手と足が一緒に出る」ナンバ歩きなのがめちゃくちゃ面白いけど、それはそれとして、夜道とか山の中で出会ったら失禁すると思う twitter.com/shelbychurch/s...
タグ:
posted at 18:33:26
ボリス・ジョンソンさんのこういう所は本当にすごい。
ジョンソン首相が首脳会談で“かりんとう”をボリボリ…製造元の菓子店は知っていた?反響を聞いた(FNNプライムオンライン)
#Yahooニュース
news.yahoo.co.jp/articles/4af3b...
タグ: Yahooニュース
posted at 18:04:35
#統計
#R言語 の場合
N <- 10^6
a <- 100
m <- 679
c <- 111
n <- 679
RR <- rbeta(N, 1+a, 1+m-a) / rbeta(N, 1+c, 1+n-c)
q <- quantile(RR, c(0.025, 0.5, 0.975))
print(q)
これを3回やればFigure S6にあるベイズ版信用区間を再現可能。
こんなに簡単に結果を再現できるのはベイズ統計だから。 pic.twitter.com/ryHNSzn7kw
posted at 15:39:51
#統計 10分でFigure S6の信用区間を再現できるという主張は誇張ではないことは以下のコードを #Julia言語 で実行すれば分かります。
using Distributions
N = 10^6
a,m,c,n = 100,679,111,679
X = rand(Beta(1+a, 1+m-a), N) ./ rand(Beta(1+c, 1+n-c), N)
quantile.(Ref(X), (0.5, 0.025, 0.975)) pic.twitter.com/A3dHLIhb6s
posted at 15:12:56
#統計 この3行が視界に入れば、件の論文のTable 2(添付画像①)にある数値を使って、Supplementary AppendixのFigure S6(添付画像③)とそこに書いてあるベイズ版信用区間(この場合には通常の信頼区間に実質的に等しいと思ってよい)を10分程度で再現(添付画像③はその「清書」版)できます。 pic.twitter.com/MKHrutPTJZ
タグ: 統計
posted at 14:46:25
#統計 添付画像は最近のイベルメクチン論文
www.nejm.org/doi/full/10.10...
のSupplementary Appendixのp.9です。
二項分布+一様事前分布のベイズ的な統計モデルを使っており(最も易しいベイズ統計の例!)、リスク比の区間推定はベータ分布の事後分布の乱数を100万個生成して行ったと書いてあります。 pic.twitter.com/LsBt03bmLq
タグ: 統計
posted at 14:41:45
#統計 リスク比の区間推定をベイズ統計の事後分布によるサンプル生成によってシンプルに行ったことを論文に書いておけば、私のようなど素人であっても同じ区間推定を10分程度で再現できます。
同じことをP値を使ってやろうとするとかなり大変になります。リスク比の区間推定の方法は色々あって複雑。 pic.twitter.com/aah0QEcDc9
タグ: 統計
posted at 14:30:46
#統計 このグラフを見ると,通常のP値を使ってもベイズ統計を使っても結果は一致していることが明瞭です。
ベイズ統計を何も知らない人はベイズ統計を使う方が大変だと感じるので「どうしてわざわざベイズ統計を使ったのか!」と不満を感じるかもしれませんが、その不満の原因は単なる無知です。 pic.twitter.com/b1QoZ1rY9G
タグ: 統計
posted at 14:16:21
#統計 最近のイベルメクチン論文 www.nejm.org/doi/full/10.10... ではベイズ統計を使っていますが、 github.com/genkuroki/publ... で示したように使わなくても結果は同じです。
青と赤と黒の線が通常のP値函数、オレンジとシアンと灰色の線が件の論文に登場する事後分布から作ったP値函数の類似物から得た結果。 twitter.com/genkuroki/stat... pic.twitter.com/edWyZg2K51
タグ: 統計
posted at 14:13:09
@_akiraendo @EvidenceObasan @medibook3 @ykamit #統計 件のイベルメクチン論文の事後分布から作ったP値函数の類似物(この類似物からベイズ版信用区間が得られる)と通常のP値函数を同時プロットしてみました。
ほぼぴったり一致しており、この論文の場合にはベイズ統計を使っても使わなくても結果は同じです。
github.com/genkuroki/publ... pic.twitter.com/odiPkF6a6U
タグ: 統計
posted at 14:07:07
Bregman divergences are convex distance-like functionals which are locally Euclidean. Most algorithm handling Euclidean distances generalize to Bregman divergences. en.wikipedia.org/wiki/Bregman_d... pic.twitter.com/qmxIuDjqfG
タグ:
posted at 14:00:01
@_akiraendo @EvidenceObasan @medibook3 @ykamit #統計 これによって、件の論文がベイズ版信用区間を使っていることから生じる疑義は完全に解消されたと思います。
添付画像①は論文のSuppl. Appendixにある事後分布のグラフで、②は私によるP値函数のグラフ。前者のベイズ版信用区間と後者の信頼区間はほぼぴったり一致しています。 pic.twitter.com/VRksjnRQnH
タグ: 統計
posted at 11:52:30
@_akiraendo @EvidenceObasan @medibook3 @ykamit #統計 relative riskのP値や信頼区間はそういうややこしいものなので、対応するベイズ版との数値的一致もずっと非自明な問題になる。
その非自明な問題を解決しようと思って頑張って書いたコードがgithub.com/genkuroki/publ... です。
計算した信頼区間と論文のベイズ版信用区間はほぼぴったり等しい。
タグ: 統計
posted at 11:49:29
@_akiraendo @EvidenceObasan @medibook3 @ykamit #統計 だから、relative riskのP値や信頼区間は数学的に近似(どんぶり勘定)が入っており、正確なものではありません。そういう正確でないものについて5%やら95%のような閾値に厳密にこだわることは、非科学的な考え方なのですが、現実には非常に残念なことになっている。
タグ: 統計
posted at 11:45:37
@_akiraendo @EvidenceObasan @medibook3 @ykamit #統計 relative riskのP値や信頼区間の定義は、母比率の場合と比較すると、数学的にずっとややこしいです。nuisanceパラメータの問題が出て来る典型的な場合の1つになっています。
だから、条件付き確率分布に移ったり、n→∞での漸近論を使うなどの「どんぶり勘定」が必要になります。続く
タグ: 統計
posted at 11:43:29
@_akiraendo @EvidenceObasan @medibook3 @ykamit #統計 件の論文では母比率ではなく、母比率の比(relative risk)のベイズ版信用区間を扱っているので、以上で示したことで本当に知りたいことがわかったわけではないことに注意!
しかし、易しい母比率の場合の理解抜きに、relative riskの場合を理解できるはずがないので丁寧に説明しました。
タグ: 統計
posted at 11:40:18
@_akiraendo @EvidenceObasan @medibook3 @ykamit #統計 ただし、そこで使っている事前分布はBeta(0,1)とBeta(1,0)で、件の論文で使っている一様事前分布Beta(1,1)とは違います。
しかし、nが大きいとその程度の事前分布の違いは数値的には無視できます。
これでnが大のときに、母比率の検定と対応するベイズ版が実践的に同等なことを示せました。
タグ: 統計
posted at 11:37:45
@sekibunnteisuu @tomoak1n @hgn_no_otaku Wikipediaの履歴を見ると以下のように変わっています。
わけがわからない。 pic.twitter.com/RMBFVuh4Sj
タグ:
posted at 11:37:22
@_akiraendo @EvidenceObasan @medibook3 @ykamit #統計 二項分布モデルでの「母比率はp以下」という仮説のP値はimproper事前分布Beta(0,1)のベイズ統計の事後分布で「母比率はp以下」が成立する確率に誤差無しでぴったり一致します。
仮に両側検定のP値を片側検定のP値の2倍で定義すれば、両側検定のP値もベイズ統計の言葉でぴったり書けます。続く
タグ: 統計
posted at 11:30:02
@_akiraendo @EvidenceObasan @medibook3 @ykamit #統計 母比率の信頼区間でよく使われているのはClopper-Pearsonの信頼区間です。
その計算では、実質的に、「母比率はp以下」という仮説の片側検定のP値が、improper事前分布の事後分布で「母比率はp以下」という仮説が成立する確率にぴったり一致することを使っています。
github.com/genkuroki/publ... pic.twitter.com/BhnEpTTwj7
タグ: 統計
posted at 11:26:10
@_akiraendo @EvidenceObasan @medibook3 @ykamit 【尤度関数を正規化して95%区間を取ったもの】は通常の信頼区間とは全く別物でベイズ版の信用区間の特別な場合に過ぎません。
ベイズ版信用区間の特別な場合がベイズ版信用区間の特別な場合に一致する、という主張は単なるトートロジーで、信頼区間と信用区間の近似的一致とは無関係です。
タグ:
posted at 11:15:50
岩波「科学」は甲状腺検査にかこつけて福島の人々の不安を煽ろうとする愉快犯メディアであり、極めて悪質です。寄稿者は愉快犯の共犯者ですよ。
僕たちは福島の人たちが普通に暮らしていくのを願うべきなのであって、あるかないか分からない程度の被曝影響で不安を煽るのは人の道に反します twitter.com/kikumaco/statu...
タグ:
posted at 10:45:13
なぜかIvyの人からインターンのお誘いのメールきた。Londonだけどリモート可。様々なものを自動でPyTorchに変換するコードとか考えているらしい。StanをPyTorchに変換できたら夢があるなぁ。応援したい。
deep-ivy-ltd.breezy.hr/p/ff030eb9f23c...
lets-unify.ai
タグ:
posted at 10:30:27
@_akiraendo @EvidenceObasan @medibook3 @ykamit ベイズ云々とは無関係に、P値函数による信頼区間の定義とは別の「尤度函数による定義」を説明していただけませんか?
説明するのは一般的な定義でなくてもよくて、特定の統計モデルの場合だけでよいです。
例えば、「n回中k回成功」の形式のデータからの成功確率の区間推定の場合だけで十分です。
タグ:
posted at 10:17:53
岩波『科学』2022年4月 「原発事故と小児甲状腺がん」
福島の甲状腺検査特集なのに過剰診断問題を理解できる人が誰も書いていないというあからさまな放射能デマ雑誌。
過剰診断問題を理解せずに福島の甲状腺がんを語るのは、とどのつまり全て放射能デマってことですよ
tanemaki.iwanami.co.jp/posts/5701
タグ:
posted at 09:49:21
非公開
タグ:
posted at xx:xx:xx
@garasan_ 千倉の定置網で揚がった2トンのマンボウ
ちょうど市場調査で偶然立ち寄りましたが、でかかったです (^ つ 》 pic.twitter.com/dnOhH04pD1
タグ:
posted at 07:54:17
@tomoak1n @hgn_no_otaku 文科省だか教科書会社だかにこの件を質問したときは、
「0は考えない」だから、0は倍数に入れるとか入れないとかは考えない、ということで、倍数ではないとは言っていない
とか言っていました。
タグ:
posted at 07:38:46
tosuke@統計(が好きな)おじさん @medibook3
@genkuroki @EvidenceObasan @_akiraendo @ykamit >akiraendoさん、黒木玄さん
大変勉強になりました、どうも有難うございます。
実際の例を通してまた今後勉強させていただきます。
タグ:
posted at 06:33:54
【ランキング】 2022年04月03日時点の原子力・放射線売上1位は
#本好きな人と繋がりたい #林智裕
「正しさ」の商人 情報災害を広める風評加害者は誰か
[価格] ¥1980
www.amazon.co.jp/dp/4198654417/...
タグ: 本好きな人と繋がりたい 林智裕
posted at 02:08:30
@EvidenceObasan @_akiraendo @medibook3 @ykamit 関連スレッド twitter.com/genkuroki/stat...
タグ:
posted at 02:05:51
@_akiraendo @EvidenceObasan @medibook3 @ykamit P値函数による信頼区間の定義と別に「尤度函数による定義」があると思っていること自体が勘違いだと思います。
タグ:
posted at 02:04:21
@EvidenceObasan @_akiraendo @medibook3 @ykamit 8割おじさんとして有名な西浦さん達が公開したリポジトリを見に行ったら、事前分布以外の部分が同一の統計モデルに最尤法とベイズ法の両方を試していました。
現在では、統計モデルとデータの関係を知るためにベイズ法を使うことは普通になっていると思います。
github.com/contactmodel/C...
タグ:
posted at 02:01:28
@EvidenceObasan @_akiraendo @medibook3 @ykamit 科学研究論文で使われている事前分布はおとなしめのものが多いので「事前分布によって違いが出ること」を深刻に考えすぎない方が良いと思います。
統計モデルの違いの影響は(当たり前の話なのですが)結構大きいです。ベイズか非ベイズかの違いではなく、統計モデルの違いを見た方が生産的。 twitter.com/medibook3/stat...
タグ:
posted at 01:55:14
@EvidenceObasan @_akiraendo @medibook3 @ykamit しかし、実際に使うのは有限のnの場合なので、ケースごとにコンピュータで数値的な確認が必須です。
今回のイベルメクチン論文の場合について、P値函数を使って作った通常の信頼区間とベイズ版信用区間のよい一致は以下のリンク先で私が確認しました。
github.com/genkuroki/publ... pic.twitter.com/m1ZHPWvqVG
タグ:
posted at 01:47:05
@EvidenceObasan @_akiraendo @medibook3 @ykamit P値函数の側が最尤法を基礎とするχ²検定で与えられていて(そうでないP値函数は沢山ある)、他にも様々な条件を仮定すると、サンプルサイズn→∞での、P値函数とベイズ統計の事後分布を関係付けることができます。続く
タグ:
posted at 01:40:35
@EvidenceObasan @_akiraendo @medibook3 @ykamit 実践との繋がりでは、急いで数学的にややこしいことの理解を急がずに、コンピュータを使ってケースバイケースで通常の信頼区間とベイズ版の信用区間を両方計算して比較する作業を大量に行って感覚をつかむのが良いと思います。
タグ:
posted at 01:36:22
@EvidenceObasan @_akiraendo @medibook3 @ykamit 通常の信頼区間とベイズ版の信用区間は定義が根本的に違うので、【事前分布が一様であれば結局両者は同一になります】のようにシンプルな考え方でそれらが数値的に近くなる場合が多いことを理解することはできません。
定義の根本的な違いを上手に吸収する議論を地道に行う必要があります。
タグ:
posted at 01:33:07
@EvidenceObasan @_akiraendo @medibook3 @ykamit 一方、ベイズ版の信用区間はそれとは全然違う定義の仕方をします。信頼区間の場合と違って、尤度函数と事前分布とデータから作った事後分布を使ってベイズ版信用区間(確信区間ともいう)を定義します。続く
タグ:
posted at 01:29:38
@EvidenceObasan @_akiraendo @medibook3 @ykamit 通常に信頼区間は尤度函数ではなく、P値函数を使っても定義されます。統計モデルのパラメータ値でP値がα以上になるもの全体の集合が信頼係数1-αの信頼区間になります。続く
タグ:
posted at 01:28:28
認可をめぐる訴訟で1998年に国が敗訴したため,その後整復師養成校が乱立し,多数の有資格者が誕生することになります.この10年は巷で多くの整骨院が誕生してはつぶれをくりかえしています.はげしい競争のなかでサプリメントを売ったり,エビデンスのない療法を勧めたりということをよくみかけます.
タグ:
posted at 00:48:03
この資格は明治維新で職を失った柔術家を救済するためにできたといわれています.敗戦後GHQは,鍼灸師や整骨師といった医師以外の資格を廃そうとしたのですが,外地からの引揚者の職を保証するめに一代限りの資格として残しました.だから戦後は柔道整骨師要請の学校の認可をきびしく制限していました.
タグ:
posted at 00:41:16
「がんのあやしい治療は整体系がめだつ」という発言がどこかであったので,すこしだけ解説.「整体系」には,公的資格のある「柔道整復師」と,資格のない「カイロプラクティック・オステオパシー」系のふたつにおおきく大別されます.前者は整骨とか,むかしは骨接ぎなどとよばれていたものですね.
タグ:
posted at 00:32:10
17対7で勝利しました。
分かりやすいしかわいいじゃん
某漫画ブームでやったきりだわw puyogo.app/rp?kf=M1RTNSYl... #ぷよ碁
タグ: ぷよ碁
posted at 00:04:26