黒木玄 Gen Kuroki(@genkuroki)/2022年04月24日

黒木玄 Gen Kuroki

@genkuroki

いいね数 389,756/311,170
フォロー 995　フォロワー 14,556　ツイート 293,980
現在地 (^-^)/
Web https://genkuroki.github.io/documents/
自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。

Favolog ホーム » @genkuroki » 2022年04月24日

« 次の日| 前の日 »

並び順 : 新→古 | 古→新

2022年04月24日(日)

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#ぷよ碁 KaTrainを使って色々調べたら、黒先で持碁(引き分け)になると思いました。

黒は正解手を打ってやっと引き分けに持ち込めるところが非常に面白いと思いました。

持碁にならないなら教えて下さい＞強い人

多分、ちょっと強い人はみんな読み切れるのでしょうが、私には無理。 twitter.com/genkuroki/stat...

タグ：ぷよ碁

posted at 00:00:28

小川　英幸 @OgawaHideyuki

22年4月24日

意志決定アルゴリズムの本。700ページ。
algorithmsbook.com/#

タグ：

posted at 00:03:33

小川　英幸 @OgawaHideyuki

22年4月24日

プログラミング言語はjulia

タグ：

posted at 00:11:24

三谷　哲也 @tetsuya469615

22年4月24日

4歳の長女が2週間の入院生活を経て、本日退院しました。
病名は【1型糖尿病】
年間3000回の注射が必要で、現在の医療では治す方法がありません。

正直、診断直後は自分の癌を知ったときよりショックでしたが、今では完全に受け入れて前向きに考えています😊

タグ：

posted at 00:16:53

非公開

タグ：

posted at xx:xx:xx

木部夏生 @natsuki_kibe

22年4月24日

@tetsuya469615 先日奥様から連絡いただきましたがまさかこんな身近で発症されるなんてとても驚いています。
いつでも相談に乗りますので、大変だとは思いますが前向きにいきましょう✨✨私の場合は発症したときに母がケロッとしてたのが結構ありがたかったです。深刻じゃないんだなと思えたので！

タグ：

posted at 00:34:55

OokuboTact　大久保中二病中年 @OokuboTact

22年4月24日

日本国債は円建てだから、返す必要はないんだけどなあ
しかし日本政府は若者向けの出産・育児や教育の費用を優先的に出すべき twitter.com/katukawa/statu...

タグ：

posted at 00:45:28

日曜数学会 @nichimath

22年4月24日

#日曜LT紹介
ルービックキューブは群論で考えることができる。一つの操作を、一つの置換とみなせるからである。数学支援ソフトウェアSageMathでルービックキューブを動かすプログラムを作り、ある操作を繰り返しもとに戻るまでの回数（群の位数）を調べてみた。
www.nicovideo.jp/watch/sm37809602

タグ：日曜LT紹介

posted at 00:46:17

高梨陣平 @jingbay

22年4月24日

Go言語に貢献するにはGMail/Googleアカウントが必須でその条件を緩めて欲しいとのissueが。

残念ながら蹴られている。CLAに必要との話 :-) CLAにはGoogleアカウントが必須。CLAは良いけどGMailoアカウントを作るのは嫌との声も :-) twitter.com/lobsters/statu...

タグ：

posted at 04:10:49

高梨陣平 @jingbay

22年4月24日

lobsterのコメントでGMailアカウントを作ってPRして終わったらGDPRを盾にPIIを全部消せとGoogleに要求すれば良いのではとの解決手段が提案されている :-)

タグ：

posted at 04:12:23

Erik Engheim @erikengheim

22年4月24日

An old story where I tried to connect lessons learned from how soldiers got trained in WW2 to modern software development. Hopefully it makes more sense than years ago when it just confused people.

#WW2 #scrum #Agile #SpaceX #Marshmallow #iterative

erik-engheim.medium.com/german-soldier...

タグ： Agile iterative Marshmallow scrum SpaceX WW2

posted at 04:20:24

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#伽藍とバザールの拡大版。

最後の題材は Developers Favoring Dynamic Typing Over Static Typing 😊

#Julia言語のエコシステムの発展にも関係していると思った。 twitter.com/erikengheim/st...

タグ： Julia言語伽藍とバザール

posted at 04:54:26

黒木玄 Gen Kuroki @genkuroki

22年4月24日

こういうのも誰か日本語に翻訳するといいかも。

タグ：

posted at 04:55:45

高梨陣平 @jingbay

22年4月24日

MIT出版の意思決定アルゴリズムの本が無料で公開されている。CC-BY-NC-ND twitter.com/newsyc100/stat...

タグ：

posted at 04:56:10

黒木玄 Gen Kuroki @genkuroki

22年4月24日

@takusansu 私は市川伸一氏と某fjという場所で数学教育について議論になったのですが、市川氏は数学が得意で数学を教えるようにもなった人達について偏見をあらわにしていたし、数学を理解することについて何も理解していなかったことは確実。そのような人物を政府が重用するようになった不思議。

タグ：

posted at 05:25:42

黒木玄 Gen Kuroki @genkuroki

22年4月24日

@takusansu ダメな人達がなぜか重用される分野は当然ダメになる。

教育政策でそれをやられちゃうと、下手すりゃ、国が滅びる。

タグ：

posted at 05:27:32

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計

 errorstatistics.files.wordpress.com/2014/08/lehm19...
Lehmann (1993) The Fisher, Neyman-Pearson Theories of Testing Hypotheses：One Theory or Two？

の「(C)条件付き推論」に関する議論の紹介の内容(添付画像の赤線部分)が酷い。これはLehmannさんが悪いのではなく、20世紀における議論が酷かったのだと思う。 pic.twitter.com/txVhBgFiim

タグ：統計

posted at 06:17:24

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計これも、統計学における抽象的一般論で道具の使い方が決まるかのような悪しき論争の一例だと考えてよいのではないかと思っています。 twitter.com/genkuroki/stat...

タグ：統計

posted at 06:19:37

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計特に酷いのは、Example 1 (Cox 1958)関連の部分。

その例1では、データが次のように生成されている状況を想定しています。

1. コインを投げる。

2. 表なら分散が小さな正規分布に従って乱数を生成し、裏なら同じ平均を持つが分散が大きな正規分布に従って乱数を生成する。

続く pic.twitter.com/goFYKPld4T

タグ：統計

posted at 06:24:58

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計そして、Neymanがなぜか統計モデルとして、コインの表裏の情報を排して、最終的な乱数値だけが得られる混合正規分布モデルを採用して、P(X≤x)という確率を考える話をしている。

そしてそうした方が長期的にはエラーの面ではよいとしている。続く pic.twitter.com/d8yEe9PaY9

タグ：統計

posted at 06:30:19

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計これ、コイントスのような抽象的な場合ではなく、「男女の違いによって効き目が全然違う可能性が高い薬」の話にしても、Neyman-Pearson流の検定をやる人が男女の区別を無視して薬の効き目の検定をするかどうか問うてみるべきだと思いました。

あまりにも馬鹿馬鹿しい。続く

タグ：統計

posted at 06:33:11

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計抽象的な設定で "long-run frequency of errors" なんてものを一般的に考えても、統計学的道具の適切な使い方が出て来るはずがない。

目的に合わせて常識的に科学的な判断をできなければ、統計学の道具をまともに使うことが無理だし、統計学の権威の悪用になって社会的にも大迷惑。続く

タグ：統計

posted at 06:36:15

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計前もって有意水準を決めて十分高い検出力を確保するためのサンプルサイズも決めて行われるNeyman-Pearson流の検定においても、「"long-run frequency of errors" を優先するために、薬の効き目が男女で(もしくは他の要因によって)異なる可能性を無視する」などと言ったら、普通は馬鹿扱い確定。

タグ：統計

posted at 06:40:13

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計条件付き推論についてFisher流とNeyman-Pearson流の比較をフェアに行いたいならば、ノータイムで馬鹿扱いが確定してしまうような考え方をしているかのように見える設定を慎重に排除するべきでした。

私には全然そうなっていないように見える。

タグ：統計

posted at 06:42:23

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計そして、それとは別の例2の2つの二項分布で記述される分割表の統計モデルについても、片方のマージンだけではなく、両方のマージンを固定した条件付き確率分布に移るか否かの話が、上で紹介した例1の場合と似ていると述べている点もかなり酷い。続く

タグ：統計

posted at 06:45:58

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計例1は分割表の状況では以下のような場合に対応しています。

例1は、男女別にサンプルサイズが固定されていて、薬が効いた人数と効かなかった人数が記述されている分割表で、男女の区別をなくして、男女の合計のみを見て検定を行うか否かの話に似ています。(ひい！😭)

続く

タグ：統計

posted at 06:50:12

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計添付画像2から3の例2に関する議論は、上と同じ状況で、すでに固定されている男女それぞれのサンプルサイズだけではなく、薬が効いたか否かの男女合計の人数も固定した条件付き確率分布に移って検定を行わなければいけないか否かの話です。

続く pic.twitter.com/rj1C0AC920

タグ：統計

posted at 06:53:55

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計こういう具体的な状況で普通に科学的に常識的に考えれば、以下の結論が出るでしょう。

* 薬の効き目に影響があるかもしれない条件付け(層別化)を無視してはいけない。

* 分割表の独立性検定で、両方のマージンが全て固定された統計モデルの採用を強制することは誤りである。

続く

タグ：統計

posted at 06:57:50

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計ちなみに、例2の中で引用されているFisherさんの弟子のYatesさんの1984年の論文の内容は酷くて、最初の節の終わりから2番目の段落に、分割表の独立性のχ²検定は条件付き確率分布を使う検定(conditional test)だという明瞭な誤りが書いてあります。

さすがにこれはありえないほど酷い誤り。

タグ：統計

posted at 07:06:17

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計私が誤解していなければ、Yatesさん的に酷い誤解は普遍的。

なぜか、分割表の独立性検定では(Yatesさんの場合にはχ²検定であっても)マージンを全て固定した統計モデルの採用を他人にも強制したいと思っている人達がいるように見える。

かけ算順序を他人に強制したい人達に似ていると思う。

タグ：統計

posted at 07:10:07

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計現在、2×2の分割表は疫学的な統計学の応用でよく使われていると思います。そこでは、数学的な精緻さよりも、交絡要因の制御の方が大問題であり、両方のマージンを固定するべきだというような考え方が意味を持つとは全く思えない。

タグ：統計

posted at 07:12:25

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計他にも色々不思議なことがあって、例えばp≠0.5の二項分布のように非対称な離散分布における両側検定のP値の定義として、「片側確率の2倍」を採用することを他人に強制したいと人達もいるように見える。信頼区間で言えば、Clopper-Pearsonを採用し、Sternはダメだと言っているのと同じ。酷い。

タグ：統計

posted at 07:16:23

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計かけ算順序への自分のこだわりを他人に押し付ける算数の先生たちが社会的に大迷惑な存在だるのと同じように、統計学の道具の選択に関する妙な主義を他人に押し付けようとするのも大迷惑だと私は思います。

もっと穏健にトレードオフの話をした方がよいといつも思っています。

タグ：統計

posted at 07:18:54

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計例えば、分割表でのFisher検定には、条件付き確率分布に移ることによって、確実に第一種の過誤が起こる確率を名目有意水準以下にできるメリットと、その確率が小さくなり過ぎて、検出力が落ちるというデメリットがある。χ²検定ではこれが逆になります。

トレードオフで考えればよい。

タグ：統計

posted at 07:22:39

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計全マージンを固定しないと安心できない奇妙な人達を除けば、分割表のχ²検定はFisher検定の近似以外の方法(Wilksの定理)からも導出されるので、「サンプルサイズが小さい場合にはFisher検定は正確だが、その近似のχ²検定はひどく不正確になる」という主張は間違っていることになります。

タグ：統計

posted at 07:28:33

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計この辺は、大学の講義なんかでも、昔からある「常に条件付き確率分布に移らなければいけない」とする不合理な考え方が原因の主義の悪影響のせいで、間違った考え方が教えられている場合が結構あると思われます。

講義をする人達は自分の誤りを明示的に認めることが大事。

タグ：統計

posted at 07:31:30

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計統計学は、最終的に具体的数値をバシっと出す必要があるせいで数学的にややこしくなりがちで、さらに具体的な応用場面ごとに分野固有の落とし穴が色々ある。

大学で講義する側も完璧に間違いを犯さずに済ますのは困難だと思います。

タグ：統計

posted at 07:34:16

CoffeeCup @coffeecup2018

22年4月24日

掛け算の順番に意味などない。3個のまとまりが4セットある状況は3×4と表現されるという勘違いからくる誤謬。この偽りを小学生に教え込んで憚らない算数教育は罪深い。 twitter.com/mahojng_sensei...

タグ：

posted at 10:44:20

@kankichi57301 @kankichi57301

22年4月24日

×単元で教える重点
○単なる初っ端 twitter.com/mahojng_sensei...

タグ：

posted at 11:15:32

kパパの仙台おでかけ @sendaiodekake

22年4月24日

遊園地日和！
子供二人とも小学生になったので、初めてベニーランドに来ました！ pic.twitter.com/pHVopc2RHQ

タグ：

posted at 11:30:46

ぽこきち（囲碁のゆっくり実況・解説動画 @pokokichi_fox

22年4月24日

囲碁が楽しいと思えるかって、誰に教わるか、誰と打ったかに懸かってる気がする。入門、初心者の頃に、優しい人に教わったり、打ってて（というより打った後かな？）楽しい人と打てたら、もうモチベ爆上がりですよねー😆

タグ：

posted at 11:41:02

名取宏（なとろむ） @NATROM

22年4月24日

ご指摘の通りで、甲状腺がんと診断されることは、手術せずに積極的監視されるとしても、経済的負担がかかります。また、それだけではなく、手遅れになるのではないか、次の検査では進行しているのではないかという心理的な不安をもたらします。この害を無視するべきではありません。 twitter.com/yksplash_ina/s...

タグ：

posted at 11:57:56

名取宏（なとろむ） @NATROM

22年4月24日

手術してしまうよりもおそらく害は小さいとは言え、積極的監視は検診に伴う害の一つです。そう考えれば、検診の害を過小評価し、「過剰診断のがんは手術せずに経過観察するから大丈夫」として検診を推進するほうが「鬼畜」と言えなくもありません。

タグ：

posted at 11:58:50

名取宏（なとろむ） @NATROM

22年4月24日

検診を推奨するならそうした積極的監視をはじめとした検診に由来する害以上に、検診から利益が得られなければなりません。甲状腺がん検診に、害以上の利益があることは示されていません。害以下の利益もあるかどうかすらわかっていません。

タグ：

posted at 11:59:13

井上純一（希有馬）新刊『逆資本論』発売中 @KEUMAYA

22年4月24日

消費税上げ続けて史上最長の失敗し続けてんだから、普通「一回ぐらい下げて様子見よっか？」ってならないか？

タグ：

posted at 12:01:53

kパパの仙台おでかけ @sendaiodekake

22年4月24日

ベニーランドはうみの杜水族館の年間パスを持っていると1人100円引きになります。
ただしPayPay支払いの人は割引対象外という謎ルール😭

タグ：

posted at 12:01:59

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計リンク先発言だと、対照群がなくなっちゃう。

対照群との比較のための2×2分割表が男女別に2つ作られている設定で、男女を合計して1つの2×2分割表にしてしまうか否かが例1の話に対応し、2つの2×2分割表のマージンが全て固定されているモデルに移るか否かの話に例2は対応。全然違う話。 twitter.com/genkuroki/stat...

タグ：統計

posted at 12:36:52

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計 Yates (1984)はこれ → rss.onlinelibrary.wiley.com/doi/abs/10.230...

私はこれは酷い内容だと思っています。添付画像のように2×2の分割表のχ²検定がconditional testだとされている。これじゃあ、お話にならない。

Fisher検定の過剰な保守性とそうではないχ²検定のフェアな比較をできない。 twitter.com/genkuroki/stat... pic.twitter.com/cBhFKQkieT

タグ：統計

posted at 12:54:36

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計 2×2の分割表の統計モデルを

(1) 4つのPoisson分布の積
(2) 多項分布(4項分布)
(3) 2つの二項分布の積

のどれにしても、マージンを全部固定した条件付き確率分布を経由せずにスコア検定としてPearsonのχ²検定は出て来ます。χ²検定は条件付き確率分布の正規分布近似が粗過ぎる場合にも有効。

タグ：統計

posted at 13:01:37

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計 2×2の分割表の統計モデルの条件付き確率分布を全てのマージンを固定して作るときに固定されるのは、実験観察で固定できない量であり、何か科学的に意味のある条件付けではありません。例えば男女や年齢のような条件で条件付けるのとは全然違う。

タグ：統計

posted at 13:04:47

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計もちろん1つの考え方として、nuisance parameterを除去しながら、第一種の過誤の確率を確実にα以下にする処方箋として、条件付き確率分布に移ることの有効性はある。

しかし、それは単なる処方箋の1つに過ぎません。

タグ：統計

posted at 13:07:43

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計余談：条件付き確率分布に移って、さらに検定を「データごとに帰無仮説を棄却する確率を与える」というスタイルで定義すれば、不偏検定の中で一様最強力なもの(UMP unbiased)を作れます。Fisher検定はそういうものではありません。この点も誤解している人がいる感じ。

タグ：統計

posted at 13:12:00

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計そもそも、検定法への不偏性の要求は、実用的な統計学的道具を作るためには強過ぎると思います。

さらに、データごとに棄却確率を与えるということは、同じデータであってもルーレットの出目によって棄却するか否かを変えるということで実践的には意味がない。

タグ：統計

posted at 13:16:10

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計どうしても全てのマージンを固定したい人達は、Fisher検定のP値を補正して少し小さくする処方箋(mid-P補正)を勧める場合もありますが、Fisher検定での過剰な有限性の問題は解決しないし、補正無χ²検定と比較しても大してメリットがあるわけでもない。計算を複雑にするデメリットも気になります。

タグ：統計

posted at 13:21:35

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計抽象的な一般論をどんなにしても道具の適切な使い方は決まらず、各分野固有の知識が重要な点に配慮して、「AにもBにもCにもメリットとデメリットがあるよね」という穏健でフェアな議論をできない人達による「論争」が20世紀の統計学史では結構目立っていると思います。

タグ：統計

posted at 13:24:41

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計他にもYatesさんは、非対称な確率分布の統計モデルでの両側検定のP値が欲しければ、片側確率の2倍を採用するべきだと述べています。それは個人の考え方に過ぎず、そうしなければいけない理由はないのにそう述べている。

この辺も余りにも不合理で過激な意見でびっくりしてしまいます。 pic.twitter.com/dEQHmK2RCS

タグ：統計

posted at 13:44:53

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計両側検定のP値の構成と通常の信頼区間の構成は数学的には同等です。

Yatesさんのように「片側確率の2倍」を使うと二項分布モデルでは古典的なClopper-Pearsonの信頼区間が得られます。しかし、CPの信頼区間はSterneの信頼区間より無駄に広くなることが多いという欠点がある。

タグ：統計

posted at 13:48:10

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計個人的な意見では、Yatesさんの1984年の論文は無用な思い込みにこだわるYatesさんが追い込まれたことが原因で書かれた反論の論文なのでしょうが、結果的に、無用な思い込みが実際に酷かったことの証拠を後世に残してしまいました。

タグ：統計

posted at 13:50:34

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計「AにもBにもCにも利点と欠点があるよね」で済ませておけば穏健でフェアでありえたのに、それとは全然違う方向に行ってしまった。

現実にはそういう全然違う方向に行った人達による思い込みの拡散は21世紀現代でも影響力を持っています。

私には結構大問題のような気がします。

タグ：統計

posted at 13:53:15

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計 Yatesさんによる分割表のχ²検定のP値の連続性補正が実は片側確率の2倍版のFisher検定のP値をよく近似します。

そういうこともあって、Yatesさんは「両側検定のP値は片側確率の2倍にするべきである」と強調したのでしょうか？(フォントが斜体になっていた)

タグ：統計

posted at 14:03:38

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計さらについでに述べておくと、#R言語のfisher.testが表示するP値は、Yatesさんが勧める片側確率の2倍で計算されるP値(Clopper-Pearson型信頼区間に対応)ではありません。Sterne型信頼区間に対応するP値になっています。しかし、表示する信頼区間はCP型。

タグ： R言語統計

posted at 14:07:00

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計個人的に「かけ算の式の順序は単価×数量であるべきある」という主張と、Yatesさん的な主張は非常に似ていると思います。

「AでもBでもよい。あなたの目的に合わせて自由に選んで使ってね」で済ませてしまうと都合が悪くなってしまうようなことを人生を賭けて強弁していたように見える。

タグ：統計

posted at 14:10:16

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計どのような条件付けを仮定して検定を行うか、両側検定のP値をどういう流儀で定義するか、は一般論では決まらず、一般論で分かることはそれぞれの流儀の利点と欠点(もしくはさらにニュートラルに単なる性質)だけです。

そして、悪くない状況ではどの流儀を採用しても大差ない。

タグ：統計

posted at 14:14:02

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計この分割表の独立性の検定法に関する無用な論争の結果は、分割表の独立性の検定に関する無用に複雑なルール(コクランルール)の高等教育での普及です。

実際には多くの場合に無用な保守的なルールなのに、従っていないと論文の査読者に文句を言われる地獄が発生しているようにも見える。

タグ：統計

posted at 14:17:48

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計分割表の独立性のχ²検定については、論文の査読者に「かけ算の順序でバツをつけられる」のと似たようなことが起こっているのではないか？

タグ：統計

posted at 14:19:04

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計現代の日本語圏での悪影響の存在を示す事例

www.snap-tck.com/room04/c01/sta...

両側検定のP値は片側確率の2倍にするべきだと信じ過ぎて、#R言語のfisher.testなどの仕様について「この特殊な両側有意確率を求める方法に製薬企業が飛びつき、やがてそれがR等の統計ソフトにまで採用」とまで言っている。 pic.twitter.com/Cs01ZArTwz

タグ： R言語統計

posted at 14:32:44

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計「この特殊な両側有意確率を求める方法」とは、Sterne型の信頼区間を与えるP値の定義のことです。

原論文Sterne (1954) www.jstor.org/stable/2333026 はClopper-Pearsonの信頼区間よりも被覆確率の指標で優っていることを主張しており、その内容も合理的です。

タグ：統計

posted at 14:39:27

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計

 #R言語のfisher.testの仕様の不合理な点は、P値の定義としてSterne型を採用したことではなく、P値はSterne型で信頼区間はClopper-Pearson型にしたせいで整合性が失われていることです。exact2x2パッケージではその欠点が訂正されています。しかもP値函数もプロットしてくれる。 twitter.com/genkuroki/stat...

タグ： R言語統計

posted at 14:43:27

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計現代では優れた人達が #R言語のexact2x2のようなパッケージを開発してくれて、妙なこだわり抜きに複数の方法を整合性を保ちながらユーザー側が自由に選べるようになっている。

代替案はこういうパッケージによってすでに実現されており、そちらを普及させればよいと思います。

タグ： R言語統計

posted at 14:46:23

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#数楽特別な場合を特別な方法で処理できることも立派な教養。しかし、過剰適応はアウト。

例えば「その極限を求めるにはロピタルの定理を使えば簡単」と言われたら類似の問題でロピタルの定理を使うと悲惨な計算になる問題を出して、「これ暗算で解けますよね」と言う。

数学はこの意味で教え易い。 twitter.com/f_sei/status/1...

タグ：数楽

posted at 16:29:30

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#数楽オーバーフィッティングが疑われる反応のパターンがはっきりしているなら、そういうのをぶっ潰すための問題を前もって準備しておけばよいと思います。

おかしな考え方を潰すために具体的な問題をリアルタイムで考案してぱぱっと出せれば強い。

百聞は一見に如かず。具体的問題が有用。 twitter.com/f_sei/status/1...

タグ：数楽

posted at 16:34:12

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計 2つに分けられた2×2の分割表については、Simpsonのパラドックスの原論文(1951) math.bme.hu/~marib/bsmeur/... の例が面白いです。

個別の事情に配慮せずにデータの数値だけを見て分析することには意味がないことがよく分かる例になっています。

続く twitter.com/genkuroki/stat...

タグ：統計

posted at 20:14:18

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計添付スクショはウィキペディア ja.m.wikipedia.org/wiki/%E3%82%B7... より

2つに分けられた分割表は以下の通り

M群
　 A B
良 4 8
悪 3 5

F群
　 A B
良 2 12
悪 3 15

M群でもF群でも、Aの側が良である割合が高い。続く pic.twitter.com/zkxfNzrg0L

タグ：統計

posted at 20:14:23

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計 2つの分割表をまとめると

　 A B
良 6 20
悪 6 20

になり、全体ではAかBかは良の割合に無関係になる。

さて、こういうケースでの正しい統計分析は、

2つに分けた分割表のまま扱う

と

1つにまとめてしまう

のどちらなのだろうか？

続く

タグ：統計

posted at 20:14:24

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計 Simpsonさんが論文で言いたかったことは、「上に挙げたデータの数値だけを見ても、どちらが正しいかは決まらない」ということです。

現実の統計分析では上に挙げたものよりも圧倒的に複雑なデータが登場します。現実のデータに関する特別な知識がなければ、正しい統計分析は不可能。続く

タグ：統計

posted at 20:14:25

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計例えば、A=治療有、B=治療無で、

男性
　　 A B
生存 4 8
死亡 3 5

女性
　　 A B
生存 2 12
死亡 3 15

で、治療の効き目を知りたい場合には、男性と女性に分けたままにしておかなければいけないと普通は考えるだろう。続く

タグ：統計

posted at 20:14:25

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計しかし、トランプの52枚について、

A=絵札、B=非絵札

で赤ちゃんが特に絵札の方に興味を持って触った場合の

赤ちゃんが触って汚れたカード
　 A B
赤 4 8
黒 3 5

汚れていないカード
　 A B
赤 2 12
黒 3 15

で、絵札であるか否かで赤札になる割合がどう変わるを知りたい場合には～続く

タグ：統計

posted at 20:14:26

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計続き～2つの分割表を分けたままにして、「汚損しているカードでもそうでない側でも、絵札であれば赤である割合が高い」と言ったとしても、それ自体は正しいのだが、それが本当に知りたいことではないだろう。

タグ：統計

posted at 20:14:27

黒木玄 Gen Kuroki @genkuroki

22年4月24日

#統計以上で紹介したSimpsonのパラドックスの言論文の例は、現実で統計分析をするときに注意するべき普遍的な事柄を分かりやすく伝えてくれています。

こういう話と、Lehmannさんが紹介した例1と例2の話を比較すると、その例1、例2の話の不毛さが際立つように思えます。

タグ：統計

posted at 20:17:56