黒木玄 Gen Kuroki(@genkuroki)/2019年11月21日

そうか，「このウソつき！」ではなく「どうして事実ではないことを言うんですか？」と言えば，そうそう名誉毀損とかにはならんわな。中身は同じやけど。

タグ：

posted at 00:19:51

Juliaのメモリプロファイリングは--track-allocationオプションを使って実行して，どの部分でメモリのアロケーションが起きてるのかを知るのが基本。
ただし関数のJITコンパイルコストも加算されちゃうので，Profile.clear_malloc_dataで実行語一度キャンセルするのを忘れず。
docs.julialang.org/en/v1/manual/p...

タグ：

posted at 00:39:42

実行語→実行後

タグ：

posted at 00:40:18

Juliaの今のメモリプロファイラ若干使いづらいんだけど，新しい仕組みが開発中なので，これが入ると使いやすくなると思う。
github.com/JuliaLang/juli...

タグ：

posted at 00:47:31

たまにはJuliaアイドル活動しないとな。

タグ：

posted at 00:47:51

カラサワ @cxp02120

三原氏といい村中璃子氏といいワクチン推進派はなんでこうケンカ腰の人が多いのだろうか、いらぬ争いを生むではないか、と思っていたのだが、反ワクチン派の個人攻撃の酷さを見るに至り、ああこれはこういう性格でないと務まらんわ、と考えを改めた。
www.buzzfeed.com/jp/naokoiwanag...

タグ：

posted at 01:23:09

@ohtani_shun

確率解析の技法、再び改訂しました。@sasaburo さんとのディスカッションを踏まえ、定理3.2・ファインマンカッツの証明を修正、鏡像原理の加筆、その他軽微な記載修正を行いました。（注意：旧版のリンクと違います）
drive.google.com/file/d/1wPQ7qT...

タグ：

posted at 01:31:56

非公開

タグ：

posted at xx:xx:xx

非公開

タグ：

posted at xx:xx:xx

非公開

タグ：

posted at xx:xx:xx

@jumping5555 私も当時、同じことを漏れ聞きました。国大協、全高長、私立中高連の会長を呼んだ勉強会だったと。それが事実なら下村氏はメディアに虚偽の説明をしたことになる。「100%ない」も嘘だったし、証拠が出てきたら今度こそ辞任てすね。
twitter.com/kitspeakee/sta...

タグ：

posted at 05:28:17

@jumping5555 これについてもまた、万一、岡入試委員長が下村氏をかばうような発言をするなら、実現不可能な制度の導入を強行しようとして土壇場で延期、受験生を極度に混乱させたことについて、下村氏や遠藤氏と国大協、東大は共犯。社会的な制裁を受けて当然と思います。

タグ：

posted at 05:35:53

@jumping5555 一方、宮本全高長会長(当時)はどの議事録を読んでも早くから地域・経済格差等の問題を高校(生)の立場から訴えておられる。万一4/13の会でも同様のことを述べられているなら、同じ場で席を連ねながら、強行のために「東大の指導」を文科省幹部に命じ国大協にもプレッシャーかけた下村氏の罪は尚更重い。

タグ：

posted at 05:47:48

資料：ミュートしていたのでクリックして読んだ。ミュートしておいて良かった。怖い。 twitter.com/genkuroki/stat... pic.twitter.com/nSoK8A0o5o

タグ：

posted at 06:14:51

#統計ベイズ統計の主観確率の解釈では、事前分布は主観で決まるものであり、ベイズ統計では主観のもとでの主観的リスク最小化を扱うと考える。しかし、その主観によって、現実世界における予測が外れたり、現実と合わないモデルが構築されたりするリスクは考慮しない。

twitter.com/genkuroki/stat...

タグ：統計

posted at 06:32:34

辻仁成 @TsujiHitonari

マドモアゼル、という呼び方が行政の場で使えなくなった。性差別にあたると抗議されて。そうか、そうきたかと驚いたが、マダムとムッシュにあたる呼び方って日本だとなに？おばさん、おじさん？日仏のこの老若男女の呼び方の差にふかーく考えさせられた。

今日の日記です。

www.designstoriesinc.com/jinsei/dairy-3...

タグ：

posted at 06:48:40

GIGAZINE(ギガジン) @gigazine

「耳鳴りを抑える方法」が偶然にも車酔い軽減デバイスの研究中に発見される
gigaz.in/2D2tesc

タグ：

posted at 07:00:14

#統計統計学入門書によくある母平均の信頼区間を正規分布モデルを使って計算する方法がどれだけの場合に有効であるかは非自明な問題。

母集団分布が正規分布でなくても、正規分布に適切な意味で(その意味は非自明な)近ければ、正規分布モデルで計算した母平均の信頼区間も結構信頼できます。続く twitter.com/genkuroki/stat...

タグ：統計

posted at 07:25:30

#統計しかし、小サンプルでは見逃す可能性が高い正規分布からの大きなずれがある可能性があると、正規分布モデルによる信頼区間は信頼できないものになります。

例えば、母集団中の小部分集団が飛び離れて高い得点を得ている場合には、正規分布モデルによる平均得点の信頼区間は信頼できなくなる。

タグ：統計

posted at 07:25:34

#統計あと、中心極限定理に代表されるサンプルサイズ→∞での極限(漸近挙動)を使う場合には、有限のサンプルサイズでの誤差の大きさを確認しておく必要があります。これも結構非自明な問題。

2×2の分割表の独立性検定や信頼区間のプログラムを自分で書くときにはついでにその辺の計算もするとよい。

タグ：統計

posted at 07:30:29

#統計実装過程では、プロットによって間違ったことをやっていないことを確認しながら先にすすむのですが、2×2の分割表のサンプルを縦横の合計を固定して生成すると(例えばrand(Hypergeometric(ns,nf,n), L)で生成)、縦横の合計の固定が可能な分割表の種類の数を大幅に減らす感じがよくわかります。

タグ：統計

posted at 07:34:30

#統計そして、実際に計算してみれば分かることですが、Fisher's exact testを縦横の合計が固定されていないサンプル達に適用するとサンプルサイズを200程度に増やしても誤差が大きなままであることもわかります。全然、exactではない。exact testという名の検定であっても、exactでないことは普通。

タグ：統計

posted at 07:40:11

#統計現代の我々はコンピューターでものすごく気楽に色々計算できてしまうのですが、30年前には今ほど気楽に計算できなかった。

だから昔に書かれた統計学の文献には実際に計算していればそういう書き方はできなかったと思われる説明がよく書いてあるという印象がある。

タグ：統計

posted at 07:58:51

#統計 2×2の分割表の独立性のFisher's exact testやχ²検定のYates補正に対する厳しい批判の論文は1970年代の終わり頃から増えたという印象がある(ど素人なのでググった印象)。内容的にも「コンピューターで計算したら誤差が驚くほど大きい」という内容。

タグ：統計

posted at 07:58:54

#統計「Fisher検定とYates補正のコンピューターで計算したら誤差が非常に大きい。補正無しのχ²検定の方がまし」という批判に対するYatesさんの論文(1984)にある反論を読んだら、「χ²検定も縦横の合計を固定するconditional testである」という誤解に基いた議論が書いてあった。 twitter.com/genkuroki/stat...

タグ：統計

posted at 08:07:44

#統計 Fisher's exact testが特にその使用が推奨されている小サンプルで大きな誤差を持ち、補正無しのχ²検定は意外に頑健であったという計算結果は何十年も前から論文として出版されていて、Yatesさんは1984年に反論の論文を書いています。

その反論の論文は致命的な誤りを含むのですが～続く twitter.com/urotauyoshiuso...

タグ：統計

posted at 08:12:47

#統計しかもYatesさんの誤りは論文と同時に出版されたコメントでもしっかり指摘されていた。 twitter.com/genkuroki/stat...

タグ：統計

posted at 08:18:08

#統計ところが、相当に痛い誤りを指摘しているコメントとともに出版されたYatesさんの1984年の論文は、2009年には "a long and detailed defense of the exact test" として引用されていたりする。

こういう感じになっているので、論文にするかどうかの問題では無くなっている様子がよくわかる。 twitter.com/genkuroki/stat...

タグ：統計

posted at 08:24:00

#統計実際にFisher's exact testが使用されそうなケースに関するコンピューターによる計算結果を、実務でFisher's exact testを使いたい人達にとっては絶対に無視できないはずなのですが、そういう計算に基いたFisher's exact testへの批判論文によってダメージを受けない無敵の人達がいるわけです。

タグ：統計

posted at 08:29:20

#統計そういう無敵の人達の相手をするのは正直辛い。

すでに紹介したように日本語圏でも、実際にFisher's exact testが使われそうなケースに関するコンピューターでの計算結果に基いてフェアな判断をすることを統計学教育で実践している人達がいます。

そういう流れが強まると良いと思います。

タグ：統計

posted at 08:33:18

optical_frog @optical_frog

「○○派は××と言っていた」とツイートするときには，できれば「たとえばこの人が言っていた」と付け足してほしいし，欲を言えば出典/リンクをつけてほしい．flipoutcircuits.blogspot.com/2014/09/blog-p...

タグ：

posted at 08:37:09

#統計実際の計算に基いたFisher's exact testと補正無しのχ²検定の比較をしている日本語の文献の例1 twitter.com/genkuroki/stat...

タグ：統計

posted at 08:38:31

#統計実際の計算に基いたFisher's exact testと補正無しのχ²検定の比較をしている日本語の文献の例2 twitter.com/genkuroki/stat...

タグ：統計

posted at 08:40:10

#統計以上で述べたことが臨床研究を阻害しているとしたら、ひどい話ですね。

統計学がらみのひどい話の多くはFisherさんの強い権威に繋がっていることが多いと思う。(ベイズ統計の研究も遅らせた疑いあり。主観確率とか言わずにすむまともなベイズ統計の研究は相当に遅れたと思う。)

タグ：統計

posted at 08:45:08

optical_frog @optical_frog

誰がどこで言っていたか定かじゃないなら，自分で［要出典］ってつけてもいいし，なんなら，最初からツイートしなければいいのよ．だいいち，その方がラクだ．

タグ：

posted at 08:49:25

松岡亮二・早稲田大准教授：問題の根本は、これまでの「教育改革」が、データの蓄積や分析なしに、「これからはグローバル時代だ」といった理念で進められてきたこと。← 同意！「理念」というよりむしろ「妄想」と思うが。
www.asahi.com/articles/ASMC5...

タグ：

posted at 10:40:25

竹内洋・関西大学東京センター長：近代の日本には全国で優秀な人材を育成するという理念がありました。戦後も各都道府県に国立大学が置かれ、広く人材を育てる伝統は受け継がれました。しかし今はそれが崩れ、東京と地方では「身の丈」が違う社会になってしまいました。

タグ：

posted at 10:46:17

←東京都の生徒は都の受験料負担で英語民間試験を受け，高校入試へのスピーキングテスト導入も都の予算で。
www.tokyo-np.co.jp/article/nation...
大阪府立大と大阪市立大に入学する年収590万円未満の世帯の府内在住学生・院生には入学金と授業料が免除される。
www.sankei.com/west/news/1911...

タグ：

posted at 10:54:17

地方の生徒，学生・院生は？その格差を埋めるのが国の役割ではないのか？

タグ：

posted at 11:04:21

Shosh Vasserman @shoshievass

Anyone have examples of mixing R/Python and Julia that they'd be willing to share? I'd love to see some examples of workflow.

タグ：

posted at 11:46:47

Oricquen @oricquen

昔は貧乏な家の子の方が体力があるイメージがあったが / “世帯格差が子どもの体力低下にも繋がっている | ワールド | 最新記事 | ニューズウィーク日本版オフィシャルサイト” htn.to/2R1YWtAsgT

タグ：

posted at 12:19:00

#統計 15個上のツイートから引用【例えば、母集団中の小部分集団が飛び離れて高い得点を得ている場合には、正規分布モデルによる平均得点の信頼区間は信頼できなくなる】

コンピューターによるそうなる場合の計算例が次のリンク先にある。小サンプルでは一部の例外を補足できていないかもしれない。 twitter.com/genkuroki/stat...

タグ：統計

posted at 12:40:54

#統計母集団中の5%の例外をサイズ30のサンプルが1つも補足できていない確率は21%程度。母集団中の5%の例外を1つも補足できない確率を5%未満にするためには、サンプルサイズを59以上にする必要がある。1%未満にするためには90以上にする必要がある。

タグ：統計

posted at 12:50:44

#統計一般に、母集団分布の細かい構造を補足するためには大きなサンプルサイズが必要になる。サンプルサイズを大きくして行くと「解像度」が上がって行く。ピンボケからクッキリへ。

タグ：統計

posted at 12:50:51

Keno Fischer @KenoFischer

Can I train an actual MNIST #fluxml model in #julialang and then run it on encrypted images using #homomorphicencryption? Why yes, yes I can! Fairly efficient too - less than a minute for a batch of 64 and lots of known optimizations left on the table. Blog post coming up! pic.twitter.com/QPH3ZSZclp

タグ： fluxml homomorphicencryption julialang

posted at 13:42:56

Ishida the Brain Dam @tbs_i

黒木さんがやってるような議論はこの本でもやってる。この本では最終的に全部対数オッズ比の尤度比検定で良いとしてる。まあχ二乗と似たようなもんだから実質同じ結論。

分割表の統計解析: 二元表から多元表まで (統計ライブラリー) www.amazon.co.jp/dp/4254128398/... twitter.com/urotauyoshiuso...

タグ：

posted at 16:04:53

名取宏（なとろむ） @NATROM

松本俊彦先生は薬物依存症の専門家。「松本クリニック・松本浩彦院長」は、医師ではあるけど、ぜんぜん専門家でもなんでもない。デイリースポーツが非専門家の話から【専門家の目】と称して安易に記事をつくったのが問題。 twitter.com/tabitora1013/s...

タグ：

posted at 16:14:43

Massimo @Rainmaker1973

An interesting take on tensegrity where one heavy wire frame seems mysteriously suspended above another. This configuration is related to the concept of tensegrity invented by Kenneth Snelson and made famous by the architect Buckminster Fuller in 1949 buff.ly/349NSm6 pic.twitter.com/R4Zj4k4Vza

タグ：

posted at 16:22:30

irf:.t @nfdrtcknl7sl3ut

@kyoshimine お化粧もたぶん肌荒れとかの原因になってると思います。

タグ：

posted at 16:33:30

Roger Luo 罗秀哲 @rogerluorl18

Using #YaoFramework to prove this weight-9 error can be corrected by Shor’s code in #JuliaLang #QuantumComputing pic.twitter.com/v59RkSpgLv

タグ： JuliaLang QuantumComputing YaoFramework

posted at 16:34:24

Roger Luo 罗秀哲 @rogerluorl18

need master branch however, like add Yao#master in your pkg mode. But next release is coming soon after my finals!

タグ：

posted at 16:38:42

Roger Luo 罗秀哲 @rogerluorl18

And the syndrome! pic.twitter.com/101t5UrGlF

タグ：

posted at 16:40:22

「行列」の訳語の由来については
「行列（matrix）」の歴史的由来について
togetter.com/li/648684
参照

タグ：

posted at 17:00:29

Determinanteの用語は確かにGaussに依る
twitter.com/sugar_underkey...
のだが，連立一次方程式ではなく，2次形式に対して定義している：
歴史的著作"Disquisitiones arithmeticae" 1801
archive.org/details/disqui...

タグ：

posted at 17:02:55

中村正弘氏（おそらく推理作家の天城一）の言葉を疑ってはいないが，私は藤原松三郎が高木貞治以前に「行列」という言葉を使った文献を知らないし，高木が「方列」という訳語を使ったものを知らない。時間ができれば探してみたい。貴重なお話：
twitter.com/oto_oto_oto/st...

タグ：

posted at 17:12:00

運小次郎＠新党「ペンギンの生活が第一」 @hseino1

久々に気合いの入った（覚悟を決めた？）NHKの報道。くまモン見て喜ぶ学長たちは恥ずかしくないのか。金で自大学の受験生を売ったも同然。
www3.nhk.or.jp/news/html/2019...

タグ：

posted at 18:58:43

森田知宏（医師） @moritatomohiro

福島県漁連会長がおしどりマコ氏やグリーンピースとつるんでいるのって、なんかの悪い冗談か？（・・？）

おしどりマコ氏やグリーンピースは風評加害者だお。悪いことは言わない。今からでも手を切ったほうがいい。

タグ：

posted at 19:35:54

なんとなく続けられている福島県での甲状腺検査ですが、私はもう中止した方がいいと思っています。
考えていることをシノドスさんがまとめて下さいました。

【SYNODOS】福島県の甲状腺検査は一刻も早く中止すべきだ――森田知宏氏インタビュー／福島レポート編集部 synodos.jp/fukushima_repo...

タグ：

posted at 19:50:40

#統計文献紹介

「Lehmannの本でFisher's exact testはUMP (uniformly most powerful) unbiasedであることが証明されている」と主張する専門家達が存在する謎の解明。

その主張は誤り。

E.L.Lehemann, Testing Statistical Hypotheses, 2nd ed., 1986 を見ると、そのようには書かれていない。続く pic.twitter.com/K1IpxLcKLS

タグ：統計

posted at 20:25:21

#統計 Lehmannさんは、Fisher's exact test (以下、Fisher検定)がUMP unbiasedであるとは言っていません。

UMP unbiased testを作るためには、同一のサンプルであっても仮説がある確率で棄却されたりされなかったりする必要があると言っている(ランダム化)。それは受け入れ不可能なので～続く pic.twitter.com/4FTqWEVcWc

タグ：統計

posted at 20:37:30

#統計続き～、ランダム化を行わない検定=Fisher検定が使われていることを説明しています。

さらに、Yatesの連続性補正を行わないχ²検定ならば、

* 有意水準αで第一種の過誤が起こる確率がoverallでαに近くなる

という事実や～続く pic.twitter.com/4hdHcNg4pm

タグ：統計

posted at 20:37:37

佐々真一 @sasa3341

明日、「研究者の皆さん！うまくいかなかったこと、うまくいってないこと、聞かせてください」というイベントをします。詳しくは、添付pdf を。www.ton.scphys.kyoto-u.ac.jp/~sasa/macsflie...

タグ：

posted at 20:40:55

#統計続き

* Fisher検定では、有意水準αで第一種の過誤が起こる確率がαよりずっと小さくなりがちで、検定力も弱い

* 有意水準αで第一種の過誤が起こる確率がoverallでα以下になる検定(consevative test)で、Fisher検定よりある意味でましなものも提案されていること

もしっかり書かれています。 pic.twitter.com/gP1gfYqXC5

タグ：統計

posted at 20:41:14

#統計 Yatesさんの1984年の論文の手痛い誤りを指摘しているFienbergさんはLehamannさんの本の1956年版を引用して、Fisher's exact testはuniformly most powerful unbiasedであると主張していますが、この部分の議論の仕方は間違っています。 twitter.com/genkuroki/stat...

タグ：統計

posted at 20:46:08

佐々真一 @sasa3341

１１月祭のときのイベントは、１９才のときに理学部大講義室で広中平祐さんの講演会をしたとき以来かな・・。（僕は広中さんの交渉と講演会の司会を担当。）

タグ：

posted at 20:54:27

#統計 HavilandさんによるFisher検定批判論文(1990)に対する批判的なコメントでも、Lehmannさんの本を引用して、Fisher's exact testがuniformly most powerful unbiasedであることはとっくの昔に証明済みであると主張していますが、もちろん間違っています。 twitter.com/genkuroki/stat...

タグ：統計

posted at 20:55:46

#統計数学的にややこしい事柄では、たとえ何かが証明されていても間違っていることがあるし、証明が正しくても証明されたい結果が何であるかを読者が誤解することがあります。

証明だけに頼らずに、特殊な場合に関する数値的な計算でも確認しておくことは非常に大事なことだと思います。

タグ：統計

posted at 20:58:55

#統計直上の話題の数学的内容を1ツイートでまとめると次のリンク先のツイートの内容になります。 twitter.com/genkuroki/stat...

タグ：統計

posted at 21:02:20

#統計文脈的に明らかだと思うのですが、「たとえ何かが証明されていても間違っていることがある」は「たとえ何かが証明されているように見えても実際にはその証明が間違っていることがある」という意味です。

これ、結構よくあります。本に書いてある証明を信用しちゃダメ。

タグ：統計

posted at 21:05:03

#統計関連 twitter.com/genkuroki/stat...

タグ：統計

posted at 21:09:24

QmQ @gejiqmq

rt 機械学習で三体問題、の論文の問題点

タグ：

posted at 21:11:56

QmQ @gejiqmq

比較対象のソルバが「すごく遅い代わりに精度が超絶」のものだった、でもDNNはそんな精度ない、だからフェアな比較になってない、という指摘。

タグ：

posted at 21:16:42

#統計【だから臨床研究から遠くなる】というコメントは非常に参考になり、色々考えさせられた。

2×2の分割表の独立性検定のごたごたの原因はFisher's exact testが普及してしまったこと。

その害は、単に「検定力が大幅に下がった」だけではなく、ずっと大きい可能性がある。

Simple is best. twitter.com/urotauyoshiuso...

タグ：統計

posted at 21:23:49

Shuhei Kadowaki @kdwkshh

google kick start のこの問題、一見簡単目だけど、時間計算量はもちろん、ナイーブに解くとmemory limit errorになったりしてメモリ効率についてもちゃんと考えてないと解けないのでとても良問だと思った。

codingcompetitions.withgoogle.com/kickstart/roun...

タグ：

posted at 21:24:11

Shuhei Kadowaki @kdwkshh

julialang での解答: github.com/aviatesk/googl...

タグ：

posted at 21:24:48

QmQ @gejiqmq

さらに、三体問題は普通のソルバーでサクサク解ける、論文中にある改良案については「そういうのダメなのは常識」らしい。

タグ：

posted at 21:24:48

KokyuHatuden @breathingpower

twitter.com/chestnut100kg/...
嘘のような本当の話。一時期ウイキペディアがEM菌を肯定する内容に編集されてしまい、大騒ぎになりました。⇨togetter.com/li/1264493

タグ：

posted at 21:25:07

あ〜る菊池誠(反緊縮)公式 @kikumaco

#統計 #Julia言語

2×2の分割表について、自分で書いたP値と信頼区間を求める函数達と、#R言語による各種ライブラリによる計算結果の比較の表をさらに拡充した。

P値と信頼区間の組は、私の計算と一致しているものを選べば整合性のある報告をできる。Rだと結構ばらばら。

nbviewer.jupyter.org/gist/genkuroki... pic.twitter.com/CMEHYLyXIq

タグ： Julia言語 R言語統計

posted at 21:37:54

上野千鶴子は以前話題になった東大での祝辞でも無茶苦茶なことを言っていたのに、あれを絶賛する人がたくさんいてびっくりした。東大生も東大教員もあれで怒らないのが不思議。激怒するのが当たり前でしょう。上野千鶴子は過大評価されていると思うよ

タグ：

posted at 22:06:55

#統計

UMP unbiased test では同一のサンプルでもある確率で独立性帰無仮説が棄却されたりされなかったりするようにする必要があるという話は、Fisher検定のmid-P補正の根拠になり得ますね。続く twitter.com/genkuroki/stat...

タグ：統計

posted at 22:10:51

Shingo @shingo3110405

9×3＝27と書くとなんで間違いになるのですか？ #小学校算数 #かけ算 #教育の失敗 pic.twitter.com/wd3vuKCa7W

タグ：かけ算小学校算数教育の失敗

posted at 22:15:37

#統計しかし、添付画像を見れば分かるように、mid-P Fisher検定では、第一種の過誤が生じる確率が補正無しのχ²検定よりもαを超えて大きめになる場合もあるし、補正無しのχ²検定より優れているようにも見えないです。mid-P Fisher検定を今から普及させるのも大変。

"Simple is best." twitter.com/genkuroki/stat... pic.twitter.com/XRb46WwTLc

タグ：統計

posted at 22:17:24

Ta2o @ShmzTa2o

秋月康夫『輓近代数学の展望』 (ちくま学芸文庫)には「matrix という字の意味から、園先生は母式と訳しておられたので、旧著では、母式という術語をとって書いたが、今日これは‘行列’というふうに定着しているので行列と改めた」とコメントがあり、面白い twitter.com/Paul_Painleve/...

タグ：

posted at 22:18:12

@ShmzTa2o ありがとうございます。たとえば
園正造「市場均衡の安定條件」1944
repository.kulib.kyoto-u.ac.jp/dspace/handle/...
の20ページに「母式（行列）」が使われています。園は1886年1月1日生れ，すでに「行列」が定着しつつあっても元の語義に従った言葉を使いたかったのでしょう。

タグ：

posted at 22:27:00

#統計

* G-testは第一種の過誤が起こる確率が大きくなり過ぎるので使うべきではない。

* Yates補正版のχ²検定には現代では存在価値がないと思う。Fisher検定の方がまし。

* 補正無しのFisher検定は小サンプルで検定力が非常に弱くなる。そうなっても良い人だけが使うべき。 pic.twitter.com/WcTbzdM9XX

タグ：統計

posted at 22:29:18

#統計

* log odds ratioの分布の正規分布による近似を使う検定(Wald)は色々計算するとあんまりよくないっぽい。

* 残りの補正無しのχ²検定、"(N-1)/N"倍補正入りのχ²検定、mid-P Fisher検定は悪くなさそう。

* "Simple is best."を重視するなら、補正無しχ²検定で大抵の場合は大丈夫だと思う。 pic.twitter.com/KZy6jW7ke7

タグ：統計

posted at 22:29:21

#統計

* しかし、#R言語で補正無しのシンプルなχ²検定と整合的な信頼区間を計算してくれるライブラリを見つけることができないでいる。

* Fisher (1962)の1ページ論文(既出)の方法を誰かすでにRで実装していたりしないだろうか？

* 私はFisherと独立に本質的に同じものを #Julia言語で書いた。 pic.twitter.com/MkAFGmz859

タグ： Julia言語 R言語統計

posted at 22:33:22

#統計というわけで、#Julia言語でも #R言語でも、2×2の分割表の独立性検定とそれと整合的な信頼区間の計算をやってくれるパッケージで満足なもの(最低でもχ²検定と整合的な信頼区間を計算してくれる必要あり)を見つけることができないでいます。

もしかして #Python ならありますか？

タグ： Julia言語 Python R言語統計

posted at 22:37:35