黒木玄 Gen Kuroki(@genkuroki)/2023年07月08日

何だこの訂正 twitter.com/genkuroki/stat...

タグ：

posted at 23:50:40

#数楽純粋に数学的には確率は単なる割合の概念として定式化できて、応用上も有用な定理を大量に証明できるので、確率について特権的に正しい解釈が1つあるという考え方は最初からナンセンスであることは自明であり、様々な解釈を許すと考えるべきだと思います。

タグ：数楽

posted at 23:49:55

#数楽なんとなくなんですが、「確率の正しい解釈を与える哲学」のようなものについて考えることが、知的にステータスが高い行為であるかのように一部で信じられているように思うのですが、

　確率の解釈は多彩でよい

という立場から見ると、知的にレベルが低い行為に見えてしまいます。

タグ：数楽

posted at 23:44:19

#数楽「確率=割合」という立場で定式化と証明された確率に関する数学的結果には、多彩な解釈を許すという利点があります。

例えば、確率論の結果は単なる割合にも適用できます(笑)。

決定論的に生成される擬似乱数にも確率論の結果を適用できます。

タグ：数楽

posted at 23:39:17

#数楽「大数の法則」「中心極限定理」「各種の大偏差原理」のような統計学において非常に役に立つ結果を、ランダム性の概念を完全に無くして、「確率とは割合の別名に過ぎない」という立場で定式化して証明できる。

これは現代では数学的に常識になっていますが、自明なことではないと思います。

タグ：数楽

posted at 23:34:55

#数楽「大数の法則」「中心極限定理」「各種の大偏差原理」については、ランダム性に関する素朴な直観を用いて説明されることが多いと思うのですが、その数学的な定式化と証明は、ランダム性の概念を一切含まない「確率」を「割合」とみなす方針で押し通すことが可能なのです。

タグ：数楽

posted at 23:31:55

#数楽わざわざ、測度論的には「確率=割合」なことを強調することが面白いのは、測度論的確率論に基いて数学的に証明される

統計学における確率論の三種の神器
「大数の法則」「中心極限定理」「各種の大偏差原理」

は実は「割合」に関する結果として証明されているということです。続く

タグ：数楽

posted at 23:28:25

#数楽測度論的な確率論の意味での「確率」は「全体の大きさを1に正規化した場合の部分の大きさ」(良いするに割合)を意味し、それ以上の意味はありません。要するに、

測度論的確率論の意味での確率 = 割合

です。「条件付き確率」は「部分に対するその部分の割合」に過ぎません。続く

タグ：数楽

posted at 23:24:15

川端裕人『ドードー鳥と孤独鳥』（国書刊 @Rsider

#統計 #NHK高校講座

 www.nhk.or.jp/kokokoza/suuga...
❌【帰無仮説が起こりうる確率が有意水準より下の場合は、帰無仮説を棄却できます】

と書いてあることは、NHK高校講座の関係者達の仮説検定の理解度がほぼゼロであることを示唆しています。

この点にNHK高校講座の受講者達は注意した方がよいです。 twitter.com/genkuroki/stat...

タグ： NHK高校講座統計

posted at 23:03:35

「薬屋のひとりごと」のアニメ化をめぐり、色覚についての扱いがどうなるのだろうという話題が出ていたので、色覚をめぐる言葉の整理を紹介させてください。現状いろいろな言葉が使われていますが、それぞれ背景にある考えや、言っていることの焦点が違います。gakugei.shueisha.co.jp/mori/serial/ir... pic.twitter.com/giB3sOOarE

タグ：

posted at 21:41:29

大石雅寿 @mo0210

1Fのタンクに保管している水をALPSで二次処理し、さらに海水で希釈してから放出するのに、タンクの水をそのまま放出すると勘違い（思い込み）したまま批判・反対する人がたくさん。なぜきちんと情報を調べてからものを言わないのか？他人から聞いた話を鵜呑みにしているのか？

タグ：

posted at 21:24:01

Massimo @Rainmaker1973

Using a peculiar undulating propulsion system, PES Velox robot is able to efficiently glide through the water, over rough land and has even become adept at the art of ice-skating

[read more: ow.ly/693R30mZPwr] pic.twitter.com/UCjN5TiQOZ

タグ：

posted at 20:45:00

Richard McElreath @rlmcelreath

Link to book: openlibrary.org/books/OL718928...

タグ：

posted at 19:21:45

Richard McElreath @rlmcelreath

That someone who accomplished so much in one area could be so confidently wrong (not even wrong) in a closely related domain should perhaps give us all good reason to check our own epistemic humility.

タグ：

posted at 19:21:44

Richard McElreath @rlmcelreath

It is often said CORRELATION IS NOT CAUSATION. But Karl Pearson of correlation coefficient fame actually argued that it is. Excerpt below from 1911 book "Grammar of Science" p 170. Nowhere does he seem to realize a distinction btw prediction and intervention. It's baffling. pic.twitter.com/7dCPEDdyeg

タグ：

posted at 19:21:43

伊藤　剛 @GoITO

実家にいるのでテレビで「池上彰のニュース解説SP」なる番組を眺めているが「日本は少子化だが、世界の人口は増えているんですね」と言っていた。まあそれで合ってるんだが、中国や韓国、台湾の少子化には触れないんだなと思いました。

タグ：

posted at 19:10:36

この要約だとまるで
「×にすることにきちんとした理由はあるのに、それを子どもに納得できるように説明していないのが悪い」
のように見える。記者もそう思っている可能性が高い。
そんな理由で反対しているわけではないのに。 twitter.com/tokyosukusuku/...

タグ：

posted at 16:47:24

らじうむ小山_PPPMP @Ra_koyama

あ〜る菊池誠(反緊縮)公式 @kikumaco

社民党は終わり、いつまで続ける気だ？みたいな人が多いと思うが、この菊池先生の問（どういうデータで安全性に疑問を持つのか？）にまともに答えたら、見直したという人も出ると思うんで、大椿氏は早く答えたらいいと思う。@ohtsubakiyuko
（うやむやのまま終わらせないってよく言ってたはず） twitter.com/kikumaco/statu...

タグ：

posted at 16:43:35

学術会議が中国共産党に忖度して処理水問題に声明を出さないというのは完全なデマですよ。

林さんはすぐに北朝鮮のせいにしたり中国のせいにしたりするのをやめるほうがいいと思います。社民党が韓国の野党と連帯するのですら、韓国や北朝鮮のせいではない twitter.com/sokoranokumasa...

タグ：

posted at 16:16:33

Yuki Nagai @cometscome_phys

記事を投稿しました！ Juliaでの自動微分を使って、ウィルティンガー微分してみる：完全版 on #Qiita qiita.com/cometscome_phy...

タグ： Qiita

posted at 15:55:53

Buitengebieden @buitengebieden

Swan family crossing the road.. 😊 pic.twitter.com/7XUCSno9z7

タグ：

posted at 15:46:54

#統計学習メモ www.nhk.or.jp/kokokoza/suuga... での

【「帰無仮説」が起こる確率】→【起こる確率】

という修正の仕方も酷い。何の確率なのかこれだとさっぱりわからない。

修正者が仮説検定を理解してなさそうなことは、このことからもわかる。

多くの高校生がこれで勉強することになる。まずすぎ。 twitter.com/genkuroki/stat...

タグ：統計

posted at 15:37:15

学科長の犬 @Nene787147251

これは酷い twitter.com/genkuroki/stat...

タグ：

posted at 15:23:52

#統計 NHK高校講座の仮説検定の解説の「文字と画像で見る」の

www.nhk.or.jp/kokokoza/suuga...
❌【帰無仮説が起こりうる確率が有意水準より下の場合は、帰無仮説を棄却できます】

というデタラメな説明は現時点でも訂正されていないですね。 twitter.com/genkuroki/stat... pic.twitter.com/uYfh5XDSok

タグ：統計

posted at 15:18:24

Yossy @Yossy_K

因数分解や有理化とか、先述のΣ計算の結果とかも、本来は「そこで完結する話ではない」ものを無理くり完結させてる弊害やと思うのよな。√7と大小比較するなら√8のほうがエエやんか、みたいな話いくらでもあるし。

タグ：

posted at 15:00:57

Hiroyasu Kamo @kamo_hiroyasu

@SSako86 予想通りの展開になってうんざりしています。

タグ：

posted at 14:41:30

Yossy @Yossy_K

何を「一般的」というか判断が難しい例としては、ちょうど今週質問が多かったΣの計算問題とか典型なのよな。
可能な限り因数分解するのか、展開しきるのか、公式の結果利用したところで止めてもエエのか。ガッコのセンセごとに言うことがてんでバラバラなんよねえ。 twitter.com/aqcichRmdB1Aln...

タグ：

posted at 14:41:21

www.annualreviews.org/doi/abs/10.114...
【It is widely but incorrectly believed that the t-test and linear regression are valid only for Normally distributed outcomes. 略】

t検定や線形回帰が正規分布にのみ使えるという間違っている考え方が広く信じられていることは問題である。

タグ：

posted at 14:36:53

大石雅寿 @mo0210

地元は全員反対？ twitter.com/dno4h7c77hkdbh...

タグ：

posted at 14:12:14

あんちもん2 @antimon2

Kouji Ohnishi 大西浩次 @koujiohnishi

先ほど（トップバッター）のLTスライドです。
Pythonのじゃないけれど本を書いた話 speakerdeck.com/antimon2/pytho...
#Python東海

タグ： Python東海

posted at 14:08:51

ごまふあざらし(GomahuAzaras @MathSorcerer

この中で2枚の写真を撮影している星景写真家の大西浩次です。私の写真はデジタル一眼レフで撮影しています。嘘つきはダメですよ。写真の使用料を請求しますので、住所を連絡してくださいね。嘘つきは泥棒の始まりとも言いますが、著作権違反に嘘情報です。バレていますよ。 twitter.com/propro11233_/s...

タグ：

posted at 14:06:20

ポスター発表される方の概要も出てきました。

akio-tomiya.github.io/julia_imi_work...

タグ：

posted at 14:04:29

ざき @katamochi40

ご指摘ありがとうございます。

統計は使いますが、分野外なもので簡単な書籍(一般大衆向け)しか読んでいない分認識の間違いがあると思います。

統計についての認識に誤りがある件について知れてよかったです。
今後勉強します。
ありがとうございます。 twitter.com/genkuroki/stat...

タグ：

posted at 14:02:52

H.Hiro @h_hiro_

#Python東海
antimon2さん：Juliaの本を書いた話。突然DMで打診が来た。今年3月15日に刊行。 twitter.com/antimon2/statu...
Pluto.jlという実行環境があるが、本のサンプル実行環境としてはJupyterLabに比べて使いにくい点もあり使わなかった

タグ： Python東海

posted at 13:55:53

Hiromitsu Takagi @HiromitsuTakagi

あ〜る菊池誠(反緊縮)公式 @kikumaco

Twitterに現れたcookie wall、稀に見る的確な説明だね。「広告のターゲティングを含む非本質的な目的に使用」とか「Google、LinkedIn、GlassdoorおよびIndeedが各自の目的において」とか。2択なのも良い。
（しかし「詳細はこちら」のリンク先がおかしいが。） pic.twitter.com/4ulYFTqDlh

タグ：

posted at 13:53:38

僕としては、社民党副党首の大椿ゆうこ氏が中断させているこの対話に多くのかたが注目してくださることを願っています。
どこかのウェブメディアででも取り上げていただけると、対話が進むかもしれませんね。
なお、僕は返事をいただけるまで問いかけ続けます
@ohtsubakiyuko twitter.com/kikumaco/statu...

タグ：

posted at 13:39:21

#統計個人的な意見では

❌t検定は正規母集団でしか使えない

というデタラメそのものよりも、

❌安易にMann-WhitneyのU検定のようなノンパラメトリック検定を使う方向に誘導されること

の方が有害だと考えています。

ノンパラメトリック検定を誤用せずに済ませることは結構難しいです。 twitter.com/genkuroki/stat...

タグ：統計

posted at 13:07:07

@adopo333 @igussan_cis_R 以下のリンク先のリンク先とスレッドを参照。

❌t検定は正規母集団でしか使えない。
❌パラメトリック検定ならいつでも使える。

はどちらも誤りです。 twitter.com/genkuroki/stat...

タグ：

posted at 12:53:41

@_ss__0 以下のリンク先のリンク先とスレッドを参照。

❌t検定は正規母集団でしか使えない。
❌パラメトリック検定ならいつでも使える。

はどちらも誤りです。 twitter.com/genkuroki/stat...

タグ：

posted at 12:51:10

@katamochi40 @unitoku_1592 以下のリンク先のリンク先とスレッドを参照。

❌t検定は正規母集団でしか使えない。
❌パラメトリック検定ならいつでも使える。

はどちらも誤りです。 twitter.com/genkuroki/stat...

タグ：

posted at 12:50:12

#統計以上のようなことを丁寧に説明しておきたくなる理由は、どうも多くの大学で、

❌t検定は正規母集団でしか使えない。
❌ノンパラメトリック検定ならいつでも使える。

という酷いデタラメを信じるように学生に教えている場合があるから。

検索すると幾らでも見つかる。 twitter.com/genkuroki/stat... pic.twitter.com/J902U2CSpE

タグ：統計

posted at 12:46:39

さくら @Sakura_Med_DSci

@EARL_med_tw 面白いですね😆
結果の信頼区間が激烈に狭いのですが、統合元の3つの研究の精度を考えると奇妙な気がしました。
見えていないだけで実際にはもっと沢山の（100とか？）類似した研究を統合しているのでしょうか。
また、本論とは関係ないですが、統合モデル（固定・変量効果モデル）も気になりました。

タグ：

posted at 12:35:22

探究 @sekai_tankyu

因数分解の話、中学の内容で説明しろというツイートみたが、中学数学では説明できない数学的に正しい解答を勝手な理屈で間違ってるって記述するのがおかしいんよね。前提として厳密性が不足してるからこそ全て正しいでいいやないかい。

タグ：

posted at 12:16:00

伊奈めぐみ @speech_ballon

pic.twitter.com/BJNwJmBxBF

タグ：

posted at 12:06:40

#統計以下のリンク先の場合には、t分布を使った補正のお陰で、補正せずに標準正規分布でP値を計算した場合よりも、誤差を小さくするために必要な標本サイズを小さくできます。

その意味でt分布による補正は有効だと言えます。 twitter.com/genkuroki/stat...

タグ：統計

posted at 12:06:05

#統計 t分布による補正が焼石に水状態になる場合には、nを大きくする必要があり、結果的にt分布を使った補正の影響はほとんどなくなります。

n→∞での様子を見るときには、t分布による補正の妥当性にこだわることはナンセンスです。 twitter.com/genkuroki/stat...

タグ：統計

posted at 12:03:23

SwordOne @twinklepoker

「年齢に応じた指導」というなら、
「本来誤答であるものに加点する」ならわかるが、
「本来正答であるものを誤答または減点にする」のは筋が通らんだろ。 twitter.com/pako5315934228...

タグ：

posted at 12:01:19

#統計想定している母集団分布が何かはっきりした特徴を持っていることがほぼ確実ならば、その特徴に合わせて統計モデルを設計して利用した方が分析精度が上がるので良いと思います。

自分の専門知識を使って必要な統計モデルを設計できると非常に便利なはず。

タグ：統計

posted at 11:59:01

#統計繰り返し強調しておきますが、想定している母集団分布が指数分布のような感じで大きく左右非対称な分布の場合には、母平均について検定や区間推定して利用することが、自分の目的にとって本当に適切かどうか、考え直す必要があると思います。

タグ：統計

posted at 11:56:49

#統計想定している母集団分布が指数分布の場合。

指数分布に限らず左右の非対称性が大きな分布では、t検定が採用しているt分布を使った補正は焼石に水になり、標本サイズnを大きくしないと誤差が大きくなります。

nbviewer.org/github/genkuro... pic.twitter.com/d87KlMK23o

タグ：統計

posted at 11:53:18

#統計大多数の正規分布と少数派の外れ値の混合モデル。

この場合にはt分布を使った補正は焼石に水になり、t検定はn=150程度以上を要求しているように私には見える。

しかし、2つの山がここまで明瞭に分離されているなら、そういう確率分布を統計モデルとして採用した方が良いと思う。 pic.twitter.com/WM09RP2qUV

タグ：統計

posted at 11:49:23

#統計 2つの少しだけ離れた正規分布の混合モデル。

個人的な意見ではこの場合もn=10でt検定を使って良いと思う。

別の例に続く pic.twitter.com/2s3AEHjrZP

タグ：統計

posted at 11:45:18

#統計 2つの重なっている正規分布の混合モデル

このような形の分布は、入試で現役と浪人で分布が異なるせいで生じたりします。

この場合のt検定はn=10でも十分すぎる精度を持っている。

別の例に続く pic.twitter.com/QhS0u0SP9n

タグ：統計

posted at 11:43:33

EARLの医学ツイート @EARL_med_tw

#統計帰無仮説下の統計モデル内でP値が5%以下になる確率を、実践的に出て来易い感じの分布について標本サイズを動かしてプロットしてみました。

ガンマ分布Gamma(2,3)の場合

t検定でP値が5％以下になる確率が6%を切るためにはn=40程度以上の標本サイズが必要になっている。

別の例に続く pic.twitter.com/YRtZHikKvp

タグ：統計

posted at 11:40:43

ChatGPT Code Interpreterにメタ解析をさせてみました。

ChatGPT Noteable pluginと比較して、結果が出るまでのエラーがかなり多く、自己修正して結果までたどりつきはするものの時間とトークンの消費が大きいです。 pic.twitter.com/aFxtHagsPo

タグ：

posted at 11:29:07

「「次の因数分解はまちがいである」という表現は不適切でございます。」
不適切だと認めたのはこの部分だけなんだよね。
ここだけ修正してもこの設問の不適切さは変わらない。

タグ：

posted at 10:33:46

「必ずしも係数をくくりださなくても因数分解できてるといえる」
なんでわざわざ「必ずしも」を入れて変な文章にしたんだろう。
www.seishinsha.co.jp/ssimg/c/su/202...

タグ：

posted at 10:24:29

Dr. Tad @tak53381102

”たとえ軽症で済んだとしても、新型コロナウイルスに感染することで、3カ月以上にわたって精液の質が低下する可能性のあることが、欧州ヒト生殖医学会の年次集会（ESHRE 2023）で発表された”
これはちょっと深刻な話だな…

diamond.jp/articles/-/325...

タグ：

posted at 10:12:12

Joy Watson Taniguchi @JoyTaniguchi

普通にキショい。 pic.twitter.com/62OStqljH7

タグ：

posted at 09:59:11

積分定数 @sekibunnteisuu

@aqcichRmdB1Aln8 有理化していないと減点なのに、三角比だとOKというのはどういう理由でしょうか？

タグ：

posted at 09:05:51

非公開

タグ：

posted at xx:xx:xx

Chihiro Nakayama @cnakayama1958

私は東大文学部卒でNHKに入りましたが、福島の原発事故後に退職しました。理系にならなくてはと思い、福島医大大学院に入って一からやり直し、医学博士となりました。今は「福島で続く放射線健康不安にはマスコミの影響がある」という事を実証研究しています。伊藤先生の「暴論」は結構納得出来ます。 twitter.com/GoITO/status/1...

タグ：

posted at 08:54:39

積分定数 @sekibunnteisuu

@aqcichRmdB1Aln8 特に問題文に言及がなければ〇にしますよ。
きっと俺の教員生活は間違ってないさんは、言及がなくても減点にするのですか？

分母の有理化も必須ですか？

タグ：

posted at 08:46:15

あおじるPPPP @kale_aojiru

＞納得できない理由で×にされると

そういう問題ではないんだよね。嘘を教えられている案件なので、子供が納得すればよいというものではない。むしろ納得して受け入れてしまっている子こそが被害者と言える。

納得云々だと、正しい採点でも納得しない子がいたらだめなのかという話にもなってしまうし twitter.com/tokyosukusuku/...

タグ：

posted at 08:12:24

石の上にも三年 @ichinichinos

そのときに数学ができないと言う現実を受け入れざるを得なくなったりすること

タグ：

posted at 07:09:50

石の上にも三年 @ichinichinos

数学の勉強を新しい公式を教えてもらうことだと思っている人は多い

そんな勉強の何が怖いかって？

数学が得意だと思っていたのに、高校1年生くらいで何やればいいかわからなかなり初め、それでもそのやり方が通用する範囲ではそこそこ定期テストで点数が取れるから、理系に行ってしまったりして、

タグ：

posted at 07:09:49

ソースコード #Julia言語
 nbviewer.org/github/genkuro...

タグ： Julia言語

posted at 05:17:28

一様分布は対称分布で尖度は-1.2で負。(尖度の下限は-2)

これとは逆に対称分布で尖度が∞の場合の例が以下のリンク先
↓ twitter.com/genkuroki/stat...

タグ：

posted at 05:15:57

そのせいで、小さなnでは、標準正規分布を使って得たP値は余計に大きくなり易い。

母集団分布が正規分布ならTはt分布に従うので、標準正規分布をt分布に置き換えれば良い。

母集団分布が非正規分布の場合にも、その補正はそう悪くはない。そうなる理由を上に書いた。

さらに上には数値例もある。
↓ twitter.com/genkuroki/stat...

タグ：

posted at 05:10:37

中心極限定理が十分効いていれば、標本平均X̅が従う分布は平均μ、分散σ²/nでよく近似され、(X̅-μ)/√(σ²/n)が従う分布は標準正規分布でよく近似されている。

しかし、σ²に不偏分散S²を代入したT=(X̅-μ)/√(S²/n)の分布は、不偏分散S²の分散のせいで、標準正規分布から離れる。

タグ：

posted at 05:05:18

標本サイズが数十から百以上では、使用するt分布の自由度が大きくなって、標準正規分布でよく近似されるようになり、t分布を使った保守的な補正の影響は小さくなっている。

こういう感じの話に(正確な意味はまだ不明だが)【高次漸近性】と言い出すのはおかしいのではないか？

タグ：

posted at 04:58:18

分布の非対称性が、平均を見ることも適切な程度にマイルドならば標本サイズnが数十から百程度で、標本平均が従う分布が正規分布で十分に近くなっている可能性が高い。(かなり雑な言い方をしていることに注意)続く

タグ：

posted at 04:54:05

母集団分布がどの程度非対称性だと標本平均への中心極限定理の効き具合を十分にするためにどの程度標本サイズnを大きくしなければいけないかは、結構めんどくさい問題。

指数分布並に非対称ならそもそも平均を見ること自体が不適切な可能性が高い。(t検定とそれに付随する信頼区間は平均を扱う)

タグ：

posted at 04:51:05

標本サイズnが数十以下であっても、標本分布が従う分布が正規分布でよく近似されているためには、母集団分布が左右対称かそれに近い必要があります。

実践的には分布の対称性を保証できる場合は稀だと思います。続く

タグ：

posted at 04:46:47

続き。だから、t検定におけるt分布を使った補正の妥当性が問題になるのは、高々数十程度の小さめの標本サイズnの場合に限ります。

さらにt検定の使用が妥当であるためには、標本平均が従う分布が中心極限定理によって正規分布でよく近似されている必要があります。続く (以下、引用ツイートはしない) twitter.com/bluesnono/stat...

タグ：

posted at 04:42:51

【t統計量の標本分布をt分布で近似する際の高次漸近性】

②【高次漸近性】？？？

「漸近性」は標本サイズn→∞での何かの漸近挙動という意味だと思うのですが、n→∞とするとt分布は標準正規分布に近付くので、十分大きなnではt分布を使うことによる補正によるP値の上昇幅は小さくなります。続く twitter.com/bluesnono/stat...

タグ：

posted at 04:36:48

【t統計量の標本分布をt分布で近似する際の高次漸近性】

①【t統計量の標本分布をt分布で近似】

標本分布？？？

正しくは「t統計量が従う分布をt分布で近似」だと思われる。

続く twitter.com/bluesnono/stat...

タグ：

posted at 04:32:42

@bobotonoro 中学生でもダメです。 pic.twitter.com/ADjlwgcwrM

タグ：

posted at 02:35:35

@SSako86 そんなに圧力はかけてないですけどね。

数学的に正しい指摘があっただけということを、認めたくない人がいたんでしょうね。

タグ：

posted at 02:20:11

@0315_osami そんなところです。
ただ、元ツイートの意図は、もっと変えたいということより、今回の件が不当な手段で変えさせたかのように言う輩がいたので、そういうことをする意思や力があるなら他にもやってるだろうということが言いたかったんです。

タグ：

posted at 01:49:01

#統計等標本サイズでの「2つのt統計量の一致」と「Welchのt検定の自由度がStudentのt検定の自由度の半分以上になること」などの確認に必要な数学のスキルは、ちょうど大学入試対策の数学の練習で身に付きそうな計算力です。

入試対策の数学の勉強も健全にやれば一生役に立つ武器が手に入ります。

タグ：統計

posted at 01:39:07

@SSako86 興味あります。例えばどんなものがありますか？
（かけ算順序とか、同値なのに表記で✕とか？）

タグ：

posted at 01:29:36

伊藤　剛 @GoITO

なんで私が「学力棒」で、と書いたかを汲んでいただければ幸いです。

タグ：

posted at 01:26:55

@022023Momoko 家電なんかが壊れたときとか、医学的知識とか、僕は理系の知識ってめちゃくちゃ生活において大事だと思ってます。

また、その知識がないと、BBQでエタノール使って・・・みたいな事故がおきます。

むしろ文系の知識の方が、ネットが発達して必要性が低くなってる印象です。

タグ：

posted at 01:21:53

#統計 2群の標本サイズをm,nと書くとき、

min(m-1, n-1) ≤ (Welchのt検定で使う自由度) ≤ (Welchのt検定で使う自由度) = m+n-2

を証明できます。m,nの両方が大きいならば、どちらの自由度のt分布も標準正規分布でよく近似されることになります。

タグ：統計

posted at 01:21:51

#統計なぜならば、Welchのt検定で使うt統計量とStudentのt検定で使うt統計量は一般に異なるのですが、2群の標本サイズが等しいときには一致してしまうからです。

その場合には補正に使うt分布の自由度の違いでしかなくなる。続く

タグ：統計

posted at 01:18:25

圧力をかけて因数分解の問題文を変更させることができるなら、他にも変えさせたいものなんてたくさんあるよね。

タグ：

posted at 01:17:01

#統計計算していても、数学に弱いせいで、シミュレーションで違いを出すことができていない場合も見たことがある。

対応がない2群に関するWelchのt検定とStudentのt検定の大きな違いをシミュレーションで確認するには、2群の標本サイズを別にする必要があります。続く

タグ：統計

posted at 01:15:47

#統計 2×2の分割表の独立性検定についても、なぜかPearsonのχ²検定を使える場合を極度に制限しようとするデマが伝統的に流れて続けている。

本当に使えないかどうかは、このスレッドで紹介した方法で確認できるのに、全然そうしようとしない。

タグ：統計

posted at 01:12:15

#統計「正規母集団でなければt検定は使えない」(もしくは一様分布のような非常に良い場合であっても誤差が大きくなると示唆すること)のようなデマを流す人達に共通しているのは、コンピュータで計算すればすぐにわかることを計算していないことです。

タグ：統計

posted at 01:08:44

#統計そうやって確率分布がらみのコンピュータシミュレーションを気軽にできる人が増えると、例えば、

母集団分布が正規分布でなくても多くの場合に、
t分布による補正を行っているt検定の誤差が
許容範囲に収まること

の理解者が増えます。もちろん、誤差が大きくなる場合に関する理解者も増える！

タグ：統計

posted at 01:06:02

#統計 #Julia言語のDistributions.jl の便利なところは、確率分布オブジェクトを作ることができるので、確率分布を引数に持つ函数を普通に定義できることです。

そのことを使うと、複数の確率分布に関するシミュレーションを1つの函数で実行できます。

nbviewer.org/github/genkuro... pic.twitter.com/NMcSU3oYAZ

タグ： Julia言語統計

posted at 01:00:13

伊藤　剛 @GoITO

それは悪手です。工学部のひとに多い印象があるんですが、自分の学問分野の方法や制度が、あらゆる分野に共通すると思ったら大間違いです。たとえば、かつてマンガ研究は、査読論文のほうが在野の書き物より水準が低かった。 twitter.com/nananao2236/st...

タグ：

posted at 00:59:34

#統計現代のおいてありがたいのは、#Julia言語のような強力な飛び道具があるお陰で、まるで高級関数電卓を使う気分で、マルチスレッドの並列計算でそのようなシミュレーションを気軽に実行できることです。

試行錯誤では計算の速さは正義。

視覚化も易しい。

もっと流行った方が良いと思う。

タグ： Julia言語統計

posted at 00:56:04

#統計標本サイズn→∞で各種の統計量がどのようにふるまうかに関する結果を漸近論のように呼ぶようですが(私はその辺の言葉遣いをよく知らない)、実践的に出て来そうなnの値については、コンピュータシミュレーションでどういう感じになっているかを確認できます。

数学で苦しまなくても確認可能。

タグ：統計

posted at 00:52:14

#統計母平均μの母集団分布distと標本サイズnを与えて、

分布distのサイズnの標本をランダムに生成して、仮説μ=μ₀のt検定のP値を計算して記録

を100万回繰り返した結果を使えば、

P値がα以下になる確率

を計算できます。

nbviewer.org/github/genkuro... pic.twitter.com/5LpGWE8iZs

タグ：統計

posted at 00:48:58

#統計サンプルを繰り返し生成して、P値を大量に計算するだけで

信頼区間の被覆確率

を

1 - (P値がα未満になる確率)

で計算できます。信頼区間の大量計算は必要ない。

タグ：統計

posted at 00:43:52