黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2023年07月08日(土)
#統計 #NHK高校講座
www.nhk.or.jp/kokokoza/suuga...
❌【帰無仮説が起こりうる確率が有意水準より下の場合は、帰無仮説を棄却できます】
と書いてあることは、NHK高校講座の関係者達の仮説検定の理解度がほぼゼロであることを示唆しています。
この点にNHK高校講座の受講者達は注意した方がよいです。 twitter.com/genkuroki/stat...
posted at 23:03:35
「薬屋のひとりごと」のアニメ化をめぐり、色覚についての扱いがどうなるのだろうという話題が出ていたので、色覚をめぐる言葉の整理を紹介させてください。現状いろいろな言葉が使われていますが、それぞれ背景にある考えや、言っていることの焦点が違います。gakugei.shueisha.co.jp/mori/serial/ir... pic.twitter.com/giB3sOOarE
タグ:
posted at 21:41:29
1Fのタンクに保管している水をALPSで二次処理し、さらに海水で希釈してから放出するのに、タンクの水をそのまま放出すると勘違い(思い込み)したまま批判・反対する人がたくさん。なぜきちんと情報を調べてからものを言わないのか?他人から聞いた話を鵜呑みにしているのか?
タグ:
posted at 21:24:01
Using a peculiar undulating propulsion system, PES Velox robot is able to efficiently glide through the water, over rough land and has even become adept at the art of ice-skating
[read more: ow.ly/693R30mZPwr] pic.twitter.com/UCjN5TiQOZ
タグ:
posted at 20:45:00
Richard McElreath @rlmcelreath
Link to book: openlibrary.org/books/OL718928...
タグ:
posted at 19:21:45
Richard McElreath @rlmcelreath
That someone who accomplished so much in one area could be so confidently wrong (not even wrong) in a closely related domain should perhaps give us all good reason to check our own epistemic humility.
タグ:
posted at 19:21:44
Richard McElreath @rlmcelreath
It is often said CORRELATION IS NOT CAUSATION. But Karl Pearson of correlation coefficient fame actually argued that it is. Excerpt below from 1911 book "Grammar of Science" p 170. Nowhere does he seem to realize a distinction btw prediction and intervention. It's baffling. pic.twitter.com/7dCPEDdyeg
タグ:
posted at 19:21:43
実家にいるのでテレビで「池上彰のニュース解説SP」なる番組を眺めているが「日本は少子化だが、世界の人口は増えているんですね」と言っていた。まあそれで合ってるんだが、中国や韓国、台湾の少子化には触れないんだなと思いました。
タグ:
posted at 19:10:36
この要約だとまるで
「×にすることにきちんとした理由はあるのに、それを子どもに納得できるように説明していないのが悪い」
のように見える。記者もそう思っている可能性が高い。
そんな理由で反対しているわけではないのに。 twitter.com/tokyosukusuku/...
タグ:
posted at 16:47:24
社民党は終わり、いつまで続ける気だ?みたいな人が多いと思うが、この菊池先生の問(どういうデータで安全性に疑問を持つのか?)にまともに答えたら、見直したという人も出ると思うんで、大椿氏は早く答えたらいいと思う。@ohtsubakiyuko
(うやむやのまま終わらせないってよく言ってたはず) twitter.com/kikumaco/statu...
タグ:
posted at 16:43:35
学術会議が中国共産党に忖度して処理水問題に声明を出さないというのは完全なデマですよ。
林さんはすぐに北朝鮮のせいにしたり中国のせいにしたりするのをやめるほうがいいと思います。社民党が韓国の野党と連帯するのですら、韓国や北朝鮮のせいではない twitter.com/sokoranokumasa...
タグ:
posted at 16:16:33
記事を投稿しました! Juliaでの自動微分を使って、ウィルティンガー微分してみる:完全版 on #Qiita qiita.com/cometscome_phy...
タグ: Qiita
posted at 15:55:53
Buitengebieden @buitengebieden
Swan family crossing the road.. 😊 pic.twitter.com/7XUCSno9z7
タグ:
posted at 15:46:54
#統計 学習メモ www.nhk.or.jp/kokokoza/suuga... での
【「帰無仮説」が起こる確率】→【起こる確率】
という修正の仕方も酷い。何の確率なのかこれだとさっぱりわからない。
修正者が仮説検定を理解してなさそうなことは、このことからもわかる。
多くの高校生がこれで勉強することになる。まずすぎ。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 15:37:15
#統計 NHK高校講座の仮説検定の解説の「文字と画像で見る」の
www.nhk.or.jp/kokokoza/suuga...
❌【帰無仮説が起こりうる確率が有意水準より下の場合は、帰無仮説を棄却できます】
というデタラメな説明は現時点でも訂正されていないですね。 twitter.com/genkuroki/stat... pic.twitter.com/uYfh5XDSok
タグ: 統計
posted at 15:18:24
因数分解や有理化とか、先述のΣ計算の結果とかも、本来は「そこで完結する話ではない」ものを無理くり完結させてる弊害やと思うのよな。√7と大小比較するなら√8のほうがエエやんか、みたいな話いくらでもあるし。
タグ:
posted at 15:00:57
何を「一般的」というか判断が難しい例としては、ちょうど今週質問が多かったΣの計算問題とか典型なのよな。
可能な限り因数分解するのか、展開しきるのか、公式の結果利用したところで止めてもエエのか。ガッコのセンセごとに言うことがてんでバラバラなんよねえ。 twitter.com/aqcichRmdB1Aln...
タグ:
posted at 14:41:21
www.annualreviews.org/doi/abs/10.114...
【It is widely but incorrectly believed that the t-test and linear regression are valid only for Normally distributed outcomes. 略】
t検定や線形回帰が正規分布にのみ使えるという間違っている考え方が広く信じられていることは問題である。
タグ:
posted at 14:36:53
先ほど(トップバッター)のLTスライドです。
Pythonのじゃないけれど 本を書いた話 speakerdeck.com/antimon2/pytho...
#Python東海
タグ: Python東海
posted at 14:08:51
Kouji Ohnishi 大西浩次 @koujiohnishi
この中で2枚の写真を撮影している星景写真家の大西浩次です。私の写真はデジタル一眼レフで撮影しています。嘘つきはダメですよ。写真の使用料を請求しますので、住所を連絡してくださいね。嘘つきは泥棒の始まりとも言いますが、著作権違反に嘘情報です。バレていますよ。 twitter.com/propro11233_/s...
タグ:
posted at 14:06:20
ごまふあざらし(GomahuAzaras @MathSorcerer
ポスター発表される方の概要も出てきました。
akio-tomiya.github.io/julia_imi_work...
タグ:
posted at 14:04:29
ご指摘ありがとうございます。
統計は使いますが、分野外なもので簡単な書籍(一般大衆向け)しか読んでいない分認識の間違いがあると思います。
統計についての認識に誤りがある件について知れてよかったです。
今後勉強します。
ありがとうございます。 twitter.com/genkuroki/stat...
タグ:
posted at 14:02:52
#Python東海
antimon2さん:Juliaの本を書いた話。突然DMで打診が来た。今年3月15日に刊行。 twitter.com/antimon2/statu...
Pluto.jlという実行環境があるが、本のサンプル実行環境としてはJupyterLabに比べて使いにくい点もあり使わなかった
タグ: Python東海
posted at 13:55:53
Hiromitsu Takagi @HiromitsuTakagi
Twitterに現れたcookie wall、稀に見る的確な説明だね。「広告のターゲティングを含む非本質的な目的に使用」とか「Google、LinkedIn、GlassdoorおよびIndeedが各自の目的において」とか。2択なのも良い。
(しかし「詳細はこちら」のリンク先がおかしいが。) pic.twitter.com/4ulYFTqDlh
タグ:
posted at 13:53:38
僕としては、社民党副党首の大椿ゆうこ氏が中断させているこの対話に多くのかたが注目してくださることを願っています。
どこかのウェブメディアででも取り上げていただけると、対話が進むかもしれませんね。
なお、僕は返事をいただけるまで問いかけ続けます
@ohtsubakiyuko twitter.com/kikumaco/statu...
タグ:
posted at 13:39:21
#統計 個人的な意見では
❌t検定は正規母集団でしか使えない
というデタラメそのものよりも、
❌安易にMann-WhitneyのU検定のようなノンパラメトリック検定を使う方向に誘導されること
の方が有害だと考えています。
ノンパラメトリック検定を誤用せずに済ませることは結構難しいです。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 13:07:07
@adopo333 @igussan_cis_R 以下のリンク先のリンク先とスレッドを参照。
❌t検定は正規母集団でしか使えない。
❌パラメトリック検定ならいつでも使える。
はどちらも誤りです。 twitter.com/genkuroki/stat...
タグ:
posted at 12:53:41
@_ss__0 以下のリンク先のリンク先とスレッドを参照。
❌t検定は正規母集団でしか使えない。
❌パラメトリック検定ならいつでも使える。
はどちらも誤りです。 twitter.com/genkuroki/stat...
タグ:
posted at 12:51:10
@katamochi40 @unitoku_1592 以下のリンク先のリンク先とスレッドを参照。
❌t検定は正規母集団でしか使えない。
❌パラメトリック検定ならいつでも使える。
はどちらも誤りです。 twitter.com/genkuroki/stat...
タグ:
posted at 12:50:12
#統計 以上のようなことを丁寧に説明しておきたくなる理由は、どうも多くの大学で、
❌t検定は正規母集団でしか使えない。
❌ノンパラメトリック検定ならいつでも使える。
という酷いデタラメを信じるように学生に教えている場合があるから。
検索すると幾らでも見つかる。 twitter.com/genkuroki/stat... pic.twitter.com/J902U2CSpE
タグ: 統計
posted at 12:46:39
@EARL_med_tw 面白いですね😆
結果の信頼区間が激烈に狭いのですが、統合元の3つの研究の精度を考えると奇妙な気がしました。
見えていないだけで実際にはもっと沢山の(100とか?)類似した研究を統合しているのでしょうか。
また、本論とは関係ないですが、統合モデル(固定・変量効果モデル)も気になりました。
タグ:
posted at 12:35:22
因数分解の話、中学の内容で説明しろというツイートみたが、中学数学では説明できない数学的に正しい解答を勝手な理屈で間違ってるって記述するのがおかしいんよね。前提として厳密性が不足してるからこそ全て正しいでいいやないかい。
タグ:
posted at 12:16:00
#統計 以下のリンク先の場合には、t分布を使った補正のお陰で、補正せずに標準正規分布でP値を計算した場合よりも、誤差を小さくするために必要な標本サイズを小さくできます。
その意味でt分布による補正は有効だと言えます。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 12:06:05
#統計 t分布による補正が焼石に水状態になる場合には、nを大きくする必要があり、結果的にt分布を使った補正の影響はほとんどなくなります。
n→∞での様子を見るときには、t分布による補正の妥当性にこだわることはナンセンスです。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 12:03:23
「年齢に応じた指導」というなら、
「本来誤答であるものに加点する」ならわかるが、
「本来正答であるものを誤答または減点にする」のは筋が通らんだろ。 twitter.com/pako5315934228...
タグ:
posted at 12:01:19
#統計 想定している母集団分布が指数分布の場合。
指数分布に限らず左右の非対称性が大きな分布では、t検定が採用しているt分布を使った補正は焼石に水になり、標本サイズnを大きくしないと誤差が大きくなります。
nbviewer.org/github/genkuro... pic.twitter.com/d87KlMK23o
タグ: 統計
posted at 11:53:18
#統計 大多数の正規分布と少数派の外れ値の混合モデル。
この場合にはt分布を使った補正は焼石に水になり、t検定はn=150程度以上を要求しているように私には見える。
しかし、2つの山がここまで明瞭に分離されているなら、そういう確率分布を統計モデルとして採用した方が良いと思う。 pic.twitter.com/WM09RP2qUV
タグ: 統計
posted at 11:49:23
#統計 2つの少しだけ離れた正規分布の混合モデル。
個人的な意見ではこの場合もn=10でt検定を使って良いと思う。
別の例に続く pic.twitter.com/2s3AEHjrZP
タグ: 統計
posted at 11:45:18
#統計 2つの重なっている正規分布の混合モデル
このような形の分布は、入試で現役と浪人で分布が異なるせいで生じたりします。
この場合のt検定はn=10でも十分すぎる精度を持っている。
別の例に続く pic.twitter.com/QhS0u0SP9n
タグ: 統計
posted at 11:43:33
#統計 帰無仮説下の統計モデル内でP値が5%以下になる確率を、実践的に出て来易い感じの分布について標本サイズを動かしてプロットしてみました。
ガンマ分布Gamma(2,3)の場合
t検定でP値が5%以下になる確率が6%を切るためにはn=40程度以上の標本サイズが必要になっている。
別の例に続く pic.twitter.com/YRtZHikKvp
タグ: 統計
posted at 11:40:43
ChatGPT Code Interpreterにメタ解析をさせてみました。
ChatGPT Noteable pluginと比較して、結果が出るまでのエラーがかなり多く、自己修正して結果までたどりつきはするものの時間とトークンの消費が大きいです。 pic.twitter.com/aFxtHagsPo
タグ:
posted at 11:29:07
「「次の因数分解はまちがいである」という表現は不適切でございます。」
不適切だと認めたのはこの部分だけなんだよね。
ここだけ修正してもこの設問の不適切さは変わらない。
タグ:
posted at 10:33:46
「必ずしも係数をくくりださなくても因数分解できてるといえる」
なんでわざわざ「必ずしも」を入れて変な文章にしたんだろう。
www.seishinsha.co.jp/ssimg/c/su/202...
タグ:
posted at 10:24:29
”たとえ軽症で済んだとしても、新型コロナウイルスに感染することで、3カ月以上にわたって精液の質が低下する可能性のあることが、欧州ヒト生殖医学会の年次集会(ESHRE 2023)で発表された”
これはちょっと深刻な話だな…
diamond.jp/articles/-/325...
タグ:
posted at 10:12:12
非公開
タグ:
posted at xx:xx:xx
Chihiro Nakayama @cnakayama1958
私は東大文学部卒でNHKに入りましたが、福島の原発事故後に退職しました。理系にならなくてはと思い、福島医大大学院に入って一からやり直し、医学博士となりました。今は「福島で続く放射線健康不安にはマスコミの影響がある」という事を実証研究しています。伊藤先生の「暴論」は結構納得出来ます。 twitter.com/GoITO/status/1...
タグ:
posted at 08:54:39
@aqcichRmdB1Aln8 特に問題文に言及がなければ〇にしますよ。
きっと俺の教員生活は間違ってないさんは、言及がなくても減点にするのですか?
分母の有理化も必須ですか?
タグ:
posted at 08:46:15
>納得できない理由で×にされると
そういう問題ではないんだよね。嘘を教えられている案件なので、子供が納得すればよいというものではない。むしろ納得して受け入れてしまっている子こそが被害者と言える。
納得云々だと、正しい採点でも納得しない子がいたらだめなのかという話にもなってしまうし twitter.com/tokyosukusuku/...
タグ:
posted at 08:12:24
数学の勉強を新しい公式を教えてもらうことだと思っている人は多い
そんな勉強の何が怖いかって?
数学が得意だと思っていたのに、高校1年生くらいで何やればいいかわからなかなり初め、それでもそのやり方が通用する範囲ではそこそこ定期テストで点数が取れるから、理系に行ってしまったりして、
タグ:
posted at 07:09:49
一様分布は対称分布で尖度は-1.2で負。(尖度の下限は-2)
これとは逆に対称分布で尖度が∞の場合の例が以下のリンク先
↓ twitter.com/genkuroki/stat...
タグ:
posted at 05:15:57
そのせいで、小さなnでは、標準正規分布を使って得たP値は余計に大きくなり易い。
母集団分布が正規分布ならTはt分布に従うので、標準正規分布をt分布に置き換えれば良い。
母集団分布が非正規分布の場合にも、その補正はそう悪くはない。そうなる理由を上に書いた。
さらに上には数値例もある。
↓ twitter.com/genkuroki/stat...
タグ:
posted at 05:10:37
中心極限定理が十分効いていれば、標本平均X̅が従う分布は平均μ、分散σ²/nでよく近似され、(X̅-μ)/√(σ²/n)が従う分布は標準正規分布でよく近似されている。
しかし、σ²に不偏分散S²を代入したT=(X̅-μ)/√(S²/n)の分布は、不偏分散S²の分散のせいで、標準正規分布から離れる。
タグ:
posted at 05:05:18
標本サイズが数十から百以上では、使用するt分布の自由度が大きくなって、標準正規分布でよく近似されるようになり、t分布を使った保守的な補正の影響は小さくなっている。
こういう感じの話に(正確な意味はまだ不明だが)【高次漸近性】と言い出すのはおかしいのではないか?
タグ:
posted at 04:58:18
分布の非対称性が、平均を見ることも適切な程度にマイルドならば標本サイズnが数十から百程度で、標本平均が従う分布が正規分布で十分に近くなっている可能性が高い。(かなり雑な言い方をしていることに注意)続く
タグ:
posted at 04:54:05
母集団分布がどの程度非対称性だと標本平均への中心極限定理の効き具合を十分にするためにどの程度標本サイズnを大きくしなければいけないかは、結構めんどくさい問題。
指数分布並に非対称ならそもそも平均を見ること自体が不適切な可能性が高い。(t検定とそれに付随する信頼区間は平均を扱う)
タグ:
posted at 04:51:05
標本サイズnが数十以下であっても、標本分布が従う分布が正規分布でよく近似されているためには、母集団分布が左右対称かそれに近い必要があります。
実践的には分布の対称性を保証できる場合は稀だと思います。続く
タグ:
posted at 04:46:47
続き。だから、t検定におけるt分布を使った補正の妥当性が問題になるのは、高々数十程度の小さめの標本サイズnの場合に限ります。
さらにt検定の使用が妥当であるためには、標本平均が従う分布が中心極限定理によって正規分布でよく近似されている必要があります。続く (以下、引用ツイートはしない) twitter.com/bluesnono/stat...
タグ:
posted at 04:42:51
【t統計量の標本分布をt分布で近似する際の高次漸近性】
②【高次漸近性】???
「漸近性」は標本サイズn→∞での何かの漸近挙動という意味だと思うのですが、n→∞とするとt分布は標準正規分布に近付くので、十分大きなnではt分布を使うことによる補正によるP値の上昇幅は小さくなります。続く twitter.com/bluesnono/stat...
タグ:
posted at 04:36:48
【t統計量の標本分布をt分布で近似する際の高次漸近性】
①【t統計量の標本分布をt分布で近似】
標本分布???
正しくは「t統計量が従う分布をt分布で近似」だと思われる。
続く twitter.com/bluesnono/stat...
タグ:
posted at 04:32:42
@0315_osami そんなところです。
ただ、元ツイートの意図は、もっと変えたいということより、今回の件が不当な手段で変えさせたかのように言う輩がいたので、そういうことをする意思や力があるなら他にもやってるだろうということが言いたかったんです。
タグ:
posted at 01:49:01
@022023Momoko 家電なんかが壊れたときとか、医学的知識とか、僕は理系の知識ってめちゃくちゃ生活において大事だと思ってます。
また、その知識がないと、BBQでエタノール使って・・・みたいな事故がおきます。
むしろ文系の知識の方が、ネットが発達して必要性が低くなってる印象です。
タグ:
posted at 01:21:53
#統計 #Julia言語 のDistributions.jl の便利なところは、確率分布オブジェクトを作ることができるので、確率分布を引数に持つ函数を普通に定義できることです。
そのことを使うと、複数の確率分布に関するシミュレーションを1つの函数で実行できます。
nbviewer.org/github/genkuro... pic.twitter.com/NMcSU3oYAZ
posted at 01:00:13
それは悪手です。工学部のひとに多い印象があるんですが、自分の学問分野の方法や制度が、あらゆる分野に共通すると思ったら大間違いです。たとえば、かつてマンガ研究は、査読論文のほうが在野の書き物より水準が低かった。 twitter.com/nananao2236/st...
タグ:
posted at 00:59:34
#統計 母平均μの母集団分布distと標本サイズnを与えて、
分布distのサイズnの標本をランダムに生成して、仮説μ=μ₀のt検定のP値を計算して記録
を100万回繰り返した結果を使えば、
P値がα以下になる確率
を計算できます。
nbviewer.org/github/genkuro... pic.twitter.com/5LpGWE8iZs
タグ: 統計
posted at 00:48:58