黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2022年06月26日(日)
#統計 ロジスティック回帰のP値函数のヒートマップの例
github.com/genkuroki/publ...
各xごとに最尤法でデータの数値にベストフィットする確率パラメータ値pが決められているのですが、各xごとに各pにP値を対応させてヒートマップでプロット。
点線はサンプルの生成に使われたpの値です。 pic.twitter.com/zQqROROvzN
タグ: 統計
posted at 00:48:33
@uKi2wQXyG7rx3gL いえ、3つの公式を使って問題を解くことを教えている先生は全員アウトです。
それだと、算数が苦手で小数の割り算をできない子は困る場合が増える。
そして、算数がそう苦手でない子も理解から遠ざけることになります。公式を習っていない小3の子が解ける問題に公式を使うようじゃ全然ダメです。
タグ:
posted at 01:00:49
#超算数 これ、3つの公式に数を当てはめさせて式を作って問題を解くように教えていること自体が問題で、「きはじ」「くもわ」のようなダメな教え方が出て来る原因になっています。
公式に数を当てはめて問題を解くようでは、小3レベルの理解度にも達していないことになります。 twitter.com/genkuroki/stat...
タグ: 超算数
posted at 01:03:50
よく分からないけど,分数や少数の計算をするよりもきちんと概念を理解して比を使って整数の計算をする方が楽だと思うけどなぁ.
常識として速さが2倍になると同じ時間で進む距離が2倍だから時間は半分みたいな感覚の方がいいと思う.
こういうのも具体的な数字を変えて色々理解したいところ twitter.com/genkuroki/stat...
タグ:
posted at 01:10:43
#統計 これはWald型の信頼区間を与えるP値函数のプロットです。正規分布近似を使っている。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 01:15:57
比例の関係をきちんと身につけたい単元ですよねぇ.
3mで500円のものを6m買うといくらか?みたいに身近に比例の関係は多く存在する.
どれも比例の関係だなと分かれば同じこと twitter.com/genkuroki/stat...
タグ:
posted at 01:38:00
#統計 正規分布近似を使ったP値函数の計算では、Fisher情報量行列の逆行列を使っています。
コードを見ればわかることですが、素朴に実装しています。
自動微分を使えばもっと楽をできたかも。
github.com/genkuroki/publ... pic.twitter.com/7B5yftNbi5
タグ: 統計
posted at 01:40:15
@genkuroki すごい時代になりましたねえ。昔の仕事でそれまで手作業と勘でやっていたことをなんとかしろと言われ、どうしてもロジスティック回帰が必要で統計ソフトの購入とWinPCへのインストールの申請をしたらどちらも却下されて仕方なく泣く泣く、その当時は丹後先生の本しかなくて(クラインバウム本は高くて
タグ:
posted at 01:40:18
@banyanyanmi 大変そうだけど、面白そうな話です!
各時代ごとに、あり合わせの道具だけでやりたいことをできてしまうのが、本物の力だと思いました。
話題のあの高校教科書のやり方だとそういう人は育ちそうもない感じ。
タグ:
posted at 02:02:47
@genkuroki その後Rが出てきて「Rもあーるよ」とか言ってみたけどだめだったな。とりあえずケチで臆病な会社だった。でも一から実装できたのは自分の勉強になったのでよかった。最初は機械学習自体わかってなかったからww。
タグ:
posted at 02:03:27
#Julia言語
エフェクト解析による動的言語最適化 Part.1 atl.recruit.co.jp/blog/5455/ @rtech-atlより
タグ: Julia言語
posted at 02:05:19
This chart shows the distances of the nearest stars from 20,000 years ago until 80,000 years in the future. Bonus: the distance of Voyager 1, whose closest approach to Gliese 445 system will be in 40,000 years [source, read more: buff.ly/3NggWOx] pic.twitter.com/HxFLIxTkqg
タグ:
posted at 04:50:06
元ツイートはこれですね。
日本で中絶の際に必要なのは「配偶者同意」であって、未婚のパートナーの同意は関係ありません。
病院で父親の意思を尋ねられることはあるかも知れませんが、法的拘束力はありません。
中絶できないと勘違いして、出産後に子供を遺棄した女性もいます。
正しい知識を。 twitter.com/corgen1212/sta...
タグ:
posted at 10:23:45
当時のニュースのソースが見つかりました。
2件のクリニックで相談し、「パートナー同意」を求められたとのことですが、本来これは同意があれば望ましいぐらいのレベルで、なくても中絶できるはずです。
なので、このクリニックの対応はひどいです。本当に。
www.yomiuri.co.jp/national/20210...
タグ:
posted at 10:34:03
うげげ。
数学Iのデータの分析をΣ記号さえ使わずにやっているのか。
高校のカリキュラムの現状を無視していてかつ大学生向けの解説だとしてもひどすぎる例の情報2の教科書の立場は? twitter.com/f_sei/status/1...
タグ:
posted at 10:55:35
#数楽 taro-nishinoの日記: ミハイル・グロモフへのインタビュー taro-nishino.blogspot.com/2019/03/blog-p...
タグ: 数楽
posted at 11:56:43
多分、機械学習系の教育で統計モデルを使うようになった人達の中には、P値の概念を全く理解していない人達がいて、そういう人達は、医療統計の分野でyだけではなく、xの値も1,0のみになる場合のロジスティック回帰が昔からよく使われていることも知らないと思う。
勿体ないことだと思います。 twitter.com/genkuroki/stat...
タグ:
posted at 12:18:56
1つの数学的道具について、本質的に異なる複数の応用の仕方を知っていることは、考え方の幅を広げるために役に立ちます。
機械学習の道具だと思って統計モデルを使っている人達も、医療統計の道具としてロジスティック回帰がどのように使われているかを知れば、新しいアイデアを出せる可能性がある。
タグ:
posted at 12:21:29
医療統計では交絡の問題への対処が特に重要で(実際には伝統的な統計学の利用では常に交絡が問題になる)、そういうことは機械学習系の教科書では勉強し難いことの一つだと思います。
タグ:
posted at 12:26:19
あと、P値について健全な理解(主義に基く統計学を排除するような理解)があると、交絡への対処のような伝統的な統計学の知見にアクセスし易くなります。
P値函数と尤度函数と事後分布の使用法の類似を理解していれば特にそうなり易いと思います。
タグ:
posted at 12:26:21
以下のリンク先のグラフは、ロジスティック回帰のP値函数(伝統的な統計学での基本パターンである中心極限定理による近似を使ってP値函数は実装されている)なのですが、似たようなグラフをベイズ統計の方法で作ることもできます。 twitter.com/genkuroki/stat...
タグ:
posted at 12:28:55
勉強中の人達に偏見を持たせることによって、有能な人になることを妨げる言説は「この周辺」には大量に流れています。典型的なのは
❌P値を使うことは有害
❌頻度論とは異なるベイズ的な確率概念が必要
のような馬鹿げたことを言う人たちが困るものです。
これ、焼石に水でどうにもならない感じ。
タグ:
posted at 12:33:59
参考動画
youtu.be/ybdkQFEdCPM
京都大学 大学院医学研究科 聴講コース
臨床研究者のための生物統計学
「交絡とその調整」佐藤 俊哉(医学研究科教授)
3つ連続講義の2番目です。
伝統的な統計学では常識的な話題。
タグ:
posted at 12:38:44
#統計 続き
* 確率論では、確率の対数をとった量の主要項が系の性質を決定している場合が多い。キーワードは大偏差原理、エントロピー、情報量、Kullback-Leibler、Sanovの定理、Cramerの定理。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 13:10:42
#統計 [4]のように、確率の積を計算させると0にならないはずに量が容易に0になってしまいます。
[5]のように対数をとって計算すれば-950程度の「普通の数」になってくれます。
ロジスティック回帰モデルでの確率の計算では、確率の対数の方を使わないと容易に破綻する。
↓ pic.twitter.com/sRkG4wZeL5
タグ: 統計
posted at 13:43:59
#統計 尤度の対数の重要性に関する最高の解説は、20世紀の統計学における偉大な開拓者の1人である赤池弘次さん自身による1980年の2つの論説だと思います。数え切れないくらい紹介して来た。
その後の日本語圏での統計学入門の解説がこれらの影響を受けなかったことは日本語圏の黒歴史だと思う。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 14:03:25
#統計 しかも上の意味でのエントロピーに関連した練習問題は高校数学IIIの教科書に載っていたりします(笑)
おそらく、多くの秀才高校生がその重要性に気付かずに「対数を取れば区分求積法に帰着するだけの問題」として消費してしまっている。貴重な努力と才能がもったいない感じ。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 14:23:03
#統計 P値の話に戻る。
P値は統計モデルとデータの数値の整合性の指標の1つです(P値に関するASA声明)。
そのとき、「帰無仮説」は統計モデルのパラメータの値に関する仮説になり、現実に関する仮説にはなりません。
この点を不明瞭にするせいで、多くの不毛な誤解と議論を発生させています。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 14:36:40
あなたは、「オッズがどの程度であれば次の対局で藤井聡太竜王が勝つことにあなたは1万円賭けるか?」のような話では、ベイズ主義の主観確率の考え方は有用です。
P値を絶対視することは単なる誤用です。
P値云々と無関係に「誤用をするのはまずい」というシンプルな話。主観確率についても同様。 twitter.com/tsatie/status/...
タグ:
posted at 14:40:45
まずは統計学の教科書を、教科書の内容が正しいことを前提にせずに、普通の読み方をすることが必要です。
大学で習う普通の本の読み方では、どの分野であっても批判的に読むことを要求され、書かれている内容を合理的に再構成することになっていると思います。
まずは勉強しないとダメ。 twitter.com/tsatie/status/...
タグ:
posted at 14:43:33
あ、そのリンク先のような俗な解説についてきちんとダメ出しできるような普通の勉強の仕方が必要だと思います。
おそらく、満足に勉強するためには5年くらいはかかる。 twitter.com/tsatie/status/...
タグ:
posted at 14:46:09
まともな頭の使い方をできているかどうかは、相対的に信頼度が高い資料を上手に判別できているかを見れば分かることが多いと思います。特に専門分野以外でそれをやるときに総合力が分かる。
私のツイートを見ていれば、私が信頼度が相対的に高いとみなしている文献や動画が何であるかは明らか。 twitter.com/tsatie/status/...
タグ:
posted at 14:54:41
あと、統計学の数学的な定式化部分については、普通に数学なので、普通に数学として読めば概念的に誤解することはないです。
概念的に酷いことが書いてある本であっても、それで学んだ数学の部分は価値ある知識として必ず残る。
そして数学に部分の理解抜きに概念の正しい位置付けの考察は不可能。 twitter.com/tsatie/status/...
タグ:
posted at 14:57:38
自分で勉強して再構成して噛み砕いて教えることが仕事。
資料は自分で作って公開して万人の批判を仰ぐのが正解だと思います。 twitter.com/tsatie/status/...
タグ:
posted at 15:01:50
教師の側が現実にず〜っと統計学について真剣に勉強していないように見えることこそ大問題。
自分で勉強して理解していれば、自分の言葉で高校一年生に伝えられる。勉強しないと無理。
若い人相手に教える仕事は、人類を代表して猛勉強して、噛み砕いてそれを次世代に伝えること。 twitter.com/tsatie/status/...
タグ:
posted at 15:05:55
#統計 訂正
❌この10倍くらいのページを使って順番に
⭕️一冊の本を著す勢いで順番に
その1ページ分の解説を膨らませるだけで軽く1冊以上の本ができそう。😊 twitter.com/genkuroki/stat...
タグ: 統計
posted at 17:58:13
#統計 「無数のパラメータ値ごとにP値を計算して利用する」というP値の利用の仕方(ロスマンさん達の疫学の教科書にある)には、ベイズ統計での事後分布の利用に抵抗がなくなるというボーナス特典がついて来ると思います。
シンプルなモデルでは、P値と事後分布からほぼ同じ結果が得られます。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 18:47:57
New package: FiniteSizeScaling v1.0.0 announced #JuliaLang
FiniteSizeScaling: FiniteSizeScaling.jl: A Julia package for finding optimized values of phase transition parameters and critical exponents.
Registration: github.com/JuliaRegistrie...
Repository: github.com/owenpb/FiniteS...
タグ: JuliaLang
posted at 21:10:00
#ぷよ碁 だけに集中して再度対局した結果、
「 0対12で敗北しました。」 0勝83敗。
終盤、黒石消失。アタリに全く気付かなかった。 😖
#囲碁
puyogo.app/rp?kf=M0M0IzJC...
posted at 21:12:42
New package: TriangularIndices v0.1.0 announced #JuliaLang
Registration: github.com/JuliaRegistrie...
Repository: github.com/perrutquist/Tr...
タグ: JuliaLang
posted at 21:21:46
@golgo_sardine @R0M6Dx78PSWYAFW twitter.com/R0M6Dx78PSWYAF...
かけ算の順序でバツをもらう子は、交換法則を理解していて、かけ算の順序はどっちでもいいと正しく理解しています。
〇をもらう子は、教員の噓出鱈目の説明を信じてしまっていて、掛け算を理解していない可能性があります。
噓出鱈目を教える授業を聞いてはいけない。 pic.twitter.com/Fj9C1fL5vp
タグ:
posted at 21:41:54
@toro24f 失礼します。なぜ正解ではないのでしょうか?この答案を見れば理解していることは明らかですが。 pic.twitter.com/POqZuMNylY
タグ:
posted at 21:48:21
@golgo_sardine @R0M6Dx78PSWYAFW twitter.com/R0M6Dx78PSWYAF...
>あったら交換法則を理解していて✕をもらうなんて、ほとんどないことが分かると思いますよ。
いいえ、教員の想定と逆にしてバツになっているのにちゃんと理解しているケースはいくらでもありますよ。
タグ:
posted at 22:04:15
@golgo_sardine @R0M6Dx78PSWYAFW >ざわざ✕もらいにいく
別にわざとバツになる訳じゃないですよ。教員の想定する順序と同じになることもあるでしょう。逆になることもある。
タグ:
posted at 22:05:07
@golgo_sardine @R0M6Dx78PSWYAFW megalodon.jp/ref/2012-0930-...
式が教員の想定としてバツになった子のほとんど(おそらく全員)が正しく理解できている。 pic.twitter.com/2hgILGBgGL
タグ:
posted at 22:11:08
@golgo_sardine @R0M6Dx78PSWYAFW まあ、「長いものに巻かれろ」は、主義主張だけど
「交換法則を理解していて✕をもらうなんて、ほとんどない」は、客観的事実認識。
前者には「俺はそう思わない」となるけど、
後者は、「そもそも事実として誤り」となる。
タグ:
posted at 22:16:44
#統計 #R言語 にプロットさせたP値函数のグラフの例。 twitter.com/genkuroki/stat...
posted at 22:19:36
#統計 rate ratio に関するベイズ統計での事後分布のグラフ(上段)と対応する場合のP値函数のグラフ(下段)。これを見ればどのように対応しているかが何となく分かると思います。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 22:22:11
教育困難校にいる子をさらなる地獄に突き落とす教え方であると、社会全体から非難されるようにならないといけないと思います。
子供を殴る大人と同じ扱いが必要。
ところが、子供を殴っているのと同じ側をまるで殴る以外の教え方を知らない人達が庇う地獄がよく発生している。 twitter.com/xufd6g7akfvcal...
タグ:
posted at 22:46:37
#超算数 「1時間で3キロメートル進むとき、12キロメートル進むには何時間かかりますか?」という問題を出したら、きはじ図を描き出すようだと日常生活でも不便だろうし、小学3年生レベルにも達していないことになる。 twitter.com/genkuroki/stat...
タグ: 超算数
posted at 22:52:10
#Julia言語 これは見逃していた。後で読みたい。
www.matecdev.com/posts/julia-py...
Julia vs Numba and Cython: Looking Beyond Microbenchmarks
タグ: Julia言語
posted at 23:37:51