黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2020年12月13日(日)
「本書はルベーグ測度論を仮定せず、自然科学・人文科学・社会科学の 研究をしている人を主な読者に想定しています」。まさに僕のような生物学者が含まれていますね。統計学者には普通でも我々のような「ベイズ統計に初めて出会った人には説明がなされないこと」がまさにありました。
タグ:
posted at 00:17:45
「統計的推測において 用いられた方法の適切さを、哲学・信念・主義・原理・直観によって評価することはできないと思います」この点、僕も同意です。実験生物学においても人間側のアイデアはデータでテストされるのが普通です。
タグ:
posted at 00:22:19
そもそも「これ何算?」と考えてしまうように子供を誘導してしまったらアウトだろう、といつもの陳腐な発言を繰り返そうと思ったが、以下のあおじるさんの説明の方が良いので、その発言はしないことにして、あおじるさんのコメントを紹介することにした。 #超算数 twitter.com/kale_aojiru/st...
タグ: 超算数
posted at 00:24:03
ごまふあざらし(GomahuAzaras @MathSorcerer
つまり全ての言語は Julia のライブラリ! twitter.com/genkuroki/stat...
タグ:
posted at 01:21:20
非公開
タグ:
posted at xx:xx:xx
#統計 私が勧めて来た渡辺澄夫『ベイズ統計の理論と方法』の良さそうな読み方
①汎化誤差(汎化損失)とAICをコンピュータで計算して、p.80の下から10行目の結果を数値的に確認する。最尤法がうまく行く場合には非常に綺麗にうまく行きます。
②同様のことをWAICに関するp.119の定理15について行う。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 02:07:40
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
某整理してる人、標準的な解釈が間違っているという発想がないというか、広まってるから正義っていうかなりアブナイことを言ってる自覚あるのかな?
あとベイズだろうと頻度だろうとパラメータが定数とは一言も言ってないですよね?
タグ:
posted at 03:05:13
最適なパラメータが定数(一意とは限らないが、確率変数ではないという意味で)なら #それはそう
当然、真の事前分布から発生させる問題を考えてはいけないわけではない:
twitter.com/genkuroki/stat...
タグ: それはそう
posted at 03:14:41
後者の定式化の古い自明な結果として、真の事前分布とモデルを知っていればそれを用いたベイズ推測が期待リスクを最小化するというもの。
watanabe-www.math.dis.titech.ac.jp/users/swatanab...
タグ:
posted at 03:19:49
そしてそれが有効なマレな場合の仮想的な例もちゃんと言及されている。
watanabe-www.math.dis.titech.ac.jp/users/swatanab...
人の研究室にレッテルを貼るのは人としてどうかと思うぞ
タグ:
posted at 03:25:13
#統計 真の事前分布がある場合への一般化は自明ですよね。
しかも、真の分布族 q(x|w) と真の事前分布 ψ(w) がそのままモデルの分布族と事前分布に等しいという設定は、科学的な研究に使おうと思っている人達にとっては辛すぎ。 twitter.com/nhayashi1994/s...
タグ: 統計
posted at 04:04:26
#統計 まさに自明な結果。
ベイズ法の予測分布は単純な条件付き確率分布なので、その結果は実質条件付き確率分布の特徴付けの話でしかない。 twitter.com/nhayashi1994/s...
タグ: 統計
posted at 04:09:14
ベイズで検索すると「PCR」ネタで信頼できる医療関係者を非難する発言がヒットするので、大量にミュートしたときに、ついでにミュートしたのが結構あったはず。
主観ベイズの変な人からリプライが飛んで来たら「うひゃー」と言いながらミュートでいいと思う。
タグ:
posted at 04:16:43
ベイズ統計およびその周辺の技術が使われるようになった理由は実際にそれが使える道具だからで、主観ベイズ主義が正しいからではないです。
ベイズについて書けば視聴率を稼げるので、主観ベイズ的な言説も同時に宣伝されちゃいましたが、全部ダメ扱いで問題なし。
タグ:
posted at 04:19:57
#統計 周辺尤度をevidenceと呼ぶだけではなく、本当に「証拠」だと思っていたりする(笑)
周辺尤度の対数の-1倍の(データの確率的揺らぎに関する)期待値がKL情報量(n=0での真の予測誤差)になっていることもおそらく知らない。
「主義」にかまけて、十分な知識が得られていないのだと思う。 twitter.com/nhayashi1994/s...
タグ: 統計
posted at 04:58:58
主義にかまけてる人たちの厄介なところは主義ドリブンな彼らのルールにおいてはすべてが何らかの主義に基づいてることになり、無敵の人になるんですよね。汚い twitter.com/genkuroki/stat...
タグ:
posted at 05:01:12
そういう発想だから渡辺ベイズは新たな主義だというちゃんちゃらおかしいことを言い始めるんだと思う。
彼らの常套手段としてトップ雑誌の論文の権威を借りるものもあり、渡辺ベイズや著者の資料読むより統計四大誌の主観ベイズ論文を読め文句あるなら論文を書けという論法もあるのんな
タグ:
posted at 05:04:30
主義ドリブンで認知しているため、それぞれの定式化の数学的長短所がわからないのだろうか。彼らのターミノロジにあわせたときの「渡辺ベイズという新たな主義」(またはAkaikean)の数学的なメリットが理解できず、主義による衒学的な物言いで人を煙に巻いて勢力拡大を図っているのだろうか。
タグ:
posted at 05:10:41
今までダマだっただけで実際は彼らの言動を色々見てはいますが、数学プロパー特有の科学主義というレッテルもありました。実データを扱ってる方が偉くてその経験がない数学プロパーの主張は空虚だそうです。あほくさ
タグ:
posted at 05:17:04
#統計 具体的に誰にことなのかわかりませんが、「主義」好きの人達の中に権威的な態度を取る人がいることは知っています。そして権威に弱い人達も非常に残念なことに沢山いる。
しかし、そういう権威的な態度を取った瞬間にその人は「キャン!(泣)」とないているのだと私は思います。 twitter.com/nhayashi1994/s...
タグ: 統計
posted at 05:18:31
1.主観ベイズの正当化根拠は意思決定論
2.主観ベイズが標準的なのはみんなが使っていてトップ雑誌にもたくさん最近の論文あるから
1はその定式化の甘さが突っ込みどころになりますがそれが間違いとは言えません。
2は大衆迎合してればよいという学問として破綻した態度です。
タグ:
posted at 05:23:13
1への反論は特異学習理論のもろもろの結果が与えますが主観ベイズの変な人たちはなぜか認めません(論文も読もうとしません)。その理由として2をあげてなんとかして主観ベイズを庇おうとして滑稽な地獄ができています。
タグ:
posted at 05:23:14
なんかこう、数学プロパーは実データをさわってないから変なことを言うのだという話もそうなんですが、掛け算順序肯定派と主観ベイズの変な人たちは同じかほりがします。
ロジックが壊れてるんですよ。
掛け算順序と違うのは、主観ベイズの枠組みそのものは意思決定論の公理を用いて正当化される点です
タグ:
posted at 05:25:44
@sekibunnteisuu @golgo_sardine @uKi2wQXyG7rx3gL ①これ何算?
②わり算
③A÷BとB÷Aは違う
④さあ、どっちだ?
のような考え方をさせてしまった時点でひどい教え方をしていることになります。
どちらの順序か分かる前にわり算だと決定するのはおかしい。
タグ:
posted at 05:47:39
Distribution of the binary heap of a sample (size = 2^20-1) of the uniform distribution on the interval [0, 1]
1. x = array index, y = value
2. empirical cdfs of "blocks"
3. empirical pdfs of "blocks"
For the details, see the #JuliaLang source code gist.github.com/genkuroki/f8e1... twitter.com/thienan496/sta... pic.twitter.com/Mr3StdtFJn
タグ: JuliaLang
posted at 06:44:33
非公開
タグ:
posted at xx:xx:xx
たとえば死海に引っ越して寿命を延ばそうとしても意味はない。歳をとる速さの変化は、きわめて微小である。しかし地球のような物体の年齢を考えるときは、注意が必要かもしれない。地球中心の年齢は、地表よりも1日か2日は若いからである。
タグ:
posted at 07:32:48
最近色々論文読んで実験してて思うけど、ML系の研究って、マジで再現性のないアンフェアな実験に基づいたプレゼン大会と化してるよな。。。これほんまにやってて楽しいのかよ
タグ:
posted at 07:38:22
test setでグリッドサーチするオツムの人がトップカンファでもいるレベルなので、そもそもアンフェアだってことに気付いてないとかありそう。まあ確かにそれだったら本人は楽しいのかな
タグ:
posted at 07:44:22
頭わるい人って他人の怒りを何でも私怨か嫉妬にしがちだし、根本的な誤謬の指摘を揚げ足取りとか言い張りがちだよね。 twitter.com/yattaruTeacher...
タグ:
posted at 08:37:10
意味理解を問いたいならむしろ順序ではなく、こういったダミーの数字を入れればいい。【1つ分×いくつ分】で意味理解が促されるというエビデンスはないし、順序を問わず内容を理解している子も多い。 twitter.com/tsehikef/statu...
タグ:
posted at 08:54:13
その鋳型注入が数理の苦手な子を増やす、という経験則で良ければTwitterにたくさんありますよ。
#パターンマッチング宣言 twitter.com/tsehikef/statu...
タグ: パターンマッチング宣言
posted at 08:58:11
富谷(助教);監修 シン仮面ライダー @TomiyaAkio
今のところ、Julia からPyCall でnumpy.loadtext でファイルから読み込み、Julia でループ回して計算、PyPlotで図を書くのが一番僕的に楽な感じ。
タグ:
posted at 09:17:12
JuliaでGPGPUして爆速でBuddhabrotを描き出す scrapbox.io/totti95u/Julia...
福島高専 Advent Calendar 2020 13日目の記事を書きました。何も知らない人向けのGPGPU講座です。宜しければ是非
タグ:
posted at 10:00:01
@bkw_approx ご存知かも知れないですが、JupyterはJupiterから取っただけではなく、Julia、Python、Rも指したものでもありますし。
blog.jupyter.org/i-python-you-r...
タグ:
posted at 10:03:56
正しくは、量子コンピューターなら200秒で解けるけど富岳なら6億年かかるような問題を作ったわけです twitter.com/nikkei/status/...
タグ:
posted at 11:30:22
こういう文字列パターン・マッチングによる御指導、いや誤指導の究極形態が「わの前ののの前!」だな。
(いや、第二、第三の究極形態がすぐにも現れてくることだろうて。) twitter.com/tsehikef/statu... pic.twitter.com/JYsuPsx5ds
タグ:
posted at 12:48:01
武田邦彦・内海聡・藤井聡らの共同声明は、まあ武田と内海がいる時点でトンデモとして無視してしかるべきなんだけど、それでも読んでみると、アメリカやヨーロッパで新型コロナがあれほどの猛威を奮っている現実は全く無視かよ、という感想しか湧いてきません。かなりどうかしている
タグ:
posted at 13:36:25
これを読んで分かるのは、定額給付金やらなんやらを必死になって止めてるのは財務省だってことですよ。
財務省には国民の命よりだいじなものがあって、それは財政再建という何の役にも立たないものです。
彼らは国民を殺してでも財政再建を実現したい。もちろんその暁には日本経済は崩壊しています twitter.com/masa_kuppa/sta...
タグ:
posted at 13:56:20
よしんば後半に名を連ねていないのだとしても、武田邦彦や内海聡と連名で共同声明を出した時点で、トンデモさんの仲間です twitter.com/sf_satoshifuji...
タグ:
posted at 14:18:55
「順序が間違ってるからバツ」みたいなトンチキな採点基準を捨てちゃえば、こういう子供はすぐゼロにできるので twitter.com/Tsehikef/statu...
タグ:
posted at 14:42:03
#超算数
これがあの有害なパターンマッチ教育の典型例。
これに従う子は、通常の文章読解をせずに、「ずつ」「分」「倍」などのキーワードをひろって式を書くようになる。
子供の論理性が破壊されるだけではなく、読解力も破壊される危険性があるので、保護者は注意を払った方がよい。 twitter.com/tsehikef/statu... pic.twitter.com/PXYKVbAEPt
タグ: 超算数
posted at 14:54:34
#Jupyter の名前の由来
I Python, You R, We Julia by @Mbussonn blog.jupyter.org/i-python-you-r... pic.twitter.com/w0eKVzKWZE
タグ: Jupyter
posted at 15:20:44
ショートケーキのイチゴは最後に食べるという強いこだわりがあり、それを他人にも強いてイチゴを最初に食べる子には殴りかかるような児童が学級にいたら教師としてどのように対処されますか? twitter.com/Tsehikef/statu...
タグ:
posted at 15:34:20
@temmusu_n つまり、以前の天むす名古屋さんのTWの
>ところが「7月の資源回収量は全体で80kg、うちペットボトルが20kg。9月は全体100kg、ペット20kg。ペットの割合が高いのはどの月?」という問題の正答率は28%と低かった。
という問題の場当たり的対策です。(短絡思考な教育関係者ならやりそうな) #超算数
タグ: 超算数
posted at 15:42:59
なるほど、藤井聡氏はこういう邪悪な人たちと一緒に政治活動をすることを恥じない人だったのね。
クズ確定。 pic.twitter.com/9vofmYnY9f
タグ:
posted at 15:45:08
#統計 空データから作ったサイズnのデータの予測分布は
p(x_1,…,x_n)=∫p(x_1|w)…p(x_n|w)φ(w)dw
であり、尤度の対数の-1倍の期待値
∫…∫q(x_1)…q(x_n)(-log p(x_1,…,x_n))dx_1…dx_n
がその汎化誤差で、この汎化誤差の推定量としてデータX_1,…,X_nに感する
-log p(X_1,…,X_n)
を使う。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 16:09:52
#統計 ひどい!訂正します。
❌最尤法はモデルを複雑なものにしなければうまく行かない。
⭕️最尤法はモデルを単純なものにしなければうまく行かない。
⭕️最尤法はモデルを複雑なものにするとうまく行かない。
こういうひどい間違いは結構ある。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 16:54:35
よくある政治活動と同様のレッテル貼りのレトリックを使うようになっちゃあまずい。
論理的・科学的な議論では、手堅い知識になる部分を最初におさえに行くのが定跡です。特に数学は最も手堅い部分でしょう。
最終的に「主義」の話もしてよいとは思いますが、そういう議論は後回しにするべき。
タグ:
posted at 17:29:19
#統計
もしも、「ある弱い前提」=「分布族が対象を十全にモデル化していない場合に得られる最善の結果(当然真理から程遠くなる)を真理とみなすという前提」だと解釈しているとすれば、あまりにも非常識だと思います。
添付画像2の部分はひどいデタラメ。
Earman 1992のreferも不適切です。 twitter.com/hidekatsu_izun... pic.twitter.com/TdClArw1MH
タグ: 統計
posted at 18:19:38
#統計 『統計学を哲学する』の読者は、【Galton (1886)】(p.17)とか【Earman, 1992, pp.144-149】(p.83)のように文献をreferしていても、【「Major axes」~が回帰直線】とか、上で指摘したデタラメとか、引用した文献には書かれていないおかしなことが書いてあるので要注意。 pic.twitter.com/FnK5KHm4yn
タグ: 統計
posted at 18:25:57
#統計 2つの回帰直線OM, ONと(見た目的には最も自然に見える)「楕円の長軸」が一致しないということが一目で分かるようにGaltonさんの図は描かれています。
そういう図を引用して「楕円の長軸」を「回帰直線」と説明している😱
『統計学を哲学する』の読者はこういう点にも注意するべき。 pic.twitter.com/euyCnkboOB
タグ: 統計
posted at 18:39:56
感覚的な話、普通の業務でもAST変換くらいはしたくなる場面めちゃ多くないですか。関数化するとかは当然として、コードの規模が大きくなればなるほど、言語の構文的に書かなきゃいけないけど本質的に意味のない重複ってめちゃある気がする。いつもJuliaならもっと綺麗にできるのになーって思ってる。
タグ:
posted at 20:38:23
#統計 渡辺澄夫『ベイズ統計の理論と方法』のpp.20-21の事後分布=尤度函数のプロット
ソースファイル #Julia言語
nbviewer.jupyter.org/gist/genkuroki...
真の分布のパラメータがa=0.5, b=2の場合。
グラフでは縦軸がaです。
これは、はっきりと正則モデルの場合。
プロット中の最も明るい点が最尤法の解。 pic.twitter.com/kfz71sbojl
posted at 20:47:21
#統計
nbviewer.jupyter.org/gist/genkuroki...
ab=0の特異モデル直上の場合。
尤度函数の台はab=0の近くに集中し、正則モデルの場合と違って、nを大きくしても尤度函数の台は1点に収束したりしない。
このような場合には最尤法は危ない。ベイズ法を使った方が良い。 pic.twitter.com/34xxXjK0R1
タグ: 統計
posted at 20:55:43
#統計
nbviewer.jupyter.org/gist/genkuroki...
真のパラメータがa=0.5, b=0.2の場合。
これは特異モデルになるab=0の場合に近い。
特異モデル直上ではないが、まるで特異モデルのように尤度函数がふるまっている。
この場合は純粋数学的には正則モデルだが、実践的には特異モデル扱いした方が良いかもしれない。 pic.twitter.com/ZMyhSlGJX6
タグ: 統計
posted at 20:58:27
OokuboTact 大久保中二病中年 @OokuboTact
本屋で算数教育の本をよくチェックするけど、掛け順について書いてある参考書(教師向けの)が増えた気がする。
ネットの影響だと思う。
もちろん、掛け順に肯定派の参考書ばかり
#超算数
タグ: 超算数
posted at 21:55:26
OokuboTact 大久保中二病中年 @OokuboTact
最新版の「学習指導要領・解説」に掛け順がばっちり書いてあることでもわかるように、算数教育世界では掛け順強制が当たり前になって来ている。
ネットで叩かれば叩かれるほど、算数教育世界では掛け順強制を徹底するような雰囲気
#超算数
タグ: 超算数
posted at 21:59:33
財務省が問題と言っても、最後に決めるのは政治じゃないですか。僕らは役人を選挙で選べないんですよ。政治にNOを言うしかありません。財務省に従っていたら選挙に負けると政治家に知らしめるべきです。
タグ:
posted at 22:00:27
OokuboTact 大久保中二病中年 @OokuboTact
@uKi2wQXyG7rx3gL そんなことはないでしょう。
ただ算数教育の偉い人達が掛け順強制を推奨しているだけです
タグ:
posted at 22:09:29
@physics_cats @nabekichi32 大学入試で二次試験、記号で答えよ、をそのものを書いてしまって後から気づいて不安だったが合格した、というツイートを読んだことあります。
大学側は、「記号で答えよ」を見落とさずに読み取れるかどうかよりも、その教科を理解しているかどうかを重視するだろうから、当然でしょうね。
タグ:
posted at 22:15:30
Im(Nyarn)@linuxナニモワカ @Imaginary_Nyarn
同じこと言ってる人がいた
JuliaはPythonよりも電卓としても使いやすいからPythonをその用途で使ってる人は乗り換えよう(威圧) twitter.com/Totti95U/statu...
タグ:
posted at 22:17:16
何も無理なことは言ってないと思うんですね。デフレだから2%になるまで国債を刷ってくれ、そして日銀にファイナンスしてもらってくださいと。それだけですよ。何が問題ですか?やらない方が怠慢じゃないですか?国民は疲弊し、自殺も増えてるのに。総理はニヤニヤ、何が楽しいんでしょうか?
タグ:
posted at 22:31:46