Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
並び順 : 新→古 | 古→新

2018年03月13日(火)

ceptree @ceptree

18年3月13日

今ざっくりやってみた。Juliaでアニメーション作成時間の比較。grめっちゃはやい!

Plots : 27秒
Plots(gr) : 1.5秒
PyPlot(imagemagick) : 21秒
PyPlot(ffmpeg) : 5秒 pic.twitter.com/BSicpsVbOK

タグ:

posted at 00:00:09

アヲギリ @Aogiri_m2d

18年3月13日

うぉ…バックエンドをGRにしたら,めっちゃ速くなりましたね….体感速度が全然違う.

タグ:

posted at 00:01:24

ceptree @ceptree

18年3月13日

これはPythonのmatplotlibでもgrをバックエンドで使えるようにしたい。できるらしいがうまくいってない。

タグ:

posted at 00:02:32

Hiroyasu Kamo @kamo_hiroyasu

18年3月13日

@y_bonten @genkuroki @hyuki @phasetr 実数の連続性のさまざまな定式化(なんと22通り)とその同値性について赤攝也『実数論講義』でやたらめったら論じられています。www.nippyo.co.jp/shop/book/6556...

タグ:

posted at 00:12:34

黒木玄 Gen Kuroki @genkuroki

18年3月13日

twitter.com/genkuroki/stat...

#統計 #Julia言語 リンク先の地味な動画ですが、見直すと結構おもろい。

右半分のプロットで、ほぼ収束した後では、予測分布のKL情報量(予測誤差)の動きと、WAICの動きが逆相関になっていることがよく見えている。T_trueは渡辺澄夫さんの本の記号でのL_n(w_0)と同じ。

タグ: Julia言語 統計

posted at 00:26:06

アヲギリ @Aogiri_m2d

18年3月13日

亜臨界ピッチフォーク分岐.GRのおかげでgifも楽々できるようになったので初期値も増やせる. pic.twitter.com/EluTZUkhlt

タグ:

posted at 00:31:48

黒木玄 Gen Kuroki @genkuroki

18年3月13日

twitter.com/genkuroki/stat...

#統計 #Julia言語 リンク先の2つ山混合ガンマ分布を2つ山混合正規分布でフィッティングする動画の右半分を見ると、WAICと真の予測誤差(KL情報量)がもろに逆相関している様子が見える。

このようにWAICによる予測分布選択では注意が必要です。

タグ: Julia言語 統計

posted at 00:32:27

Daisuke KATO @Dsuke_KATO

18年3月13日

これで4秒ちょっとPlots(gr) pic.twitter.com/IYp8sVYGV3

タグ:

posted at 00:41:35

ぼんてんぴょん(Bontenpøn) @y_bonten

18年3月13日

「正三角形の二辺だけに着目すれば等しいので二等辺三角形」という納得に、それ以上どんな深遠な悟りが残ってるんだ…… twitter.com/OokuboTact/sta...

タグ:

posted at 00:47:42

非公開

タグ:

posted at xx:xx:xx

@yamaday

18年3月13日

今社内教育みたいなの特にないけど、もし導入するとして一番最初に必要なの食育とか家庭科とかその辺なのではって思ってる

タグ:

posted at 00:51:00

Hiroyasu Kamo @kamo_hiroyasu

18年3月13日

@y_bonten @genkuroki @hyuki @phasetr 数え間違えました。24個の公理です。大小関係に関して双対なものを一つに数えると、20通りです。

タグ:

posted at 00:59:26

Marcel Dirsus @marceldirsus

18年3月13日

Don't worry guys, bananas will save us

pic.twitter.com/2qjF4VQM1i

タグ:

posted at 01:03:27

marubon @shu_marubo

18年3月13日

Juliaについての本読んだけど、Juliaクックブックっていうjupyterファイルと公式ドキュメントで当面は十分だったなーって感じ。
読んだ本は日本で発売されてるやつではないので、そっちも読んでみたい

タグ:

posted at 01:08:33

Paalon @paalonshamoji

18年3月13日

Juliaの(計算の)進捗メーターライブラリ
github.com/timholy/Progre...

タグ:

posted at 01:38:26

Dave Richeson @divbyzero

18年3月13日

Had fun amazing my colleagues with Tadashi Tokieda's puzzle: Put this inflexible disk through this square hole without ripping the paper. Video: www.youtube.com/watch?v=AvFNCN... pic.twitter.com/X8GpAlFeeE

タグ:

posted at 02:03:39

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

18年3月13日

twitter.com/kimrin/status/...

#Julia言語 多変量確率分布のプロット

添付画像は Multinomial(2^5, [0.3, 0.5, 0.2]) のpdfのプロットの例

ソースファイル↓
nbviewer.jupyter.org/gist/genkuroki...

本当は定義域を三角形型に表示したいのですが、その方法はわかりませんでした。 pic.twitter.com/ESCeDfnRag

タグ: Julia言語

posted at 03:12:39

きむりん(小六女子) @kimrin

18年3月13日

@genkuroki あ、あ、ありがとうございます!!
助かります。参考にいたします!!

タグ:

posted at 03:52:07

@kuri_kurita

18年3月13日

削除した人の考えを“忖度”しちゃうと、文脈も何もお構いなしに「名前が出ていた」だけで鬼の首でも取ったように騒ぐ人が出るのは予想がつくので(実際そうなってる)、面倒を避けるためには文脈も何もお構いなしに出てきた名前は残らず削除しちゃおう、って感じだろうか。

タグ:

posted at 04:30:02

™ (blueskyに同アカウント名で避 @tmaehara

18年3月13日

「log(1+2+3) = log(1) + log(2) + log(3) を示せ」 という問題が流れてきた.これできない人が結構いそうだ.

タグ:

posted at 06:27:09

非公開

タグ:

posted at xx:xx:xx

@kuri_kurita

18年3月13日

少なくとも私の観測範囲では、「安倍政権であろうが無かろうが、こんなデタラメによる倒閣を許しちゃ駄目だ」と言ってる人ばかりなのだけど、それが「安倍政権擁護」に見えるとしたらアタマおかしいといか。

「風評被害を無くそう」って言うと、「東電を免罪するのか」って言ってた人たちみたい。

タグ:

posted at 09:05:13

Haruhiko Okumura @h_okumura

18年3月13日

昨日も書いたが,財務省は紙の報告書を関係者に配布するだけで,マスコミや野党がスキャンして公開するので,いろいろなPDFが出回る twitter.com/amneris84/stat...

タグ:

posted at 10:10:01

ビー (旧しゅん) @SHUN_KAERU

18年3月13日

以前アップした #超算数 案件ですが、掛け算の順番だけじゃないんですよ
実は、必ず筆算も書かないとバツになるんです
計算しやすいようにこの式にしたと思うんだけど…⤵
最近は超簡単な分数の掛け算を暗算でやった為に全問バツという悲惨な目にあいました
無理矢理途中式入れて問題やり直しでした pic.twitter.com/5VYRri2Fd0

タグ: 超算数

posted at 10:15:29

Yuki Nagai @cometscome_phys

18年3月13日

自分で書いたJuliaの厳密対角化コード、自分で実装したLOBPCG法は無駄にメモリ使っているので多分かなり速くなるはず

タグ:

posted at 10:36:58

黒木玄 Gen Kuroki @genkuroki

18年3月13日

財務省はマスコミや政治家に向けて情報を公開するのではなく、国民に向けて公開するべきだよね。

タグ:

posted at 10:57:39

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

18年3月13日

朝日新聞も財務省が情報公開する前から持っていた情報を公開するべきだよね。

タグ:

posted at 11:14:16

nana @JapaneseSchool

18年3月13日

先生の「ら」に納得がいかない。。。 pic.twitter.com/WbPEPPiQqP

タグ:

posted at 11:21:49

黒木玄 Gen Kuroki @genkuroki

18年3月13日

twitter.com/genkuroki/stat...

#統計 ググると

      頻度論  ベイズ
パラメータ 定数   確率変数
データ   確率変数 定数

とか

ベイズ統計では真の値は決まっていないとみなす

のような文言が普通に見つかるのですが、これらのおかしな言説はどのように広まったのでしょうか?

タグ: 統計

posted at 11:39:18

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 日本語でそのように書いている人達が、何か文献を引用してそのように述べているのであれば、情報拡散経路を推測することも可能なのですが、文献を引用せずにそのように述べているので、よくわかりません。

そのように書いた人はどの文献を見てそう思ったかについて教えて下さい。

タグ: 統計

posted at 11:44:09

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 あと

ベイズ統計における95%信用区間には真の値が95%の確率で入っていると考えてよい

のようなおかしなことを言っている人も、どの文献を見てそのように思ったかについて教えてくれると助かります。

ベイズ統計の解説の多くが杜撰であることは深刻な問題だと思います。

タグ: 統計

posted at 11:44:09

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 例えば、最近の文献で典型的なのは、奥村晴彦他著の『Rで楽しむベイズ統計入門』です。奥村さんの本でも【ベイズ統計では,データは定数で,パラメータ x は確率変数】【95%信用区間なら,「真の値はこの区間の中に95%の確率で入っています」と言って間違いありません】となっています。 pic.twitter.com/4e0qYIhlJ3

タグ: 統計

posted at 12:08:52

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 @h_okumura

奥村さんの最近の著書の

【ベイズ統計では,データは定数で,パラメータ x は確率変数】

【95%信用区間なら,「真の値はこの区間の中に95%の確率で入っています」と言って間違いありません】

という説明についてコメントしておきました。このスレッドのリンクをたどって下さい。

タグ: 統計

posted at 12:11:28

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 統計学でデータ(サンプル)を定数ではなく確率変数とみなすのは、運悪くデータが非常に偏っているリスクも想定しなければいけないからです。これはベイズ統計でもまったく同様です。

サンプルが運悪く偏っているリスクを考慮しない統計学ってなに?ありえないと思う。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 12:17:15

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 サンプル(データ)を確率変数とみなすことは非自明なので丁寧に説明するべき事柄。確率変数はよくサイコロに例えられます。そしてサンプルの典型例は母集団からの無作為抽出の結果です。無作為抽出のためにサイコロをふる様子を想像すればサンプルが確率変数になることも納得し易いと思う。

タグ: 統計

posted at 12:20:07

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki ありがとうございます。もちろんベイズ流のいわゆる主観確率に噛み付く人は多数いると思います(私も日常的にはそうです)。この本はあくまで伝統的なベイズ統計について書いています。cf. twitter.com/h_okumura/stat...

タグ:

posted at 12:20:10

S (ツイートはスレッド全体をご確認く @esumii

18年3月13日

「焼却して隠ぺいを図ると、むしろ焼き固められて保存性が増すなど公文書管理の面で利点が多い。」 twitter.com/kyoko_np/statu...

タグ:

posted at 12:23:24

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 サイコロの出目による無作為抽出が運悪く非常に偏ったものになってしまい、無作為抽出結果に基いた推定結果が母集団の様子と全然違ってしまう危険性があるわけです。その危険性の程度を見積もることが大事で、統計学ではその部分を真剣に扱うことになります。ベイズ統計でもこれは同様。

タグ: 統計

posted at 12:24:04

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 個人的な感覚では、【ベイズ統計では,データは定数】と言っている人達は「ベイズ統計」は統計学ではないと言っているに等しいと思う。

もちろん、そんなことはないわけなので、深刻な問題だと言っているわけですが。

タグ: 統計

posted at 12:25:42

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 昨日した話の繰り返しになりますが、【95%信用区間なら,「真の値はこの区間の中に95%の確率で入っています」と言って間違いありません】という主張は完全なデタラメであり、非常にまずいと個人的には思っています。

95%信用区間の95%は事後分布で計算した確率です。続く

タグ: 統計

posted at 12:36:00

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 事後分布は推定のために数学的に用意したモデル内部における確率を記述しているだけなので、「真の値が入っている確率」ではありません。入っているのは「真の値」ではなく、「モデル内部でのパラメーターの値」です。

詳しくはリンク先のスレッドを参照。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 12:36:01

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 ベイズ統計ユーザーが、その人が作ったモデルによる推定で「真の値はこの95%信用区間に入っている確率は95%だ!」などと本当に信じてしまったらどうするのでしょうか?

本当に問題にするべきなのは、その人が作ったモデルが本当に信頼に値するかどうかです。

タグ: 統計

posted at 12:36:01

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 奥村さんの本も、ベイズ統計の考え方の部分の解説がおかしいことを無視して、純粋にテクニカルな事柄の羅列として読めば非常によい本だと思います。実際、参考になりそうなことがたくさん書いてある。解説の仕方も参考になる。しかし、私はこの本を初学者にすすめる気にはまったくなれません。

タグ: 統計

posted at 12:39:49

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 現実は色々不幸なことになっていて、おかしなことが書いていないベイズ統計の解説本は数学が得意じゃないと全く読めそうもない本ばかりだったりする。

いったいどうして、【ベイズ統計では、データは定数】というような言説が広まってしまったのでしょうか?極めて不幸で深刻な状況。

タグ: 統計

posted at 12:43:16

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 私は以前から「p値という言葉を使う人に出会ったら、そのp値がどの仮定のもとでの何の確率かについて質問しまくりましょう」と提案しているのですが、今後は「ベイズ統計の95%信用区間という言葉を使う人に出会ったら、その95%が何の確率であるかについて質問しまくりましょう」とするべきかも。

タグ: 統計

posted at 12:49:40

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 ベイズ統計における95%信用区間の95%について「真の値がこの区間に入っている確率がその95%です」と答えたら当然アウト。信用区間で信用失墜。

タグ: 統計

posted at 12:49:40

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 95%信用区間の95%については「事後分布で計算した確率である」という以上のことは言えない。これはp値について「帰無仮説の定式化とみなせる確率分布で計算した確率である」という以上のことは言えないのと同じことです。

タグ: 統計

posted at 12:53:37

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 「伝統的なベイズ統計」が根拠ですか?さすがにそれはまずすぎでしょう。論理と証拠ではなく、伝統と権威を根拠にしているように見えます。

奥村さんは誤りを認めなかったという結論でよろしいでしょうか?

続く

タグ: 統計

posted at 13:23:54

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 続き。

【ベイズ統計では,データは定数で,パラメータ x は確率変数】

【95%信用区間なら,「真の値はこの区間の中に95%の確率で入っています」と言って間違いありません】

という奥村さんの主張がそのまま書いてある「伝統的なベイズ統計」の権威ある文献を教えて頂けると助かります。

タグ: 統計

posted at 13:25:38

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 pdg.lbl.gov/2017/reviews/r... はその権威ある文献ということですか?

奥村さんはこれを参照して「データは定数」とか「真の値はこの区間の中に~」とか書いたのですか?奥村さん自身が参照した権威ある「伝統的なベイズ統計」の文献を紹介して欲しいです。

タグ: 統計

posted at 13:27:53

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 伝統と権威で勝負をするつもりならば(私にはそうするつもりはないのですが)、私が引用している赤池弘次さんレベルの権威を引用しないとバランスが取れないのではないかと思いました。

タグ: 統計

posted at 13:29:56

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki Laplace "Théorie générale des probabiliés"
we find, from Article 1, that "la probabilité de chacune d'elles sera" [p.339] or, as Todhunter [1865] has it, "the probability that the true value lies between x and x+dx" [art.1013] is ...

タグ:

posted at 13:32:56

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki のような例を昔の本から探し出しました。

タグ:

posted at 13:33:44

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 ええと、奥村さん、この話題でラプラスを引用するとはどういうつもりですか?

皮肉が通用しなかったのではっきり言います。

奥村さんの本には私が指摘した部分について根拠となる文献が引用されていません。奥村さん自身の言葉で説明しないと非常にまずいと思います。

タグ: 統計

posted at 13:36:20

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki ベイジアンでも確率についての考え方は山ほどあるというのは第2章で書きました。「真の値の分布」を考えても,間違いというのではなく,あの人はベイジアン(の一派)なんだと思えばいいというわけです

タグ:

posted at 13:38:25

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 そのような曖昧な回答ではなく、【ベイズ統計ではデータは定数】であるかとか、95%信用区間に真の値が95%の確率で入っているとか、について奥村さんがどのような根拠を持っているかについて説明するべきだと思います。

タグ: 統計

posted at 13:40:22

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki ベイジアンは山ほど流派があり,どのベイジアンも認める権威ある本はないと思います。真の値の分布を考えることはベイジアンだったら許されるというのが私の立場です。

タグ:

posted at 13:44:20

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 奥村さん自身がどのように考えているかについては説明する必要はないということでしょうか?

奥村さん個人の責任で書いた本の内容が批判されているのだから、奥村さんが根拠についてきちんと説明しないとまずいと思います。十分な根拠が説明されたら、私も考え直す機会が得られます。

タグ: 統計

posted at 13:47:24

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 「真の値の分布を考えることはベイジアンだったら許される」の「真の値」の定義は何ですか?

「主観的に真の値だと思っているもの」と「真の値」は区別しないとまずいですよね。少なくとも、読者には区別がつくように説明しないとまずい。

タグ: 統計

posted at 13:51:43

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 「主観的に真の値だと思っているものに関する確率分布を考えること」であれば、あくまで主観の話なので「ご自由にどうぞ」ということにしかならない。

そして「あなたの主観は私には関係ない」とも言える。これだと社会的に統計学を使う意味がなくなる。赤池弘次さんの方針が正しいと思います。

タグ: 統計

posted at 13:58:40

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki 「母集団でのトランプ支持率にしても,ニュートリノの質量にしても,われわれが知らないだけで,すでに決まっています。その意味で,数学的には同じ「確率変数」でも,その「確率」という意味が,伝統的な統計学での意味とは必ずしも一致しません」(拙著p.27)

タグ:

posted at 13:59:46

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 主観確率の概念は自由に使ってよいと思います。例えば、「私の主観ではこの95%信用区間に真の値が入っている確率は95%です」と言うのは構わない。しかし、「あたなの主観は私とは関係ない」と言える自由があることも強調しておかないとまずいですよね。

タグ: 統計

posted at 14:00:04

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki ニュートリノ質量が1〜2eVか2〜3eVかの事前確率は等しいと考える,というのは何ら客観性のない主観確率だというのは黒木さんも同じお考えですよね

タグ:

posted at 14:04:01

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 その部分の説明もはっきり何を言いたいのか不明。

母集団でのトランプの支持率が決まっていることと、そこからの無作為抽出したサンプル内での支持率が確率変数になることは矛盾しません。母集団でのトランプの支持率自体が確率分布しているとは伝統的な統計学では普通は考えないですよね。

タグ: 統計

posted at 14:05:45

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura はい、主観的に「△△である確率は〇〇だ」と言う自由は誰にでもある。

しかし、あたなの主観は私には関係ない。関係があると言いたいなら、主観以外の根拠を持って来なさい、ということにしかならない。

タグ:

posted at 14:08:34

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki もちろん伝統的な統計学では噴飯ものの考え方です>逆確率

タグ:

posted at 14:08:47

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura 私が書いたものを読み直して頂ければわかるように、私は数学的にきちんと定式化して考えています。

数学的なモデル内部でならどのような設定にする自由もあります。重要なのはモデルの設定が統計的推測に役に立つ良い性質を持っているかです。ベイズ統計の仕組みはまさにそういう意味で良いものです。

タグ:

posted at 14:12:15

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki で,別の人は,log mが一様分布するような事前確率を持っている。どっちが正しいかわからないですよね。だからベイズ統計ではたくさん答えが出る。漸近的には同じでも,小サンプルではけっこう変わる。

タグ:

posted at 14:13:43

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura モデルを決めるときには主観的な要素が入ることは防げません。ベイズであろうがなかろうがそれは同じこと。赤池弘次さんが1980年の論説で強調していることは、事前分布も含めてモデルの良し悪しをデータを使って判定することへの可能性についてです。赤池さんの論説には怪しげな話が一切ない。脱線御免

タグ:

posted at 14:18:18

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura 質問:モデルではニュートリノの質量は決まっていると考えているわけですよね。確率的にゆらいでいるのは測定値の方ということでよろしいでしょうか?ゆらぎのある測定値を集積してニュートリノの真の質量を決定しようとしているという理解で正しいですか?

タグ:

posted at 14:22:50

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki 漸近論は数学的にきれいでも,実際に泥臭いところで小サンプルと戦っている人には,まず頻度論(複雑なモデルは扱えない),セカンドオピニオンとしていくつかの妥当な事前分布でベイズ,というのが私の感覚です

タグ:

posted at 14:24:04

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki それが通常の考え方ですが,逆にデータをgivenとしてパラメータ(この場合はニュートリノ質量)を確率変数と考えることもできる,というわけです

タグ:

posted at 14:31:21

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura 私は #Julia言語 で小サイズサンプルについてのシミュレーションをたくさんしているのは御存じですか?人の目で見てサンプルサイズが小さすぎるのように見えても確率的に結構勝ち目のあるモデル選択をできたり、サンプルサイズを結構大きくしてもうまく行かない問題もあることを私も知っています。続く

タグ: Julia言語

posted at 14:32:27

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura よくわからないのは「妥当な事前分布」の「妥当な」の定義。

小サンプルでは95%信頼区間も95%信用区間もかなり広がったものになるのが普通でそう変わりがないと思うのですが。

「小サンプルしかないとき、それ以外に信頼できる情報があるならそれも利用するべきだ」という一般論なら理解可能。続く

タグ:

posted at 14:38:54

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki ありがとうございます。勉強させていただきます

タグ:

posted at 14:40:08

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura サイズの小さなサンプルしか得られない場合には、そのサンプル以外の信頼できる情報がないかどうか探し、それも考慮して判断するべきである、という一般論であれば誰でもやっていることなので、言うまでもないことだと思う。

わざわざ「妥当な事前分布」と言われると何を言いたいのかわからなくなる。

タグ:

posted at 14:41:55

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura 数学的なモデルの中では現実を離れることは自由になるので、ニュートリノの質量を確率変数だと考えることは当然できます。

しかし、それはあくまでも数学的なモデル内部での話ですよね。

数学的なモデル内部での確率(もしくは曖昧な主観確率)としてしか意味がないということなら私と同意見です。

タグ:

posted at 14:45:14

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura #統計 以下では少し長々とベイズ統計の数学的仕組みについて説明します。

まず、ベイズ統計による推定では、パラメーターw付きのyの確率分布p(y|w)と事前分布φ(w)を用意します。そして、数学的に以下のような状況を仮想的に考えます。続く(長くなるのでメンションを切ります)

タグ: 統計

posted at 14:53:34

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 そして、事前分布φ(w)に従ってランダムにパラメーターwを生成して、そのwを使ったyの確率分布p(y|w)に従う独立試行によってy_1,…,y_nをランダムに生成する。

現実には真の分布q(y)による独立試行によってサンプルY_1,…,Y_nがランダムに生成されていたとしても~続く

タグ: 統計

posted at 14:56:20

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 続き~、ベイズ統計では事前分布が生成する異なるパラメーターごとに異なる確率分布の独立試行でサンプルy_1,…,y_nが生成されるというように考えるわけです。しかし、これは推定用に用意した数学的モデル内部でそうなっているだけで、現実世界がそうなっていると考えているわけではない。続く

タグ: 統計

posted at 14:59:03

南知多町 @minamichita_tw

18年3月13日

EM菌で川をきれいに!
町では役場(環境課)、役場各サービスセンター(両島を除く)、師崎公民館で無料配布をしています。
EM菌の詳しい説明はリンク先で確認できるよ。
ぜひ河川の浄化にご協力ください。
www.town.minamichita.lg.jp/main/kikaku/ko...

#umihitokokoro

タグ: umihitokokoro

posted at 15:00:16

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 続き。ベイズ統計では出発点の段階で現実世界ではありえない設定を数学的モデル内部で採用することになります。その利点は、そのような設定の数学的な性質が非常によいことです。ベイズ推定法での推定の収束は事前分布をテスト函数とするシュワルツの超函数の意味での収束になるので収束し易い!

タグ: 統計

posted at 15:02:32

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 これはサンプルサイズ→∞での収束の話。サンプルサイズを大きくしても推定が収束する保証がないなら、小サンプルサイズではもっと状況が悪くなるわけで、信頼できることは何も言えなくなってしまう危険性があるわけです。ベイズ推定だとゆるい条件で収束が保証されます。

タグ: 統計

posted at 15:06:43

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 他にも、様々な利点があるので、ベイズ統計が道具として便利に利用されるようになって来ているわけです。例えば、推定の収束の程度が、正則モデルの場合には事後分布の様子に、そうでない場合にも予測分布の様子によく現われるので、使い易い面があるわけです。

タグ: 統計

posted at 15:10:07

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 最尤法の予測分布には推定が収束していない程度がまったく現れないので、小サンプルサイズでオーバーフィッティングしやすいという欠点がある。ベイズ推定で得た予測分布は推定が全然収束していないと非常にぼやけたものになるので、そういうことがない。

タグ: 統計

posted at 15:12:49

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 ベイズ統計で採用している数学的仕組みの利点を理解することは全然簡単な話じゃないと思う。どこに利点があるのか理解することが非常に難しいところに、最初の数学的な設定が(上で述べたように)現実世界とは明らかに異なるものになっている。だから、色々誤解が出て来るのだと思います。

タグ: 統計

posted at 15:15:25

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 @h_okumura ベイズ統計に関する解説の連続ツイートを書き終わりました。

タグ: 統計

posted at 15:18:13

黒木玄 Gen Kuroki @genkuroki

18年3月13日

奥村さんがおおまじめにラプラスを引用して来たときには驚愕して、うろたえてしまった。

主観確率云々とか言っても、統計的推測のためには数学的な設定に焼き直す必要があって、結果的に主観確率云々とか言っている事柄はすべて数学的な設定内部だけで通用する話にしかならないわけです。

タグ:

posted at 15:24:57

黒木玄 Gen Kuroki @genkuroki

18年3月13日

そして、数学的設定は現実にぴったりフィットしている設定でなくても構わないわけです。現実世界で役に立つ数学的性質を持っていれば十分。

タグ:

posted at 15:39:14

黒木玄 Gen Kuroki @genkuroki

18年3月13日

20世紀のあいだはベイズ統計の数学的設定が良い性質を持っていることはよく理解されていませんでした。数学的な理解が不十分な時代の言説を21世紀の現代に復活させる必要はないと思う。ぶっちゃけ有害。

タグ:

posted at 15:39:15

黒木玄 Gen Kuroki @genkuroki

18年3月13日

赤池弘次さんが書いたものを幾つか読むと「データに基いてモデルの良し悪しを比較する」という科学における最も典型的な考え方がベースになっているように見えます。有名なAICもそのために使える道具です。AICより精密ではない対数尤度を見るだけでも相当なことがわかる場合があります。

タグ:

posted at 15:39:15

黒木玄 Gen Kuroki @genkuroki

18年3月13日

赤池弘次さんの1980年の2つの論説を読む価値は極めて高いと思う。

ismrepo.ism.ac.jp/?action=pages_...
統計的推論のパラダイムの変遷について
赤池 弘次
1980

www.jstage.jst.go.jp/article/butsur...
エントロピーとモデルの尤度
赤池 弘次
1980

後者にはAICは「an information criterionの略記」だと書いてあります(笑)

タグ:

posted at 15:39:15

Haruhiko Okumura @h_okumura

18年3月13日

@genkuroki ありがとうございます(別件で仕事中でした)

タグ:

posted at 15:46:51

OokuboTact 大久保中二病中年 @OokuboTact

18年3月13日

#超算数
中学数学について詳しく調べたことがなかった。今回、図形について調べたら中学数学との比較が重要なことに気づいた。
足し算&掛け算順序も小学校だけの事件ではない気がしてきた。
キーワードは「立式」と「式の意味」

タグ: 超算数

posted at 15:53:53

黒木玄 Gen Kuroki @genkuroki

18年3月13日

赤池さんによる1980年の両方の論説を読むと、当時は対数尤度がサンプルサイズ→∞で「汎化損失=予測誤差+定数」(予測誤差は相対エントロピーの-1倍=KL情報量で評価、定数はShannon情報量)に収束することの重要性も十分に認識されていなかったことがわかります。

タグ:

posted at 15:55:59

黒木玄 Gen Kuroki @genkuroki

18年3月13日

1980年は尤度がどうして「もっともらしさ」を意味するかが十分に理解されていなかった時代。赤池さんはそういう点で飛び抜けていたということなのでしょうか。対数尤度のシンプルな精密化がAICなので、AICの発見は赤池さんにとっては自然な流れだったに違いありません。

タグ:

posted at 15:55:59

黒木玄 Gen Kuroki @genkuroki

18年3月13日

異なるモデルを用いた最尤法で求めた予測分布のどちらの予測誤差が小さいかを推測するためにAICは使われます。(AICが小さい方が予測誤差は小さいと推測される。)

AICはモデルとデータから算出される数値であり、AICによる予測分布選択はデータに基いて予測の良し悪しを推測することに他なりません。

タグ:

posted at 15:56:00

黒木玄 Gen Kuroki @genkuroki

18年3月13日

紹介した1980年の赤池さんの論説は「データに基いてモデルの良し悪しを比較する」という通常の科学的考え方が徹底されているという印象を受けます。そういう通常の科学的な推測を可能にするために数学を色々いじっている感じ。

赤池さんも「頻度論vs.ベイズ統計」という対立図式を否定する立場。

タグ:

posted at 15:56:00

黒木玄 Gen Kuroki @genkuroki

18年3月13日

赤池さんが偉大な統計学者であることは言うまでもないことですが、言っている内容が明晰でかつ筋が通っているから、私は正しいことを言っているように感じています。

「データに基いてモデルの良し悪しを比較する」という科学の王道をテーマにしているので怪しげな話になりようがない。

タグ:

posted at 15:56:00

ごまふあざらし(GomahuAzaras @MathSorcerer

18年3月13日

アフィイン変換を線形変換と呼んで良いものか・・・.

タグ:

posted at 15:57:23

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura いえいえ、お相手して頂いて、とてもありがたいことだと思っています。

タグ:

posted at 15:58:27

ごまふあざらし(GomahuAzaras @MathSorcerer

18年3月13日

数xと数yの二乗差 (x-y)^2 を平均二乗誤差と平均つけるのもどうかと思う.

タグ:

posted at 16:04:59

黒木玄 Gen Kuroki @genkuroki

18年3月13日

以下のリンク先にサンプルサイズ16での最尤法によるフィッティングの例があります。Mはフィッティングに使う多項式の次数+1です。

AICは3~5次式による予測誤差が最も小さそうだと言っており、BICさんは3次式が真のモデルに最も近そうだと言っています。

twitter.com/genkuroki/stat...

タグ:

posted at 16:07:34

黒木玄 Gen Kuroki @genkuroki

18年3月13日

最尤法でのAICの類は定義を知っていれば誰でも簡単に数値計算できます。コンピューターが得意な人は自分で試してみるのがよいと思います。リンク先のリンク先で #Julia言語 によるソースファイルも公開されています。

twitter.com/genkuroki/stat...

タグ: Julia言語

posted at 16:09:40

黒木玄 Gen Kuroki @genkuroki

18年3月13日

@h_okumura * 95%信用区間に真の値が95%の確率で含まれる

は誤りであり、

* あなたとは違う私の主観では95%信用区間に真の値は95%の確率で含まれる

もしくは

* 95%信用区間の95%はモデル内部の事後分布での確率に過ぎず、現実の問題との関係は難しい

と正直に言うべきだということでよろしいでしょうか?

タグ:

posted at 16:23:40

積分定数 @sekibunnteisuu

18年3月13日

.@SkiMario #超算数 ←で、掛け算順序を批判している人の多くは、#モルグリコ で、「はじき」を批判しているケースが多いです。一方で.. togetter.com/li/1207824#c47...

「小学算数教育の中では当たり前になってきつつある「くもわ、はじき」という表は子..」togetter.com/li/1207824 にコメントしました。

タグ: モルグリコ 超算数

posted at 16:35:08

積分定数 @sekibunnteisuu

18年3月13日

.@sekibunnteisuu#超算数 #モルグリコ 数学者の浪川幸彦氏は、数学セミナー誌2014年9月号で掛け算の順序と「はじき」を積極的に肯定.. togetter.com/li/1207824#c47...

「小学算数教育の中では当たり前になってきつつある「くもわ、はじき」という表は子..」togetter.com/li/1207824 にコメントしました。

タグ: モルグリコ

posted at 16:38:34

てらモス @termoshtt

18年3月13日

ドキュメント中で数式使いたい(´・ω・`)

タグ:

posted at 17:11:33

黒木玄 Gen Kuroki @genkuroki

18年3月13日

twitter.com/genkuroki/stat...

#統計 リンク先の話題を分離。ベイズ統計の設定と使い方の話。

最初に用意するのはパラメーターwを持つyの確率分布p(y|w)とパラメーターwの事前(確率)分布φ(w)です。例えば、正規分布モデルなら

p(y|w)=p(y|μ,σ)=exp(-(y-μ)²/(2σ²))/√(2πσ²),
φ(w)=φ(μ,σ).

続く

タグ: 統計

posted at 17:49:54

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 モデル内部の仮想的な世界では、事前分布φ(w)に従ってパラメーターwをランダムに生成して、そのwに対する確率分布p(y|w)に従う独立試行によってy_1,…,y_nがランダムに生成されると考えます。

ベイズ統計では、これを現実世界の未知の確率分布q(y)に従う独立試行(サンプル)と比較します。続く

タグ: 統計

posted at 17:49:54

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 仮に現実世界における未知の分布q(y)が

q(y)=p(y|w₀)

と一意的に書けているなら、パラメーターw₀は決まっており、数学的に設定した仮想世界と違って、確率的にゆらぐものにはなっていないわけです。

この意味でベイズ統計の最初の設定である仮想世界は非現実的。続く

タグ: 統計

posted at 17:49:55

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 ベイズ統計の設定における非現実的な仮想世界と現実世界との比較は、現実世界で得られるサンプル(データ)を仮想世界に持ち込むことによって行われます。

例えばこう考える。仮想世界において現実世界で得られたのと同じサンプルY_1,…,Y_nが生成されたらどうなるか?

タグ: 統計

posted at 17:49:55

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 仮想世界では、最初にパラメーターwを事前分布に従ってランダムに決めた後は、そのwを固定して、wで決まる確率分布p(y|w)に従う独立試行でy_1,…,y_nをランダムに生成するので、y_1,…,y_nが偶然Y_1,…,Y_nに一致するならwはそうなりやすいものになっている可能性が高い。

タグ: 統計

posted at 17:49:56

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 そして、条件付き確率の概念を使えば、(y_1,…,y_n)=(Y_1,…,Y_n)となっているときのwの確率分布Φ(w)を

Φ(w) = p(Y_1|w)…p(Y_n|w)φ(w)/Z,
Z = ∫ p(Y_1|w)…p(Y_n|w)φ(w) dw

と書くことができます。このΦ(w)がいわゆる事後分布です。

タグ: 統計

posted at 17:49:56

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 現実世界から得られたサンプルY_1,…,Y_nによって、仮想世界の確率分布を制限すること(=条件付き確率を考えること)によって、仮想世界におけるパラメーターwの確率分布を更新して行くのが、いわゆるベイズ更新。

タグ: 統計

posted at 17:49:56

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 ベイズ更新によって、サンプルサイズが増えるごとに仮想世界における確率分布が制限されて行き、次第に現実世界の未知の確率分布q(y)を近似するようになることが期待されます。(この期待は正しく、ゆるい仮定のもとで証明されます。渡辺澄夫さんの本を参照)

タグ: 統計

posted at 17:49:56

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 事前分布をサイコロに例えると、仮想世界ではサイコロを振って出た目wで指定される確率分布p(y|w)による独立試行が行われている。現実世界の真の分布q(y)=p(y|w₀)の真のパラメーターw₀が不明。「わからないことをサイコロで決める仮想世界」を設定するのがベイズ統計の出発点。

タグ: 統計

posted at 17:49:57

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 ベイズ統計の出発点として設定される仮想世界は現実世界とは異なる数学的なモデルに過ぎません。

数学的モデル内における確率を現実世界における確率と混同させるようなことを言うのは非常にまずい。 (←これが私が昨日からしつこく言っていることの一つ)

想像と現実の混同は本当にまずい。

タグ: 統計

posted at 17:49:57

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 実用的には数学的モデルに過ぎないものとして使っているのに、それを超えた意味を持たせようとするから(例えば「主観確率」とか言い出すから)、おかしなことになるわけです。

数学的にややこしい話の理解に失敗するときの典型的なパターンだと思う。

タグ: 統計

posted at 17:49:57

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 ベイズ統計の本質は以上の話で尽きています。

(1) よくわからないことはすべてサイコロをふって決める仮想世界(数学的モデル)を設定する。

(2) そこに現実世界で得られたサンプルをぶちこんで仮想世界の確率分布を制限し、制限した結果が現実世界の近似になっていることを期待する。

タグ: 統計

posted at 17:49:58

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 最初に推定のために用意する仮想世界の設定が2つあるとき、

* どちらの予測分布の予測誤差が小さいと推測できるか?

とか

* どちらのモデル(仮想世界)の設定が現実世界に近いと推測できるか?

とかの問題を考え出すと、自然に情報量規準(赤池さんのAICなどの一般化)の話になります。

タグ: 統計

posted at 17:49:58

@nan_bayesstat

18年3月13日

この辺の話は社内でもなかなか理解してもらえないのですが、渡辺澄夫先生の理論から出発すると自然なものと実感できます。巷のベイズ入門書を読むより、まず渡邊先生の本を読んだ方が良いのかもしれません。
twitter.com/genkuroki/stat...

タグ:

posted at 18:04:03

らじうむ小山_PPPMP @Ra_koyama

18年3月13日

@sekibunnteisuu 当たり前ってのが「使わなくてはならない」なのかな。こういう図で解く人もいるよってレベルにしておいてくれ…

タグ:

posted at 18:27:32

黒木玄 Gen Kuroki @genkuroki

18年3月13日

twitter.com/genkuroki/stat...

#統計 #数楽 漸近論に関係した数学的小ネタについて書きます。

漸近論の典型例は「nが大きな二項分布Bin(n,p)は正規分布で近似される」です。n→∞では中心極限定理によって同様の結果をずっと一般の場合に証明できます。続く

タグ: 数楽 統計

posted at 18:41:25

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 #数楽 中心極限定理を特に二項分布の場合に限って直接的な計算で解説するというようなことは大学の講義ではよくやられていると思います。

n→∞では正しい。それでは現実に応用するときに使う有限のnではどうなっているか?有限のnにおける様子がわからないと現実への応用では意味がない。

タグ: 数楽 統計

posted at 18:41:25

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 #数楽 二項分布の中心極限定理は、階乗 N! にスターリングの近似公式

N! ~ N^N e^{-N} √(2πN)

の右辺をぶち込むことによって証明可能。

だから、有限のNでの二項分布の中心極限定理の様子は、有限のNでのスターリングの近似公式の精度を見れば大体のことがわかるはずです。

タグ: 数楽 統計

posted at 18:41:25

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 #数楽 以下は各Nごとのスターリングの近似公式の相対誤差です。

N 相対誤差
1 -7.8%
3 -2.7% 
10 -0.83%

N=1でも相対誤差は10%を切っており、N=3ですでに3%を切っており、N=10ですでに1%を切っています。スターリングの近似公式は小さなNでも驚くべき性能を発揮してくれます。

タグ: 数楽 統計

posted at 18:41:26

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 #数楽 一般論ではN→∞の場合を考えていても、以上のように実際には1桁の小さな数であっても実用上十分な近似になっている場合もあることが以上の計算例を見ればわかると思います。

もちろんこれとは全く逆にNを大きくしてもN→∞で成立している結果がなかなか再現できない場合もあります。

タグ: 数楽 統計

posted at 18:41:26

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 #数楽 N→∞の場合について書いてある教科書的結果を知ったら、常に数値計算によって有限のNでどうなっているかを確認する癖をつけておくと、印象に残って色々理解し易くなると思います。

#Julia言語 + Jupyter notebook はそういうちょっとした数値計算をするときに極めて便利です。

タグ: Julia言語 数楽 統計

posted at 18:41:26

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#数楽 ちなみに、スターリングの近似公式は 1/(12N) の補正を行うと N=1 でも相対誤差が -0.1% 程度になります!

N N! N^N exp(-N) √(2πN)(1+1/(12N))
1 1    0.9989817596371048
3 6    5.998326524438804
10 3628800 3628684.748897211

スターリングの近似公式は楽しいです。

タグ: 数楽

posted at 18:41:27

鰹節猫吉 @sunchanuiguru

18年3月13日

ただ計算するだけなんだけど、証明問題とは使ってもよいとされている定理や公式を「ゆえに」「よって」などの決まり文句でつなげて答案を作る操作である、と考えている人たちがいて、彼らには難しかったりして… twitter.com/tmaehara/statu...

タグ:

posted at 19:28:23

非公開

タグ:

posted at xx:xx:xx

積分定数 @sekibunnteisuu

18年3月13日

@Ra_koyama 掛け算の順序もそうだけど、自分が教わった方法を否定されたくない、というのもあるのかも。

タグ:

posted at 19:49:17

OokuboTact 大久保中二病中年 @OokuboTact

18年3月13日

財務省の大罪は消費税増税を推進したこと。そのせいでたくさんの人が自殺したり鬱病になった

タグ:

posted at 20:05:16

アヲギリ @Aogiri_m2d

18年3月13日

私, 魔女のキキです. こっちはJuliaで描いたファン・デル・ポール・オシレータ. pic.twitter.com/B7TdLaPbLg

タグ:

posted at 20:09:48

アヲギリ @Aogiri_m2d

18年3月13日

なんか違う気がするは

タグ:

posted at 20:18:07

(「・ω・)「ガオー @bicycle1885

18年3月13日

ラーメンズのコントに1+2+3も1x2x3も6だから足し算と掛け算は同じ計算なんだよ!というネタがあったな。

タグ:

posted at 20:26:28

アヲギリ @Aogiri_m2d

18年3月13日

やっぱ,なんか違うな…?飛んで行かれてしまった. pic.twitter.com/P1FvdtMM6l

タグ:

posted at 20:29:33

アヲギリ @Aogiri_m2d

18年3月13日

4次のルンゲクッタで計算しなおしたら,ちゃんとそれっぽくなった(前のは修正オイラー法). pic.twitter.com/NPNJTS8zDJ

タグ:

posted at 21:02:36

ゴルゴ・サーディーン @golgo_sardine

18年3月13日

@kameTeamTKO @PlgzrYzLExfBoho @fairladyz33love @mini40617 @kikanailowkick @kikanailowkick @BLITZ03SONIC
いきなり&横からで失礼します。
この #掛算 の順序、教えている側だって、けっこう違反してます。 pic.twitter.com/RiaXjymkve

タグ: 掛算

posted at 21:13:11

ゴルゴ・サーディーン @golgo_sardine

18年3月13日

「7×6×5」に訂正させるというのが意味不明ですね。
「公式通りにしなとダメ」とするなら 6×7×5 の筈。 #掛算 twitter.com/SHUN_KAERU/sta...

タグ: 掛算

posted at 21:17:41

アヲギリ @Aogiri_m2d

18年3月13日

シンセのオシレータにでも思ったけど,ルンゲクッタはしんどそう. pic.twitter.com/hdoRSM9Gy9

タグ:

posted at 21:32:44

千葉逸人 @HayatoChiba

18年3月13日

難しかった。ヒントだけ。
方程式がスカラー倍(F,G,H,z)→(c^2F, c^2G, cH, z/c)の作用で不変なので、5次元の力学系だとみなしたときの不動点における局所安定多様体を大域的にどこまでも延ばせる。 twitter.com/mat_der_D/stat...

タグ:

posted at 21:51:05

Hal Tasaki @Hal_Tasaki

18年3月13日

今年の統計物理学懇談会が終了。実に多くを学んだ二日間。参加してくださったみなさん、講演してくださったみなさん、ありがとうございました。
しかし、今日はヘビーだった。辛うじてついていくだけで頭を常にフル回転させなくてはいけないトークもあってマジで疲れたわい。
www.gakushuin.ac.jp/~881791/spm/20...

タグ:

posted at 22:19:18

黒木玄 Gen Kuroki @genkuroki

18年3月13日

twitter.com/genkuroki/stat...

#統計 サンプルサイズn→∞で成立している漸近論が n=2^18 で全然成立していないように見える例を作って、次のリンク先で公開しておきました。

nbviewer.jupyter.org/gist/genkuroki...
混合正規分布モデルの尤度函数

実質的に渡辺澄夫『ベイズ統計の理論と方法』pp.20-21の再現です。

タグ: 統計

posted at 22:32:53

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 パラメーター(a,b)がa=1またはb=0を満たすとき、(a,b)に対する確率分布が特異モデルになるような確率モデル(ある種の混合正規分布モデル)を考え、パラメーターの真の値を(0.5,0.1)にしたときの尤度函数をプロットしてみました。

タグ: 統計

posted at 22:32:53

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 a=1またはb=0から真の値が外れている場合には、正則モデルの漸近論によって、サンプルサイズn→∞で尤度函数の台は真の値の近くに集中するようになります。これは数学的定理なので確実に成立しています。

タグ: 統計

posted at 22:32:54

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 しかし、真の値が(0.5,0.1)のときの尤度函数を数値計算してプロットしてみると、サンプルサイズn=2^18にしても全然真の値の近くに尤度函数の台がなかなか集中して来てくれません。添付画像を見て下さい。 pic.twitter.com/VjrSu1offK

タグ: 統計

posted at 22:32:54

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 真の値が(0.5,1.0)の場合には添付画像のように、漸近論の予言の通り、真の値の近くに尤度函数の台が集中して来て、最尤法の解は真の値に収束します。

しかし、真の値が特異モデルを与えるパラメーター集合の近くにあると、正則モデルの漸近論は実質的に使えないと思った方がよいです。 pic.twitter.com/iKx8VDUBLc

タグ: 統計

posted at 22:32:55

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 実質的に正則モデルの漸近論が使えない場合は、指数型分布族を単純に使った確率モデルでは生じません。

しかし、複雑なモデルにすると比較的容易にこういうことが起こるので、正則モデルの漸近論が使えないことを覚悟する必要があります。

タグ: 統計

posted at 22:32:55

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 以上のような数値実験を経験していると、特異モデルを与えるパラメーターの値全体の集合がたとえ測度零であっても、統計学的にはまったく無視できないことがわかります。

測度零集合であっても現実には無視できない場合があるという事実を、特に数学の専門家は知っておくべきだと思う。

タグ: 統計

posted at 22:32:55

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 サンプルサイズ→∞における数学的結果は有限のサンプルサイズでは成立していると思っちゃいけないかもしれない。

「サンプルサイズを大きくすると解像度が上がって行く」
「異なる解像度ごとに別の法則に支配されている」

のように考える方がたぶん現実的。

タグ: 統計

posted at 22:32:56

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 上で例示した真の値が(0.5,0.1)の場合の尤度函数のプロットは、サンプルサイズn→∞の超高解像度では無視可能な特異モデルを与えるパラメーター集合に尤度函数が大きく影響を受けている場合だとみなせます。おそらくnが小さい場合には特異モデルを扱っていると思った方がよい。

タグ: 統計

posted at 22:32:56

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 正則モデルの漸近論(サンプルサイズn→∞で尤度函数の台が真の値の近くに集中して来て、尤度函数の形が釣鐘型になる)がnを大きくしてもなかなか成立しない例があるという「否定的」な話を強調してしまったので、誤解する人がいるとまずいので補足。続く

タグ: 統計

posted at 22:53:21

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 そのような正則モデルの漸近論が成立していなくても、特異モデルの漸近論は成立しています。特異モデルのケースでは正則モデルの場合よりも収束が速くなります。すなわち小さなサンプルサイズで予測分布の精度が上がります(渡辺澄夫さんの仕事で判明した数学的事実)。

タグ: 統計

posted at 22:53:21

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 だから、ベイズ統計的には、正則モデルの漸近論が成立しない特異モデルの場合は「よし!相対的に小さなサンプルサイズで予測分布の精度が上がるぞ!」というような喜ばしい状況だということになります。そのとき最尤法によるパラメーターの推定は破綻しています。

タグ: 統計

posted at 22:53:21

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 リンク先ではサンプルサイズ n=8 (小サイズのサンプル!)の場合に、ベイズ統計の漸近論から導き出されたWAICなどによるモデル選択がどういう感じのギャンブルになるかを計算しています。n=8であってもそう悪くないギャンブルになります。

nbviewer.jupyter.org/gist/genkuroki...

タグ: 統計

posted at 22:58:08

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#統計 WAICなどの情報量規準は漸近論によって導出されたので小サンプルサイズでは使えないというような考え方は**誤り**です。

使える場合もあれば、使えない場合もある。

推定用のモデルを作ったら数値実験でどういう感じになるかを確認するべき。

タグ: 統計

posted at 23:01:19

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#超算数 小学算数教育の中では当たり前になってきつつある「くもわ、はじき」という表は子どもをダメにする? - Togetter togetter.com/li/1207824 @togetter_jpさんから

タグ: 超算数

posted at 23:16:11

黒木玄 Gen Kuroki @genkuroki

18年3月13日

#掛算 #超算数 OokuboTactさんが、私が今まで見逃して来た「怖そうな話」を始めた。ここ数年間、こういうことの繰り返し。私が発見できない怖い話をみんなして持って来る。

twitter.com/OokuboTact/sta...

タグ: 掛算 超算数

posted at 23:19:05

アヲギリ @Aogiri_m2d

18年3月13日

初期値を増やすと楽しい pic.twitter.com/MRbRyMN67s

タグ:

posted at 23:33:14

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました