黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2020年03月04日(水)
#統計 #Julia言語 以下に続く
twitter.com/genkuroki/stat...
posted at 23:42:12
#統計 参考までに
nbviewer.jupyter.org/gist/genkuroki...
からWAICの計算部分を抜き出してみましょう。添付画像を見ればわかるように、ほんの数行でWAICを計算する函数を書けます。汎函数分散を #Julia言語 の分散函数で使って書いた。
こういう勉強目的には #Julia言語 以上の道具はないと思う。 pic.twitter.com/iUih3nVsD6
posted at 23:36:08
#統計 真の予測誤差のG側のグラフを180度回転させて、適当にシフトすると、WAICの側Wのグラフにほぼ一致する。
赤と青はWAICによる真の予測誤差が小さなモデルの選択に成功する場合で、黄色と空色は失敗する場合。 pic.twitter.com/IdpEg39I7W
タグ: 統計
posted at 23:29:28
。#統計 続き。より正確には、mixnormal vs. normal の場合には、1000個のサンプル中980個で mixnormal 側の予測誤差が小さくなっている。しかし、WAICによるモデル選択では1000個中121+20=141個で失敗している。
添付画像の他の部分も同様に情報を読み取れる。 pic.twitter.com/DNVzokvfmx
タグ: 統計
posted at 23:27:37
#統計 続き。画像を作り直して、n=300の場合にはそうだとわかるようにした。
例えば、mixnormal vs. normal の場合には、G = 真の予測誤差が小さい側はすべて mixnormal 側になっている。このケースで mixnormal は特異モデルなので、推定の精度が高くなる。特異モデルになると推定の精度が上がる! pic.twitter.com/uEhBQ9oLbM
タグ: 統計
posted at 23:23:38
#統計 続き。1つ前およびこのツイートはサンプルサイズ300の場合。
G_mixnormal は mixnormal モデルでの予測分布の真の予測誤差。これは数値実験なので真の分布である標準正規分布をカンニングできるので計算可能。
W_mixnormal は本質的にWAICです。他のモデルでも同様の記号を使っている。 pic.twitter.com/qd3jaVfolD
タグ: 統計
posted at 23:02:54
#統計 続き。1つ前のツイートの添付画像1,2,3はそれぞれ標準正規分布のサイズ300,100,30のサンプルの場合。
mixnormalは
p_mixnormal(x|a,b)=(1-a)N(x)+aN(x-b), N(x)は標準正規分布
の形の1次元の混合正規分布モデル。normalは平均μ分散σ²の正規分布モデルで、normal1では分散を1に固定。 pic.twitter.com/zKixhnKmK2
タグ: 統計
posted at 23:00:40
#統計 #Julia言語 自前でMCMC法を実装すれば(MH法なら実質的部分は数行~十数行で実装可能)、特異モデルのベイズ統計で遊べることを示すノートブックのパート2
nbviewer.jupyter.org/gist/genkuroki...
1次元の混合正規分布モデルのWAIC
添付画像はモデル選択の様子を一目で見るためのプロット。 pic.twitter.com/bx8Or5MY4H
posted at 22:56:10
藤井 涼/宇宙ビジネスメディア「Uchu @ryo_fujii1986
ドローンで病院に血液を届けるルワンダの「Zipline」を現地取材しました。時速130キロで飛ぶことができ、車で2時間かかっていた病院への配送時間をわずか15分に短縮しています。取材中にも10〜15分おきにドローンが発射されており、病院からの依頼もかなり多いようでした。
japan.cnet.com/article/351502...
タグ:
posted at 13:22:20
数学科に入って、働いたり生活するために何が良かったかと言うと自分が考えている事を論理で否定されることに慣れたり、自分で自分の考えを論理で否定することに慣れることぐらいだと思う。他分野を勉強するときに数学で困ることは少ないと言うのもあるけど物理やってても情報やってても同じだと思う。
タグ:
posted at 10:01:21
〈 Berger | Dillon 〉 @InertialObservr
If electrons actually 'orbited' a nucleus, then no atoms could ever form
The electron would radiate away all its energy and fall into the nucleus in about 10 𝑡𝑟𝑖𝑙𝑙𝑖𝑜𝑛𝑡𝘩𝑠 of a second pic.twitter.com/5JvjrhpAGl
タグ:
posted at 07:01:16
少し考えただけでも新井氏の議論には様々な問題があることは確かだ。(人格批判に陥いるのはまずい。)入試制度を正しく把握している側からの批判が必要。
[方法]に関する問題点は次のツイートに貼る連ツイで。 pic.twitter.com/rU2wsDSl0A
タグ:
posted at 02:38:39
新井紀子氏の公明党WTでの「共通テストに数学記述式は導入可能」との発言について。新井氏の議論には様々な問題があるが、せめて次のような趣旨だということくらいは汲み取ってから批判した方が良いと思う。 pic.twitter.com/tfeApDiRX1
タグ:
posted at 02:35:45
#Julia言語 上の計算は並列化に向いているので、並列化すれば並列化した分だけ短時間で計算が終わるのですが、そこまでのことはないと思ってやっていません。
誰かやって下さい!
関連↓
nbviewer.jupyter.org/gist/genkuroki...
Distributed and Threads examples (Julia v1.4.0-rc2.0)
タグ: Julia言語
posted at 01:36:19
#統計 #Julia言語 ついさっき計算が終わった n=1000 の場合。やはり
G + W ≈ 1.5
となっており、GとWの逆相関が非常にきれいに見えています。 pic.twitter.com/GoUKrk5nXc
posted at 01:31:28
#統計 以上はサンプルサイズがn=300の場合だが、以下はnがn=30と小さい場合。
添付画像1を見ると、サンプルk=14,34,92,100などの場合に、G+Wが平均の赤線から大きく離れている。その場合の事後分布の様子が添付画像2,3である。それらは添付画像4の典型的な事後分布の形とはかなり違う。 pic.twitter.com/rUJdxSYOuf
タグ: 統計
posted at 01:25:35
#統計 続き。添付画像の横軸は異なるサンプルを意味する。添付画像を見ると確かに G+W がほぼ定数になっている。
W < 0 となっているサンプルではWAICで真のモデルを選択し損ねる場合である。結構そうなることがわかる。これはWAICの性質上仕方がない。 pic.twitter.com/S4S88KmlbM
タグ: 統計
posted at 01:16:58
#統計 解説: 添付画像の G と W はそれぞれ渡辺澄夫『ベイズ統計の理論と方法』p.119の定理15の記号では
G = 2n(G_n - L(w₀)) ←汎化誤差
W = 2n(W_n - L_n(w₀)) ← WAIC
である。定理15によればn→∞で
G + W = 4λ + o_P(1).
要するにG+Wはほぼ定数になる。続く pic.twitter.com/fkHroiGcak
タグ: 統計
posted at 01:16:58
#統計 #Julia言語 既出のノート
nbviewer.jupyter.org/gist/genkuroki...
Metropolis-Hastings method
にベイズ統計の例を追加した。
1次元の混合正規分布が特異モデルになる場合を追加。
繰り返し「みんなやるべきだ」と言っている渡辺澄夫『ベイズ統計の理論と方法』p.119の定理15の確認例になっている。 pic.twitter.com/MaT4iRyikn
posted at 01:08:35
For the curious: the animation shows the latent evolution which by the imagination of a parsimonious continuous time model best explains the following 4 satellite pictures of a convective cloud system taken at distinct times. pic.twitter.com/pg4dQf3iJW
タグ:
posted at 00:33:55