Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
Favolog ホーム » @genkuroki » 2020年03月04日
並び順 : 新→古 | 古→新

2020年03月04日(水)

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 参考までに

nbviewer.jupyter.org/gist/genkuroki...

からWAICの計算部分を抜き出してみましょう。添付画像を見ればわかるように、ほんの数行でWAICを計算する函数を書けます。汎函数分散を #Julia言語 の分散函数で使って書いた。

こういう勉強目的には #Julia言語 以上の道具はないと思う。 pic.twitter.com/iUih3nVsD6

タグ: Julia言語 統計

posted at 23:36:08

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 以上で紹介したグラフは、渡辺澄夫『ベイズ統計の理論と方法』p.119の定理15よりも多くの情報を含んでおり、プロットする価値は高いです。

WAICを自力で計算できるようになったら(これはそう難しくない)、是非ともプロットしてみてください。

タグ: 統計

posted at 23:31:06

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 真の予測誤差のG側のグラフを180度回転させて、適当にシフトすると、WAICの側Wのグラフにほぼ一致する。

赤と青はWAICによる真の予測誤差が小さなモデルの選択に成功する場合で、黄色と空色は失敗する場合。 pic.twitter.com/IdpEg39I7W

タグ: 統計

posted at 23:29:28

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 続き。より正確には、mixnormal vs. normal の場合には、1000個のサンプル中980個で mixnormal 側の予測誤差が小さくなっている。しかし、WAICによるモデル選択では1000個中121+20=141個で失敗している。

添付画像の他の部分も同様に情報を読み取れる。 pic.twitter.com/DNVzokvfmx

タグ: 統計

posted at 23:27:37

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 続き。画像を作り直して、n=300の場合にはそうだとわかるようにした。

例えば、mixnormal vs. normal の場合には、G = 真の予測誤差が小さい側はすべて mixnormal 側になっている。このケースで mixnormal は特異モデルなので、推定の精度が高くなる。特異モデルになると推定の精度が上がる! pic.twitter.com/uEhBQ9oLbM

タグ: 統計

posted at 23:23:38

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 続き。1つ前およびこのツイートはサンプルサイズ300の場合。

G_mixnormal は mixnormal モデルでの予測分布の真の予測誤差。これは数値実験なので真の分布である標準正規分布をカンニングできるので計算可能。

W_mixnormal は本質的にWAICです。他のモデルでも同様の記号を使っている。 pic.twitter.com/qd3jaVfolD

タグ: 統計

posted at 23:02:54

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 続き。1つ前のツイートの添付画像1,2,3はそれぞれ標準正規分布のサイズ300,100,30のサンプルの場合。

mixnormalは

p_mixnormal(x|a,b)=(1-a)N(x)+aN(x-b), N(x)は標準正規分布

の形の1次元の混合正規分布モデル。normalは平均μ分散σ²の正規分布モデルで、normal1では分散を1に固定。 pic.twitter.com/zKixhnKmK2

タグ: 統計

posted at 23:00:40

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 #Julia言語 自前でMCMC法を実装すれば(MH法なら実質的部分は数行~十数行で実装可能)、特異モデルのベイズ統計で遊べることを示すノートブックのパート2

nbviewer.jupyter.org/gist/genkuroki...
1次元の混合正規分布モデルのWAIC

添付画像はモデル選択の様子を一目で見るためのプロット。 pic.twitter.com/bx8Or5MY4H

タグ: Julia言語 統計

posted at 22:56:10

ハリリ @hariri432

20年3月4日

これホントらしい

タグ:

posted at 17:12:29

ハリリ @hariri432

20年3月4日

あくタイプのポケモンがむし かくとうタイプに弱い理由 pic.twitter.com/6LQ3h7Mnje

タグ:

posted at 17:08:15

阿部2 @cocotan_2

20年3月4日

ベイズ統計を論破するひろゆき「それあなたの主観ですよね?」

タグ:

posted at 16:44:52

TaKu @takusansu

20年3月4日

続き)
#超算数 倍数というものを知って、0は倍数だと思う生徒に、0は倍数ではないと教え込んだら、その後、0は倍数だというのは受け入れ難くなるのではないか?

タグ: 超算数

posted at 15:55:51

TaKu @takusansu

20年3月4日

#超算数 人は何度も考えを変えられるのか?
長方形を学んだ時、正方形も長方形の一種と考えた生徒に、正方形は長方形ではないと教え込んだら、その後、正方形も長方形の一種というのは受け入れ難くなるのではないか?
(続く

タグ: 超算数

posted at 15:55:51

藤井 涼/宇宙ビジネスメディア「Uchu @ryo_fujii1986

20年3月4日

ドローンで病院に血液を届けるルワンダの「Zipline」を現地取材しました。時速130キロで飛ぶことができ、車で2時間かかっていた病院への配送時間をわずか15分に短縮しています。取材中にも10〜15分おきにドローンが発射されており、病院からの依頼もかなり多いようでした。
japan.cnet.com/article/351502...

タグ:

posted at 13:22:20

志位++和夫 @hyper0dietter

20年3月4日

数学科に入って、働いたり生活するために何が良かったかと言うと自分が考えている事を論理で否定されることに慣れたり、自分で自分の考えを論理で否定することに慣れることぐらいだと思う。他分野を勉強するときに数学で困ることは少ないと言うのもあるけど物理やってても情報やってても同じだと思う。

タグ:

posted at 10:01:21

〈 Berger | Dillon 〉 @InertialObservr

20年3月4日

If electrons actually 'orbited' a nucleus, then no atoms could ever form

The electron would radiate away all its energy and fall into the nucleus in about 10 𝑡𝑟𝑖𝑙𝑙𝑖𝑜𝑛𝑡𝘩𝑠 of a second pic.twitter.com/5JvjrhpAGl

タグ:

posted at 07:01:16

RochejacMonmo @RochejacMonmo

20年3月4日

少し考えただけでも新井氏の議論には様々な問題があることは確かだ。(人格批判に陥いるのはまずい。)入試制度を正しく把握している側からの批判が必要。
[方法]に関する問題点は次のツイートに貼る連ツイで。 pic.twitter.com/rU2wsDSl0A

タグ:

posted at 02:38:39

RochejacMonmo @RochejacMonmo

20年3月4日

新井紀子氏の公明党WTでの「共通テストに数学記述式は導入可能」との発言について。新井氏の議論には様々な問題があるが、せめて次のような趣旨だということくらいは汲み取ってから批判した方が良いと思う。 pic.twitter.com/tfeApDiRX1

タグ:

posted at 02:35:45

名大先生名言・迷言bot @ngy_digk

20年3月4日

微分積分学
『(ランダウの記号が出てくるたびに)これはゴミのように小さいので無視できます』
(byI先生)

タグ:

posted at 02:35:37

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 渡辺ベイズ本については、

(AIC) p.80の12行目の式の両辺に2nをかけた結果

(WAIC) p.119の定理15のβ=1で両辺に2nをかけた結果

(LOOCV) p.180の6行目の式の両辺に2nをかけた結果

がコンピュータで非常に綺麗に確認できる非自明な結果なのでお勧め。自前の実装の正しさもそれで確認可能。

タグ: 統計

posted at 01:39:02

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#Julia言語 上の計算は並列化に向いているので、並列化すれば並列化した分だけ短時間で計算が終わるのですが、そこまでのことはないと思ってやっていません。

誰かやって下さい!

関連↓

nbviewer.jupyter.org/gist/genkuroki...
Distributed and Threads examples (Julia v1.4.0-rc2.0)

タグ: Julia言語

posted at 01:36:19

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 #Julia言語 ついさっき計算が終わった n=1000 の場合。やはり

G + W ≈ 1.5

となっており、GとWの逆相関が非常にきれいに見えています。 pic.twitter.com/GoUKrk5nXc

タグ: Julia言語 統計

posted at 01:31:28

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 要するに、サンプルが特異モデルの典型的な状況からかけ離れた事後分布を生成する場合には、G+Wが平均のラインからかけ離れてしまうということ。

こんな感じで、サンプルが偏っていると、そのサンプルを用いた推定・推測・推論には失敗する可能性が上昇します。

タグ: 統計

posted at 01:27:24

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 以上はサンプルサイズがn=300の場合だが、以下はnがn=30と小さい場合。

添付画像1を見ると、サンプルk=14,34,92,100などの場合に、G+Wが平均の赤線から大きく離れている。その場合の事後分布の様子が添付画像2,3である。それらは添付画像4の典型的な事後分布の形とはかなり違う。 pic.twitter.com/rUJdxSYOuf

タグ: 統計

posted at 01:25:35

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 続き。添付画像の横軸は異なるサンプルを意味する。添付画像を見ると確かに G+W がほぼ定数になっている。

W < 0 となっているサンプルではWAICで真のモデルを選択し損ねる場合である。結構そうなることがわかる。これはWAICの性質上仕方がない。 pic.twitter.com/S4S88KmlbM

タグ: 統計

posted at 01:16:58

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 解説: 添付画像の G と W はそれぞれ渡辺澄夫『ベイズ統計の理論と方法』p.119の定理15の記号では

G = 2n(G_n - L(w₀))  ←汎化誤差
W = 2n(W_n - L_n(w₀)) ← WAIC

である。定理15によればn→∞で

G + W = 4λ + o_P(1).

要するにG+Wはほぼ定数になる。続く pic.twitter.com/fkHroiGcak

タグ: 統計

posted at 01:16:58

黒木玄 Gen Kuroki @genkuroki

20年3月4日

#統計 #Julia言語 既出のノート

nbviewer.jupyter.org/gist/genkuroki...
Metropolis-Hastings method

にベイズ統計の例を追加した。

1次元の混合正規分布が特異モデルになる場合を追加。

繰り返し「みんなやるべきだ」と言っている渡辺澄夫『ベイズ統計の理論と方法』p.119の定理15の確認例になっている。 pic.twitter.com/MaT4iRyikn

タグ: Julia言語 統計

posted at 01:08:35

Moritz Schauer @MoritzSchauer

20年3月4日

For the curious: the animation shows the latent evolution which by the imagination of a parsimonious continuous time model best explains the following 4 satellite pictures of a convective cloud system taken at distinct times. pic.twitter.com/pg4dQf3iJW

タグ:

posted at 00:33:55

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました