Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
並び順 : 新→古 | 古→新

2020年03月05日(木)

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 n=3000、10000の場合もちょっと計算してみた。nを増やしたら、G+Wが少し上昇して平均1.6くらいになった。

G + W ≈ 4λ

なので、そこから、λ≈0.4 程度であることが分かるのだが、私の手計算では λ=1/2 = 0.5, m=2 になった。これで合ってますか?

nbviewer.jupyter.org/gist/genkuroki... twitter.com/genkuroki/stat... pic.twitter.com/cDqhjf4Htp

タグ: 統計

posted at 00:15:38

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 ちょっと上の方の添付画像の訂正版。つまらないミスの訂正。

添付画像の GW は G + W の意味です。

normalモデルで G+W ≈ 4 で G+W ≈ 4λ と比較すると、λ≈1です。normalモデルはパラメーター数d=2の正則モデルなので、λ=d/2=1となり、理論値とよく一致。

normal1についても同様。 pic.twitter.com/Unvr82OjQ1

タグ: 統計

posted at 00:21:29

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 計算時間短縮の都合で、MCMCで得た事後分布のサンプルのサイズは2000になっています。大きくないです。そのせいで以上の計算にはMCMC由来の誤差が結構入っています。

特異モデルのMCMCは単純なMH法では難しいという感触があります。

タグ: 統計

posted at 00:23:16

ごまふあざらし(GomahuAzaras @MathSorcerer

20年3月5日

そうそう、TypeCのiPadProはこうやってラズパイ4またはZeroとOTGせつぞくできるからべんり。ただし、電源共有の安定云々っていうのはあるけれど、趣味だったらもんだいない。 twitter.com/abap34/status/...

タグ:

posted at 00:25:51

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 実質ほんの数行で実装できるMetropolis-Hastings法であっても、 #Julia言語 でささっとコードを書いて、MCMCを回すだけで、以上のように十分に色々なことを勉強可能なことがわかると思います。

タグ: Julia言語 統計

posted at 00:25:53

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 特異モデル(に近いケース)では、特異パラメータ集合に沿って事後分布がぶわーっと広がったままで、予測精度が同程度の複雑さを持つ正則モデルよりも高くなります。

「特異」という語は「悪い」という意味を含んでいると誤解されがちなのですが、「特異モデル」は非常に良い状況なのだ。

タグ: 統計

posted at 00:29:47

ファインマンbot @feynmannnn

20年3月5日

テクノロジーを成功させるためには、広報よりもまず現実を優先すべきである。なぜなら自然を欺くことはできないからである。

タグ:

posted at 00:32:20

Massimo @Rainmaker1973

20年3月5日

Artist and designer Julia Nizamutdinova has created a kinetic sculpture that rotates, twists, and turns in a mesmerizing and hypnotic fashion. Made of plastic, aluminum, and steel, INFI is modeled after the infinity sign in its form and movement buff.ly/3ctp7FT pic.twitter.com/wW8P3QVOLF

タグ:

posted at 00:37:40

ごまふあざらし(GomahuAzaras @MathSorcerer

20年3月5日

Gaius.jl is a multi-threaded BLAS-like library using a divide-and-conquer strategy to parallelism

github.com/MasonProtter/G...
#Julialang #Julia言語 pic.twitter.com/kry3sXcELc

タグ: Julialang Julia言語

posted at 00:58:01

ごまふあざらし(GomahuAzaras @MathSorcerer

20年3月5日

htopでCPUの使用率を見るとGaiusがしっかりコアをつかってるんですよね。感動している

タグ:

posted at 00:58:02

ごまふあざらし(GomahuAzaras @MathSorcerer

20年3月5日

こういうのをみるとなかみどうなってるんだろうって
少しワクワクするんですよね。

github.com/chriselrod/Loo...

タグ:

posted at 01:07:12

Yuki Nagai @cometscome_phys

20年3月5日

Juliaでいろんなルンゲクッタ気軽に試せるの面白い

タグ:

posted at 01:26:13

ごまふあざらし(GomahuAzaras @MathSorcerer

20年3月5日

ただのパッケージの紹介でも
JeffさんにLikeされるとちょっと嬉しくなる

タグ:

posted at 01:27:51

ごまふあざらし(GomahuAzaras @MathSorcerer

20年3月5日

まくろしゅごいな。
こーかいたらいいかんじにしてくれるんでしょ?
AIよりもいいんじゃない?

タグ:

posted at 01:28:27

Yuki Nagai @cometscome_phys

20年3月5日

そういえばJuliaで
xs=range(1,10,length=10)
for x in xs
end
みたいなループで、forのindexって取得できないのかな。いまはi=0を外に書いてi+=1を内側に書いてる。
Pythonだと
for x,i in xs
みたいな感じでできたような気がする

タグ:

posted at 01:29:42

(「・ω・)「ガオー @bicycle1885

20年3月5日

@cometscome_phys for (i, x) in enumerate(xs)ですかね?

タグ:

posted at 01:37:06

ごまふあざらし(GomahuAzaras @MathSorcerer

20年3月5日

#Julialang

LinearAlgebra says ”Hey!!! why don't you use Julia 1.5-Dev? ”
😎 pic.twitter.com/U3hkehPSCI

タグ: Julialang

posted at 01:41:46

ごまふあざらし(GomahuAzaras @MathSorcerer

20年3月5日

Julia 何も考えずにバージョンアップするといつのまにかパフォーマンス向上しててこわい。

タグ:

posted at 01:43:06

ごまふあざらし(GomahuAzaras @MathSorcerer

20年3月5日

自由に数式をレンダリングができるようになれば
MathCounterExampleというリポジトリができて
〜をみたす例とそうでない例が大量にIssueなどで投稿されるようになると思うの。

タグ:

posted at 01:56:22

ごまふあざらし(GomahuAzaras @MathSorcerer

20年3月5日

普通にありそうだけどな(しらべてない)

タグ:

posted at 01:56:49

ntsutae @ntsutae

20年3月5日

#つぶやきProcessing #p5js
C=0,S=.985,A=[]
setup=_=>{for(i=0;i<300;){A[i++]=[sin(i),i]}}
draw=_=>{createCanvas(W=720,W)
F=sin(C++*.02);i=0
for([x,y]of A){v=w=0;ellipse(x+W/2,y+W/2,18)
for([a,b]of A){d=mag(x-a,y-b)
if(d<80&&d){v+=(a-x)/d,w+=(b-y)/d}}
A[i++]=[(x+v*F)*S,(y+w*F)*S]}} pic.twitter.com/OOvSt45rDd

タグ: p5js つぶやきProcessing

posted at 01:59:59

Arturo Erdély @ArturoErdely

20年3月5日

#julialang *Just In Time* (JIT) compilation. Image from the excellent book «Julia High Performance» by Avik Sengupta: juliahighperformance.com pic.twitter.com/Dtssk7Mag8

タグ: julialang

posted at 03:50:53

f_jhr @f_jhr

20年3月5日

渡辺ベイズ、やっぱり5,6章で具体的な問題に対する練習をしてから、3,4章の漸近理論を読むのがよさそうな気がする。実用目的の人が5,6章読まずに4章あたりで挫折したらもったいないので

タグ:

posted at 04:59:37

にるそん @ohtanilson

20年3月5日

QuantEconのJuliaのようにat_with_kwで構造体っぽく(型なしで)変数を定義して、のちにunpackで使うパラメタだけ取り出す方法と、mutable struct のように構造体かつ型宣言して、のちに構造体からパラメタ呼び出す方法、どっちが効率的なんでしょう?他言語とcompatibleにするなら後者でしょうか?

タグ:

posted at 09:05:02

Yuki Nagai @cometscome_phys

20年3月5日

Juliaでルンゲクッタしてたら、"ERROR: LoadError: Something went wrong. Integrator stepped past tstops but the algorithm was dtchangeable. Please report this error."って出た

タグ:

posted at 09:42:15

moto kawasaki @motok2501

20年3月5日

JuliaLangの経典を探しているがThink Juliaなのかしら。
The Julia Programming Languageが無いのが不思議な感じ。

タグ:

posted at 10:06:36

ウラサキ @hirotourasaki

20年3月5日

新井紀子も吉田研作同様、利権ズブズブじゃねえか!
こういう人たちに入試改革を任せて良いのか? twitter.com/genkuroki/stat...

タグ:

posted at 10:32:46

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 モデルM₁のパラメータ空間を次元が下がった部分空間に制限して得られるモデルをM₀とし、サンプルを生成する分布がモデルM₀で実現可能だとするとき、モデルM₀とM₁のAICの差がどうなっているかという問題の答えは、古典的な「対数尤度比のχ²検定」。

Wilks's theoremの話だと言ってよい。

タグ: 統計

posted at 10:36:09

グルーナ @viscountgruner

20年3月5日

(平)理事筆頭の肩書きにある高宮学園→代々木ゼミナールですな。 twitter.com/genkuroki/stat...

タグ:

posted at 10:36:57

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 パラメータが少ないモデルM₀でサンプルを生成している分布を実現可能ならば、パラメータを増やしたM₁よりもM₀を選択したいのだが、AICでモデル選択すると、その場合(正則モデルは仮定)に成立する普遍的なWilks' theoremによって、モデル選択失敗確率の近似値をχ²分布を使って計算できる。

タグ: 統計

posted at 10:40:02

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 その事実が、たくさんの種類があるχ²検定__達__の基礎になっています。

そういう話を特異モデルとWAICに拡張できれば、すでにものすごくたくさんあるχ²検定達をさらに大幅に拡張することができるはず。

ど素人の感覚では非常に楽しそうです。

続く

タグ: 統計

posted at 10:43:12

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 以下のリンク先は、モデルのペアごとに、汎化誤差G(正確にはKL情報量)とWAIC Wをプロットしたもの。それらの差の大きさは45度線からどれだけ離れたかで測られる。

3種のモデルの共通部分に含まれる分布でサンプルを1000個生成してプロットしています。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 10:50:39

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 #Julia言語 ソースファイルは

nbviewer.jupyter.org/gist/genkuroki...

にある。

N(x)を標準正規分布とするとき、モデル達は

q(x)=N(x) (サンプルを生成する分布)

p_mixnormal(x|a,b)=(1-a)N(x)+aN(x-b) (混合正規分布モデル)

p_normal(x|μ,σ)=N((x-μ)/σ)/σ

p_normal1(x|μ)=N(x-μ)

です。

タグ: Julia言語 統計

posted at 10:57:30

堀田一敬 @ikkeihotta

20年3月5日

新型コロナウイルスのPCR検査が話題になっていますが,私の確率統計の講義を受けた学生はこの演習問題を思い出すんだ(条件付き確率). pic.twitter.com/dhUn253SsF

タグ:

posted at 10:58:48

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 normalをパラメータσを1に固定したものがnormal1です。この場合は古典的なWilks' theoremで扱える状況。それぞれについて、汎化誤差 GとWAIC Wをプロットした結果が添付画像。MCMCの誤差が結構入っていることに注意(以下も同様)。

黒の点線は45度線で、そこからの乖離が「差」になっている。 pic.twitter.com/g32i8zMuaS

タグ: 統計

posted at 11:01:58

堀田一敬 @ikkeihotta

20年3月5日

ふつうに条件付き確率の定義にのっとって計算してもいいですが,直感的には10000人連れてくるのがいいと思います.検査で陽性反応が出るのが198人,実際に陽性なのは99人なので,確率は1/2,50%です. pic.twitter.com/LWqKq4pZkz

タグ:

posted at 11:04:49

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 続き。このプロットを見れば「非常にきれいな確率法則が成立していること」は明らかだと思います。

正則モデルで、片方のモデルがもう一方のパラメータ空間を制限したもので、制限内にサンプルを生成した分布が入っている場合には普遍的にこういうことが成立する(Wilks' theorem)。 pic.twitter.com/6hQIKyKDg9

タグ: 統計

posted at 11:04:53

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 WAIC側のプロットが、汎化誤差側のプロットを180度回転して平行移動したものになることは、渡辺澄夫『ベイズ統計の理論と方法』p.119の定理15より。

実際のプロットでは、その定理15の左辺の括弧中の量を2n倍したものの対を座標とする点をプロットしています。 pic.twitter.com/Udjfl2lOQf

タグ: 統計

posted at 11:08:26

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 色の付け方

赤: normal側の方が汎化誤差もWAICも大きい場合
黄: normal側の汎化誤差が大きいが、WAIC側では逆
シアン: normal側の汎化誤差が小さいが、WAIC側では逆
青: normal側の方が汎化誤差もWAICも小さい場合

青色の点はない。

黄色シアンがWAICでのモデル選択に失敗する場合です。 pic.twitter.com/AzD0PBGSbL

タグ: 統計

posted at 11:12:26

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 normalもnormal1もシンプルな正則モデル(指数型分布族!)なので、ベイズ統計やらMCMCやWAICを使う必然性は皆無で、最尤法を使ってWAICの代わりにAICをプロットしてもほぼ同じプロットが得られます。 pic.twitter.com/i0hww9rRYu

タグ: 統計

posted at 11:15:06

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 この場合にmixnormalモデルは特異モデルになっており、normal1モデルを含んでいます。この場合の汎化誤差GとWAIC Wのプロットは添付画像の通り。

mixnormalモデルの方がnormal1モデルより汎化誤差が小さくなる場合の割合が多くなっています。私の計算例では737/1000でそうなっています。 pic.twitter.com/oqIGUQzQ5o

タグ: 統計

posted at 11:19:59

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 点の分布の仕方や色付けと45度線の関係を見れば、特異モデルとそれを制限した部分モデルの場合にも何か普遍的な確率法則がありそう。

Wilks' theoremもベイズ特異モデル版の

定式化と証明



実用的に使える具体的な様子が分かる場合の同定

は多分生産的なよい問題だと思います。 pic.twitter.com/GLlNqkPoUU

タグ: 統計

posted at 11:23:59

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 p_mixnormal(x|a,b)=(1-a)N(x)+aN(x-b)とp_normal(x|μ,σ)=N((x-μ)/σ)/σは共通部分がp_normal1(x|μ)=N(x-μ)に一致する異なる2パラメータモデルです。サンプルを生成した分布N(x)は共通部分に含まれている。

その場合のプロットが添付画像。

この場合にも何か綺麗な法則がありそうです。 pic.twitter.com/YgGxowfSve

タグ: 統計

posted at 11:28:40

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 統計学のど素人の私であっても、

複数のモデルの汎化誤差やWAICの標本分布由来の同時確率分布がどうなっているか

は統計学における最も基本的な問題に1つだと思います。

みんなで計算結果のプロットをこうやって公開して行くことが好ましいと思います。

タグ: 統計

posted at 11:31:45

mathematica_command @mathematica_bot

20年3月5日

FiniteAbelianGroupCount[n] :位数n の有限アーベル群の数を与える

タグ:

posted at 11:35:53

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 以上で紹介したノート

nbviewer.jupyter.org/gist/genkuroki...
1次元の混合正規分布モデルのWAIC



nbviewer.jupyter.org/gist/genkuroki...
Metropolis-Hastings method

の続編。

既存のMCMCパッケージを使わずに素朴にテキトーに何も見ずに実装したMCMC法であっても、勉強のために非常に役に立つことを示したノート。

タグ: 統計

posted at 11:36:19

東北大学広報 @TohokuUniv_Koho

20年3月5日

【重要】東北大学の学生の皆様へ

#東北大学 公式アカウントで #新型コロナウイルスの蔓延を防ぐ ための対応について情報発信がありました。
以下URLから必ず確認してください。
#東北大 #COVID19 #新型コロナウイルス感染症 twitter.com/tohoku_univ/st...

タグ: COVID19 新型コロナウイルスの蔓延を防ぐ 新型コロナウイルス感染症 東北大 東北大学

posted at 11:39:13

RochejacMonmo @RochejacMonmo

20年3月5日

吉田研作氏は、この段階になってもなお、妥当とは言えない現状認識や数の大きさでミスリードしようとするような論法を使い続けているように見える。今回の入試改革を牽引しようとする人たちは、間違った事実認識を正そうとする気配が全く感じられない。 twitter.com/VC5FKHkRrrZxII...

タグ:

posted at 11:51:15

黒木玄 Gen Kuroki @genkuroki

20年3月5日

私もその説明の仕方がよいと思う。
(ベイズ云々とか統計学云々と言うのはやめた方がよい。)

全体の人数を適当に与えて、2×2の分割表を作って眺めるだけ。

このスレッドに書いたように、大学入試問題にも出題されるくらい易しい話。

twitter.com/ikkeihotta/sta...

タグ:

posted at 11:57:26

鯵坂もっちょ @motcho_tw

20年3月5日

左から正十二面体、六、八、二十、(ブランク)、です。
十二は角を少し削る必要があり、六は頂点が被ってしまうのでこの方法を使うときは八か二十がオススメですね(四は無理)

タグ:

posted at 12:12:51

天むす名古屋 Temmus @temmusu_n

20年3月5日

スゲー。#超算数|の語がネットを越えてリアルでも使用されたtwitter.com/yousaien/statu...。酷い目にあったR君、めげないで数と仲よくなって下さいね。

タグ: 超算数

posted at 12:15:53

闇のapj @apj

20年3月5日

低賃金ほど結婚できないという現実があるわけで、消費税より逆進性高くなりそう。 twitter.com/mokomoko_tanuk...

タグ:

posted at 12:50:29

グレブナー基底大好きbot @groebner_basis

20年3月5日

リポーター「今日は数学者の先生に取材に来てきます!普段、数学者が何をしているのか聞いちゃいます!」

リポーター「早速ですが、数学者は普段どんなことをやっているんですか?」

数学者「数学です」

タグ:

posted at 12:50:55

東北大学広報 @TohokuUniv_Koho

20年3月5日

【重要】東北大学の学生の皆様へ(For English)

東北大学英語版のWEBサイトにも #COVID19 関連の情報を掲載しています。周りの留学生のお友達にもお知らせしてくださいね。
以下URLから確認してください。
#東北大 #COVID19 #新型コロナウイルス感染症 twitter.com/TohokuUniPR/st...

タグ: COVID19 新型コロナウイルス感染症 東北大

posted at 13:18:57

黒木玄 Gen Kuroki @genkuroki

20年3月5日

コーヒーがうまい(自分でいれた)

タグ:

posted at 13:40:16

大童 澄瞳/Sumito Oowara @dennou319

20年3月5日

ホゲー!!!!!我が庭の池にヒキガエルの卵が!!!!!!!ついに!!!ついに!!!!!!産卵してくれたのだ!!!!!!!環境を整えるまでなんやかんや数年かかったが・・・活発な時期に間に合って良かった・・・論文を読んだり詳しい方に教えて頂いたり・・・よかった pic.twitter.com/fRh4Eazwl3

タグ:

posted at 14:40:50

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#Julia言語 おまけ

1行で3次元ランダムウォークを構成して1行で表示.

X = cumsum(randn(2^12, 3), dims=1)
plot(X[:,1], X[:,2], X[:,3]; label="random walk", lw=0.5) pic.twitter.com/Djnbo69yos

タグ: Julia言語

posted at 15:07:57

Hidekazu Shiozawa @shiozawa_h

20年3月5日

どうしてこうなるのか、全然分からん…。 twitter.com/ntsutae/status...

タグ:

posted at 17:30:08

Hidekazu Shiozawa @shiozawa_h

20年3月5日

@ntsutae 乱数もノイズも使っていないで、“決定論”でこの動きをしているのがすごいです。

タグ:

posted at 17:34:44

(「・ω・)「ガオー @bicycle1885

20年3月5日

そういえばceptree見かけないな。死んだかな?

タグ:

posted at 18:03:30

ceptree @ceptree

20年3月5日

@bicycle1885 (死後強まる念でツイッターしてる)

タグ:

posted at 18:10:39

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 私は、渡辺澄夫『ベイズ統計の理論と方法』は、WAICと汎化誤差の関係に関するp.119の定理15のβ=1の場合を特別な確率モデルについて確認することを最初の目標にすると、実用的な理解に至り易いといつも言っています。

続く

twitter.com/f_jhr/status/1...

タグ: 統計

posted at 18:14:54

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 その理由

* 難しくない確率モデルに関する数値シミュレーションで、WAICと汎化誤差を計算するコードを書くのは易しい。定義式をそのまま使えばよい。

* そのとき、自分で書いたコードが正しいかどうか自信を持てなくても、p.119 定理15のような非自明な定理が数値的に再現されれば自信がつく。

タグ: 統計

posted at 18:14:55

黒木玄 Gen Kuroki @genkuroki

20年3月5日

内容を十分に理解していなくても、コンピュータで数値計算するコードを書ける場合は結構あります。

でも、理解せずにコードを書くと、ひどい単純ミスを犯していても気付くことができなくなってしまいます。

しかし、非自明な定理を数値的に再現できたなら、正しい実装になっていると期待できます。

タグ:

posted at 18:14:56

黒木玄 Gen Kuroki @genkuroki

20年3月5日

数学の理解で最重要なことは

 えっ!ほんとにそんなことが成立しているの?

という感覚を持ちつつ、実際に成立していることを確認すること。

紙の上での証明で確認するだけではなく、具体例で数値的に確認できていることも理解のためには必須です。後者だけでもできていれば理解は進む。

タグ:

posted at 18:19:09

黒木玄 Gen Kuroki @genkuroki

20年3月5日

あと、結論の一番面白そうな部分の様子をいきなり最初に見てしまえるなら、そうした方が都合が良いですが。

渡辺澄夫『ベイズ統計の理論と方法』では、WAICの計算の仕方と使い方の理解がまさにそれ。

p.119 定理15の数値的確認を行えば、WAICの計算をコンピュータでできるようになっています。

タグ:

posted at 18:22:19

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 #Julia言語

nbviewer.jupyter.org/gist/genkuroki...
1次元の混合正規分布モデルのWAIC



nbviewer.jupyter.org/gist/genkuroki...
Metropolis-Hastings method

ではp.119 定理15の数値的確認を実際に行っています。

遊びでMCMC法の実装から始めていますが、既存のMCMCパッケージを使ってもよいと思います。

タグ: Julia言語 統計

posted at 18:26:08

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 コンピュータで計算できるようになったら、印象的なプロットを作って理解の助けになるようにした方が楽しいです。

おすすめなのは、このスレッドで詳しく説明した方法で異なるモデルの汎化誤差やWAICの対を平面上にプロットしてみること。

私と同じようなプロットが得られれば成功です。

タグ: 統計

posted at 18:28:37

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 WAICは予測分布の汎化誤差でモデル選択をするために使われるので、異なるモデル間の汎化誤差の大小とWAICの大小の関係がどうなっているかを理解することが必要です。そこが肝腎の部分。

コンピュータで計算してプロットすれば一目瞭然です。

タグ: 統計

posted at 18:31:28

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 もっと簡単なベルヌーイ分布モデルのケースであれば、多くの統計量の公式を紙の上での計算で比較的容易に作れます。そのような公式を用いたp.119 定理15の確認については

nbviewer.jupyter.org/gist/genkuroki...
Bernoulli分布モデル

を見て下さい。

タグ: 統計

posted at 18:34:04

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 以下のリンク先スレッドも参照。

ポイントは

* 標本分布 q(x_1)…q(x_n) による汎化誤差やWAICの確率分布がどうなっているか

* 同一の標本分布につい、複数のモデルの汎化誤差やWAICの同時確率分布がどうなっているか

の様子をコンピュータで確認すること。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 18:37:36

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 実際にやってみると、標本分布 q(x_1)…q(x_n) に従う乱数 (X_1,…,X_n) を例えば1000個発生させて、その各々についてモデルの予測分布、汎化誤差、WAICを計算することに計算時間がかかりすぎることに悩むかもしれません。

そういう人には #Julia言語 が非常にお勧めです。

タグ: Julia言語 統計

posted at 18:44:04

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 MCMCによる計算でのボトルネックは、対数尤度函数の計算部分です。対数尤度函数の実装で最適化しておかないと、計算時間が10倍から数十倍に伸びることがあります。

上で公開した私のコードはさらに最適化できます。

単に理論的な事柄だけではなく、数値計算の問題も結構重要だと思います。

タグ: 統計

posted at 18:48:17

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#Julia言語

nbviewer.jupyter.org/gist/genkuroki...
1次元の混合正規分布モデルのWAIC

の計算ではサンプルサイズnごとに

n=30のサンプル1000個について色々計算→4分半
n=100のサンプル1000個について色々計算 →12分
n=300のサンプル1000個について色々計算 →30分

程度の時間がかかりました。CPUで並列化無し。

タグ: Julia言語

posted at 19:25:43

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#Julia言語 というわけで、Threads.@ thereads をシミュレーションを繰り返すforループの前に追加しました。

もとのコードに18文字追加するだけで計算が3倍以上速くなりました。

docs.julialang.org/en/v1/manual/p...

twitter.com/genkuroki/stat... pic.twitter.com/nu4SSZWJat

タグ: Julia言語

posted at 21:37:38

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#Julia言語 うげ、CPUのコアが全部100%まで使われている。

タグ: Julia言語

posted at 21:41:35

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#Julia言語 パソコンのファンの音がはげしい(笑)。

タグ: Julia言語

posted at 21:43:45

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#Julia言語 18文字追加するだけで3倍以上速くなるなら最初からそうしておくべきだった。あほ過ぎ。

タグ: Julia言語

posted at 21:44:44

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#Julia言語 サイズn=1000のサンプル1000個の処理が30分かかっていたのが、8分で済んだ。これはうれしい。

タグ: Julia言語

posted at 21:46:08

Ishida the Brain Dam @tbs_i

20年3月5日

マルチスレッド使うとマルチコアガンガン使えるの嬉しくなってタスクマネージャのCPUグラフ見続けたりする人は多いはずw twitter.com/genkuroki/stat...

タグ:

posted at 21:56:50

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#Julia言語 ミニマルな例を作りました。

nbviewer.jupyter.org/gist/genkuroki...
Simple Threads.@ threads example

サンプル生成→サンプルからの推定→配列への結果の保存

のforループの前に Threads.@ therads を追加するだけ。 pic.twitter.com/FFUUkesXGd

タグ: Julia言語

posted at 22:07:14

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#Julia言語 での分散処理およびマルチスレッドについては

nbviewer.jupyter.org/gist/genkuroki...
Distributed and Threads examples (Julia v1.4.0-rc2.0)

というノートブックもあります。そこには書くスレッドへの仕事の割り振りを手動で行う例が載っている。それだと「18文字追加するだけ」では済まなくなる。

タグ: Julia言語

posted at 22:09:49

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#Julia言語 最近紹介した島谷健一郎『ポアソン回帰・ポアソン回帰・ポアソン過程』という本でも、コンピューターで仮想的なサンプルを生成してシミュレーションを行うことによって理解を深める方法が紹介されているのですが、そういう目的にはJuliaは非常に便利な道具だと思います。気軽に色々できる。

タグ: Julia言語

posted at 22:12:13

富谷(助教);監修 シン仮面ライダー @TomiyaAkio

20年3月5日

twitter.com/genkuroki/stat...
やはり物理は役に立つなー
(物理起源の手法という意味で)

タグ:

posted at 22:12:40

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 プロットも作り直した。背景の色が lightgray で明るすぎて見難かったので、gray に変更した。

そのおかげで「外れ値」の位置が相当に見易くなっています。

汎化誤差 G のプロットとWAIC W のプロットが「180度回転と平行移動」の関係になっていることが、外れ値も含めて見易くなったと思う。 pic.twitter.com/MP2bEgj6w0

タグ: 統計

posted at 22:18:56

黒木玄 Gen Kuroki @genkuroki

20年3月5日

#統計 #Julia言語

せっかくなのでサンプルサイズn=10の場合のプロットも作った。

汎化誤差 G とWAIC W のプロットが「180度回転して平行移動」の関係になっていることは、n→大での漸近論でしかないのですが、n=10の小サンプルでも結構成立しています。 pic.twitter.com/GIXzyp0M1J

タグ: Julia言語 統計

posted at 22:28:35

黒木玄 Gen Kuroki @genkuroki

20年3月5日

数学的に n→∞ で成立している結果を現実に応用する場合には、有限の n でどうなっているかの確認が必ず必要。

有限の n で n→∞ での結果がどれだけ悪くない誤差で適用できるかはケース・バイ・ケース。上で紹介した場合には n = 10 でも悪くなさそうな感じで成立している。

タグ:

posted at 22:30:17

黒木玄 Gen Kuroki @genkuroki

20年3月5日

ちなみにこの手のことをやったことのある人ならみんな気付いていることだと思いますが、計算のためのコードを書く手間と、綺麗にプロットするためのコードを書く手間はほぼ同じ。場合によっては後者の方が多くなってしまうことがある。「視覚化」は結構大変。

タグ:

posted at 22:33:58

黒木玄 Gen Kuroki @genkuroki

20年3月5日

何をプロットするかにも理解の深さが問われることになる。

最初のうちは「同一の標本分布が生成するサンプルについて異なるモデルが生成する各種の値の同時分布が大事である」ということがわかっていなかったので、情報量が少ないプロットを多数作成していた。

基本の理解は非常に難しい。

タグ:

posted at 22:38:43

OokuboTact 大久保中二病中年 @OokuboTact

20年3月5日

@temmusu_n > 新宮恒次郎『算術教育汎論』東京、雄山閣編輯局、1934年。

勉強になりますね。

タグ:

posted at 22:57:53

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました