黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2020年03月08日(日)
#統計 「ベイズ統計モデリング」の勉強をしたくてかつ #Julia言語 でお気楽に数値計算(two language problem 無しに高速計算可能)を楽しみたい人には、 Turing.jl は結構おすすめかも。 Julia v1.4.0-rc2.0 で Turing.jl を使うには以下のリンク先の情報が必要。
twitter.com/genkuroki/stat...
posted at 23:37:14
#統計 #Julia言語 添付画像は既出の
nbviewer.jupyter.org/gist/genkuroki...
より。絶対温度ゼロのベイズ統計が最尤法に一致することのガンマ分布モデルにおける数値的確認。 pic.twitter.com/vxWcxJ6RDS
posted at 23:34:28
#Julia言語 Turing.jl でも任意の対数尤度函数を使用できます。大体において、確率分布の型を自前で定義して、logpdf (など)を定義しておけばよいようです。以下のノートはその応用例。
nbviewer.jupyter.org/gist/genkuroki...
逆温度入りの対数尤度函数のTuring.jlでの使用法
これを使えばWBICも計算可能。
タグ: Julia言語
posted at 23:27:36
#統計 20世紀に「頻度主義vs.ベイズ主義」の論争があったようだが、「虐げられていたベイズ統計が現代において復活した!」の類の解説は誤り。
実際には、ベイズ主義陣営も主観確率云々のような非合理的な考え方をしていて、非難されて当然のことを言っていた。
論争の双方がダメな20世紀の黒歴史。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 21:09:36
#Julia言語 数値積分の精度を rtol=1e-3 まで落としたら、18秒ちょっとかかっていたのが、15秒ちょっとまで短くなった。積分区間を縮めてもよさそうだが、面倒なのでこの辺でやめにしておく。 (MCMCの結果はどうせ誤差が混じるので精密な数値積分には大して意味がない。)
twitter.com/genkuroki/stat...
タグ: Julia言語
posted at 20:58:50
#Julia言語 訂正。数値積分の範囲が狭かったことに気付いて、やり直した。
数値積分無して「公式」を使う方法ならば0.24秒で済むWAICの計算が、18秒以上かかった。7×2万回=14万回数値積分が実行されている。
訂正:13秒→18秒
twitter.com/genkuroki/stat...
タグ: Julia言語
posted at 20:50:14
#統計 赤池弘次さん本人によれば、AICのAは "an" を意味します。AIC = an information criterion なのだそうです。証拠は
www.jstage.jst.go.jp/article/butsur...
エントロピーとモデルの尤度(<講座>物理学周辺の確率統計)
赤池 弘次
1980
のp.612にある(添付画像)
twitter.com/jp011100/statu... pic.twitter.com/s8B6BPE0Gy
タグ: 統計
posted at 20:37:00
階級幅を変えてプロットしたり、場所を変えたりと無限の選択肢がある中でデータの見え方の構造が変わるという体験で、統計的推測がそもそも不良設定問題であり、ヒストグラムはデータではなくモデルなのだ、と認識することは大切に思います。
タグ:
posted at 20:36:33
モデル分布や分布そのものについて考えるには、ヒストグラムモデルを最初に学ぶのが良さそうだなと思っています。Sanovの定理を考えるときも。個人的には神経スパイクヒストグラムの幅をどのようにとるか、という問題でこのことを考える機会を得ました。
タグ:
posted at 20:29:09
英語版は、1986です(※注意:手書きのメモで1987と書いてしまっていますが、1986の間違いです)
twitter.com/katzkagaya/sta...
タグ:
posted at 20:25:25
#Julia言語 スレッド違いを回収
Julia v1.4.0-rc2.0 で Turing@0.9.0 を動かしたい人は Libtask.jl のインストールで工夫する必要がある。(私の環境特有の問題の可能性もありますが。誰かがそうであることを確認してくれたら、このスレッドでコメントします。)
twitter.com/genkuroki/stat...
タグ: Julia言語
posted at 20:21:08
#統計 #Julia言語 添付画像を見ればわかるように、階層ベイズモデルも Turing.jl でシンプルに記述できます。
全部 Julia なので、WAICを計算するために数値積分が必要になる場合には Julia の数値積分パッケージを普通に使用することになります(配列 Y にサンプルを入れて渡す)。 pic.twitter.com/gRbfx9ePZg
posted at 20:15:03
#統計 #Julia言語
簡単な例題である The Seven Scientists の例題を Turing.jl で解いてみました。4種のモデルで推定して、WAICを比較しています。
添付画像は階層ベイズのWAICを数値積分を使って計算しているところ。
nbviewer.jupyter.org/gist/genkuroki...
測定スキルの異なる7人の科学者たち (Turing.jl版) pic.twitter.com/rklj8X6Jaa
posted at 20:10:56
@genkuroki @sekibunnteisuu @metameta007 @sunchanuiguru @kuri_kurita あなたのツイートをトゥギャりました。読んでいただけると幸いです。 togetter.com/li/1478635
タグ:
posted at 19:13:11
#Julia言語 v1.4.0-rc2.0 で Turing.jl を使う方法。
]add Libtask#358fa5637233aab396644b0945252e65630b9a07
build Libtask
add Turing@0.9.0
#49 のコミットまで戻したら、build Libtask に成功した。
github.com/TuringLang/Lib...
タグ: Julia言語
posted at 14:54:46
Masa Yamamoto予測誤差が大き @mshero_y
これ本当に試すべき。いろんなこと確認できる。 twitter.com/genkuroki/stat...
タグ:
posted at 14:22:57
#統計 ベルヌーイ分布モデルでのBIC、自由エネルギー、WBIC
やはりグラフ中で0未満になると真のモデル選択に失敗する。
しかし、n→大で左右のモデル選択失敗領域がどんどん狭くなって行く(確率が0に収束する)。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 14:08:23
#統計 ベルヌーイ分布モデルでのAIC, WAIC, LOOCV
グラフ中でそれらが0未満になると真のモデル選択に失敗する。
x軸はサンプル。サンプルが生じる確率でx軸を非線形にスケールしてある(プロットでがんばった!)。
サンプルが左右に大きく偏るとモデル選択に失敗する。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 14:04:39
#統計 BICではパラメータ数を増やすことの罰則項は O(log n) のオーダー:
BIC = -2×最大対数尤度 + パラメータ数×log n.
一瞬、ぎょっとするかもしれませんが、最大対数尤度の項は O(n) のオーダーなので、O(log n)の罰則項の影響はサンプルサイズ n を大きくすると相対的に小さくなります。 twitter.com/jp011100/statu...
タグ: 統計
posted at 13:37:31
#統計 これは鋭い。
2である必要はないです。
AIC = -1×最大対数尤度 + 1×パラメータ数
としても、AICは単に大小比較で使われるだけなので、モデル選択には影響しません。渡辺澄夫『ベイズ統計の理論と方法』では
AIC = -(1/n)×最大対数尤度 + (1/n)×パラメータ数
となっている。続く twitter.com/jp011100/statu...
タグ: 統計
posted at 13:11:16
巨大な集団中の小さな割合の人数
が
相対的に小さな集団そのものの人数
よりも大きくなることがあるという易しい話なのに、なぜか難しく聞こえるように説明することが行なわれている。
タグ:
posted at 12:56:16
ベイズの定理を使って理解するべきだと思っている人達は、高校数学レベルで「ダメな人達」です。
今回の件で大事なことだと思って「ベイズの定理」について勉強して応用しようとした人達は、伝統的に出回っている「標準的な解説」の被害者。
問題は被害者が被害者を増やす流れになっていること。 twitter.com/genkuroki/stat...
タグ:
posted at 12:45:54
仲間内ではそういう特殊な専門用語を使ってもよいと思うが、そうでない場合には、「その手の用語を使って難しく聞こえるように説明する必然性は皆無であること」を理解しておかないと、陽性的中率の類の話をベイズの定理を使って説明するレベルが低い迷惑な人達を増やすことになってしまう。
タグ:
posted at 12:38:02
iPadで使えるterminalソフトのblink.sh ってのが凄くて、mosh使えるし、なんかやたら応答いいし、日本語もバグらず入力できるし、256色対応なので、MacBookPro持ち歩かなくなった😊
肩こり減った😊 pic.twitter.com/DStCh7TPb4
タグ:
posted at 12:09:38
#Julia言語 解説
a .≤ x で成分ごとに x 以下なら true にそうでないなら false に変換。mean(a .≤ x) で変換後の平均を取ると、true, false を 1, 0 に変換してから平均を取るので、配列 a の成分中で x 以下のものの割合が求まる。
Ref(sample) でブロードキャストから保護される。 pic.twitter.com/YGfoTHMfdn
タグ: Julia言語
posted at 11:52:36
#Julia言語 私もやってみた。
Base.Fix1 とか Base.Fix2 というのもある。
@. は多用している。 twitter.com/negi__/status/... pic.twitter.com/IvVaJ6pQna
タグ: Julia言語
posted at 11:41:29
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
The development version of GR offers UTF-8 and HiDPI support and includes Computer Modern Fonts for accurate plotting in LaTeX quality using #JuliaLang. pic.twitter.com/fbmvhGSADo
タグ: JuliaLang
posted at 01:33:05
Números primos en #julialang : juliamath.github.io/Primes.jl/stab... pic.twitter.com/t14TAsDAi0
タグ: julialang
posted at 01:13:15
非公開
タグ:
posted at xx:xx:xx