黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2020年12月06日(日)
ほりたみゅ (mastodonも見てね) @Hyrodium
>登録前にタグをつけて管理したいとならば、 v0.1.0 での登録を念頭において v0.0.1 から始めるとよい。
にしたがってTagBotにreleaseしてもらおうと試してるけど、上手く動かなくて全然わからない。。
qiita.com/Lirimy/items/0...
タグ:
posted at 22:57:16
Fermat's Library @fermatslibrary
Here's an easy way to measure the acceleration of gravity at home with a yardstick, a bouncy ball and a stopwatch.
h₀ - height of the drop
h₁ - height of the 1st bounce
Tₓ - time for x bounces
c=√(h₁/h₀) pic.twitter.com/EBiZJWYwrS
タグ:
posted at 22:40:06
昨晩、新しい記事を書いてます。「Julia言語で入門するプログラミング(その3)」
muuuminsan.hatenablog.com/entry/2020/12/...
それにしても、今回の解説パート、改めて見直すと『めっちゃ早口で言ってそう』って言われそうだな twitter.com/muuumin20/stat...
タグ:
posted at 20:51:30
#統計 信頼区間を検定で棄却されないモデルのパラメータの範囲と定義しておくことの利点は、棄却されないことは正しいこととは違うと検定の説明で強調されるので「モデルがそもそも正しいのか?」という考え方をし易くなることと、P値と整合的な信頼区間をコンピュータで簡単に実装できることです。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 20:18:04
#統計 そのスタイルであれば、2×2の分割表のFisher検定と対応するオッズ比の信頼区間を計算する函数を #Julia言語 ならそれぞれ実質1行で書けます。
Rのfisher.testが表示するP値と信頼区間には整合性がないです。
nbviewer.jupyter.org/gist/genkuroki... twitter.com/genkuroki/stat... pic.twitter.com/qjUBKRZYSQ
posted at 20:13:49
官公署で働いているという永田霞子さん、教育指導要領ではなく学習指導要領または教育課程ですよ。それから、文科省が現場にぶん投げているとされる裁量権は、第一前線職員が行使しているかどうか疑問です。実際には教科書教材会社や、模試業者、悪くするとニセ科学や極右団体に簒奪されているのでは?
タグ:
posted at 20:00:12
#統計 正規分布モデルから派生するt分布を使って定義された平均の95%信頼区間たちで真の値を含むものの割合が78%程度になってしまう数値的な例を以下のリンク先で紹介しています。
95%だと思っていたものが78%に減るのは怖いでしょう。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 19:49:20
#統計 おそらく大久保祐作・會場健大(2019)の著者たちは、昔から教科書にもある陳腐な「信頼区間警察」ネタを自信を持って披露したのだと思いますが、現実社会において信頼区間がどのように使われているかを考えると、信頼区間のモデル依存性を無視した解説のコピペになっており、論外にひどい。 pic.twitter.com/VrAahSELBO
タグ: 統計
posted at 19:40:59
Masa Yamamoto予測誤差が大き @mshero_y
流石に報道、マスコミにこの視点での検証を期待するのは無茶なので、ほうどう、マスコミを意識しているであろう発表側で詳しいモデルと推定限界について注意書きを記して欲しいところです。まあ、朝の情報番組にとっては関係ないのかもしれませんが、しかし、受け手にとっては重要 twitter.com/genkuroki/stat...
タグ:
posted at 19:38:53
#統計 現実の教科書的解説では、「頻度主義」の信頼区間と「ベイズ主義」の信用区間の定義の(些細な!)違いを強調し易い(もしくは実際に強調している)スタイルになっており、添付画像の赤線部分はその類のコピペになっているので論外に酷いと思いました。
命に関わる! pic.twitter.com/nVyIz4OXAc
タグ: 統計
posted at 19:37:24
#統計 大久保祐作・會場健大(2019)p.244右上より
繰り返し指摘していたことですが、赤線部分の信頼区間の説明も間違っています。
通常「真の値」は現実の母集団分布に関する未知の値のことです。
しかし、「95%信頼区間」の95%はその意味の「真の値」に関する数値ではありません。続く pic.twitter.com/z4S5Sebwhs
タグ: 統計
posted at 19:06:45
非公開
タグ:
posted at xx:xx:xx
これとは別に、政治家など有力者、有識者といった人々がことばをごまかしたり、ことばに関する事実を誤認していたり、意思疎通を拒んだりしている場合、辞書の作り手として意見を言うことは許されると思います。ただし、そこに個人攻撃や嘲笑、罵倒の要素を混ぜてはならないことはもちろんです。
タグ:
posted at 18:53:46
辞書の作り手にも、もちろん個人的な思想信条はあります。でも、辞書は万人に使っていただくものですから、個人の政治的主張を辞書に反映すべきではありません。だいたいの目安としては、左派・右派それぞれの新聞の平均的な読者にも納得してもらえる記述にしたいと思います。
タグ:
posted at 18:53:36
ところで、香港問題について以前述べた時、「辞書編纂者として偏向している」との反応がありました。編纂者の身としては、意見を言う場合、左派・右派のマスコミの論調を参考に、どれとも相反しないぬるいことを呟くにすぎません。3氏への判決については、左右のマスコミが抗議の主張を掲げています。
タグ:
posted at 18:53:28
などと言ったところで、香港問題には1ミリも影響がないけれど、ここでは抗議の意思を示すとともに、世界のリーダーに行動を期待します。ともかく、今後、私はパフェとか食ってる時も、旅行なんかに行ってる時も、香港では日本文化が好きで自由に憧れる若者が囚われていることが念頭を去らないと思う。
タグ:
posted at 18:53:20
香港の黄之鋒氏ら3氏が禁固刑を宣告され、蘋果日報の黎智英氏も拘留された状況を憂慮しています。特に、日本の若者と同じ文化を共有し、正当な主張をした3氏が囚われた事態は衝撃的です。周庭氏は国安法違反での捜査も進行中とのこと(毎日12/3)。これが映画やアニメの出来事でないことが苦しい。
タグ:
posted at 18:53:15
#統計 具体例
図5.2のP値版は、データがn=1560回中k=829回成功というデータのもとでの、帰無仮説が「p≧c」のP値をcの函数としてグラフに描いたものです。
豊田『瀕死本』のベイズ統計版の図5.2がP値によってきれいに再現されています。
P値とベイズ統計はこういう関係。
nbviewer.jupyter.org/gist/genkuroki... twitter.com/genkuroki/stat... pic.twitter.com/tXoUM0QrnD
タグ: 統計
posted at 18:12:11
#統計 ああ、ごめんなさい。以下のリンク先の【「対立仮説」の選択と関係する部分として重要】は杜撰でダメな説明でした。
【「帰無仮説」と「対立仮説」の組み合わせの選択と関係する部分として重要】と書くべきでした。ごめんなさい。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 17:29:34
#統計 馬鹿げた考え方について詳しく説明したくはないのですが、添付画像に3ページ目から引用したlikelihood principleの説明はおかしいです。
少なくとも、L(a), L(b)のそれぞれを、L₁(θ)=p₁(A|θ), L₂(θ)=p₂(B|θ)に置き換えるなどの手直しが必要です。パラメータθは共通でなければ意味がないで。 pic.twitter.com/ZvCeWINnV4
タグ: 統計
posted at 17:12:24
#統計 大久保祐作・會場健大(2019)より
いわゆる「尤度原理」(引用文中では「尤度原則」)についてふれていますが、このような馬鹿げた考え方を初学者相手の解説に書くのはやめた方がよかった。
昔の偉い人達が言っていてもまともであることの証拠にはなりません。 pic.twitter.com/1CfIBn4pwj
タグ: 統計
posted at 16:53:48
#Julia言語 で簡単なグラフを作成した。JIS C1509-1「サウンドレベルメータ」の附属書Eに書かれた周波数重み付け特性。 pic.twitter.com/UnMN41ZSgf
タグ: Julia言語
posted at 16:42:00
非公開
タグ:
posted at xx:xx:xx
富谷(助教);監修 シン仮面ライダー @TomiyaAkio
toml か。Julia の管理に使われてるという程度しか知らんかったけど、良さげ。
ja.wikipedia.org/wiki/TOML
タグ:
posted at 16:02:12
#統計 ②「いま手元にあるデータ、およびさらに極端なデータが得られる確率」における「さらに極端な」の部分が曖昧なので、p値を実際に計算できるようにするためにはその部分を明確にする必要があります。
この部分は「対立仮説」の選択と関係する部分として重要です。続く pic.twitter.com/z9RMDR0hdW
タグ: 統計
posted at 15:30:15
#統計 以上に述べた点は重要で、いわゆる『ASA声明』でも【背後にある仮定を疑う、あるいは反対する】を忘れるとp値の誤用になってしまうことが強調されています。
現実には「p値の計算に使われた確率分布は何ですか?」という質問に即答できたら立派な感じで、多くの人の理解はお寒い状態。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 15:18:04
ごまふあざらし(GomahuAzaras @MathSorcerer
-L オプションだと実現できないことをしたいってことですかね?🧐
JuliaでJuliaのコードをインプットとする qiita.com/cometscome_phy... #Qiita
タグ: Qiita
posted at 15:15:33
#統計 ①まず「帰無仮説H₀が正しいという条件のもとで」の部分がひどく曖昧です。
例えば帰無仮説が「2つのグループの母平均が等しい」であるとき、その帰無仮説とデータだけからP値を計算できるわけではありません。
帰無仮説だけでは確率さえ定義されていない!続く pic.twitter.com/CL0uv3mtcm
タグ: 統計
posted at 15:08:00
#統計 実際には、「帰無仮説H₀が正しいという条件のもとで、いま手元にあるデータ、およびさらに極端なデータが得られる確率」という説明は肝腎な点で曖昧なので、初学者相手に説明する気があるなら、もっとくわしき説明するべきです。続く pic.twitter.com/a5ug8TGSGy
タグ: 統計
posted at 15:04:22
#統計 p値の定義を「帰無仮説のモデル化内でデータの数値以上の偏りが生じるモデル内確率」と正確に要約すること自体、統計学の初学者には非常に難しいことです。
ところが、大久保祐作・會場健大(2019)ではp値の定義を知っていることを前提に誤解する原因を探すという非現実的な方向に行っている。 pic.twitter.com/i6owx5ovb6
タグ: 統計
posted at 14:57:44
#統計 私には、大久保祐作・會場健大(2019)のどこに「pとαの混同に過ぎない」と書いてあるのか?どこにも書かれていませんよね。
統計学の初歩をわかっていない人達はそもそもFisherやNeyman-Pearsonとか言う以前の段階で何も理解していないのが普通で、p値の定義に戻ることさえできない。 twitter.com/ohkubo_yusaku/... pic.twitter.com/bhWUMKuvlV
タグ: 統計
posted at 14:53:40
#統計 【まともに統計学を齧ってない人】向けの解説であれば、p値と有意水準の混同を引用したならすぐに超絶初歩的な誤解であることを指摘しないとだめ。
しかし、非常に不思議なことに【誤って棄却】の「誤って」の部分を強調。「p」と「α」の混同に過ぎないことに気付いていないように見える。 pic.twitter.com/8n13kUB7er
タグ: 統計
posted at 14:45:36
非公開
タグ:
posted at xx:xx:xx
#統計 添付画像は大久保祐作・會場健大(2019) www.researchgate.net/publication/33... より。誰でもダウンロードして読めます。
p値と有意水準(=第一種の過誤が起こる確率)の混同のような初歩的誤りと、検定に関するFisherとNeyman-Pearsonの考え方の違いは別次元の話題なのにこうなっているのだ。 pic.twitter.com/ryKipbE5Nj
タグ: 統計
posted at 14:36:13
#統計 分岐へのリンク
「p」と「α」の混同という低レベルの誤りはすぐに指摘できるのに、大久保祐作・會場健大(2019)ではそのような指摘をせずに、「Fisher vs. Neyman-Pearson」の話を延々としています。
だから、大久保祐作・會場健大(2019)がひどい代物であるという事実はひっくり返らない。 twitter.com/ohkubo_yusaku/... pic.twitter.com/Omsw5PnBnc
タグ: 統計
posted at 14:30:07
富谷(助教);監修 シン仮面ライダー @TomiyaAkio
twitter.com/TomiyaAkio/sta...
手元でJulia をダウンロードし直して、どれくらいで計算始められるかをやってみたら10分かからんかった
タグ:
posted at 14:16:30
#統計 BICの説明中にある【真のモデルである確率】という言い方は単なるトンデモで完全にアウトです。
p値が帰無仮説が正しい確率だと主張するのと同等のデタラメ。
真のモデルである確率とやらがどのように定義されているのやら。
BICに関する解説に続く pic.twitter.com/3NSBP1oebt
タグ: 統計
posted at 14:06:33
#統計 KL情報量と漸近的に逆相関しているAICについて、「これを言い換えた」と説明してしまうのは非常にまずいです。
逆相関しているのです、予測精度が悪い方のモデルを選ぶ確率は結構高い場合があります。しかもそのときには予測分布の予測精度が大きく悪化した側を選ぶことになります。 pic.twitter.com/vo4E3tmjfl
タグ: 統計
posted at 13:59:57
#統計 添付画像は3ページ目より
AICとBICの説明も例によってひどく粗雑です。
WAICやWBICに言及するなら、渡辺澄夫『ベイズ統計の理論と方法』をもっと真面目に読めばいいのに。読んで理解していればこういう粗雑な説明をせずに済んだ。
詳しい説明に続く pic.twitter.com/Z3xxe8JS6s
タグ: 統計
posted at 13:39:59
#統計 添付画像は2ページ目より
(対数)尤度比検定は漸近論を前提にしたp値の構成の話なのだから、漸近同値なWald検定を持ち出して批判しても無意味です。
この部分は「道具」の数学的性質を知らないと馬鹿げた議論を容易にしてしまうことの証拠になっています。 pic.twitter.com/zR17hopDAI
タグ: 統計
posted at 13:36:10
#統計 添付画像は大久保祐作・會場健大(2019)の最初のページより
どうしてこの手の人達は、【数式よりも概念的な説明を重視】と述べて、道具についての手堅い説明をせずに、【「何のための道具であるか」】についていきなり語りたがるのでしょうか?
そういうのを杜撰な議論という。 pic.twitter.com/LRA6duQByE
タグ: 統計
posted at 13:29:30
@genkuroki いやいや本当にいるから書いたんですよ。この論文自体まともに統計学を齧ってない人を相手にした論考ですので、自力で数理統計の専門書や学術書を読める人には不要です。
タグ:
posted at 13:17:31
#統計 統計ソフトを意味もわからず使っていても「p」(p値)と「α」(有意水準≒第一の過誤を犯す確率)は別に表示されるので、混同しないでしょう。
「p値とは何だったのか」というタイトルでこれだとさすがに読む気が失せる。
他にも突っ込みどころが満載。 pic.twitter.com/VFc4ujOJFf
タグ: 統計
posted at 13:13:08
#統計 またひどいのを見つけた。最悪。
www.researchgate.net/publication/33...
p 値とは何だったのか
大久保祐作・會場健大
生物科学 2019
さすがに、統計学をまともにかじった人で、p値を有意水準(=第一種の過誤を犯す確率)だと言う人はいないんじゃないか?
引用文献に本当にそんなことが書いてあるの?続く pic.twitter.com/e9rHlbC3tn
タグ: 統計
posted at 12:49:50
Now: Food, because I accidentally neglected to have a proper dinner yesterday, because I was in the middle of this.
タグ:
posted at 08:48:16
Update: Found my last missing complication, wrote a reproducer and am confident I fully understand the issue now. Reproducer is in github.com/JuliaLang/juli....
タグ:
posted at 08:46:03
Also, I wonder if there's a case to be made for reverting "fixes" that just reduce the incidence of an intermittent error without it being fully understood. Feels like something House, M.D. would do, but there is some truth to it.
タグ:
posted at 07:56:08
Did I write this just to rant about how annoying this bug was? Yes, definitely. And also frustrating, because if rr had been available this would have taken like 30 mins tops. But still, I do think the takeaway is right that issues need to be thoroughly understood.
タグ:
posted at 07:51:13
26/ Otherwise, I risk it being like the first issue I found, where it's possibly a real problem, but could just be reducing the incidence rate of the failure to the point where it's harder to see.
タグ:
posted at 07:49:13
25/ So I'm probably still missing one more factor, but without knowing what they all are, I can't really 100% know that I've fixed it properly.
タグ:
posted at 07:48:19
24/ (1. Type-dependent delayed compilation, causing the unsoundness to only happen on precisely the *second* use of the dictionary and only if the GC interval happens to be close to expiry and 2. the interaction with the critical region code)
タグ:
posted at 07:48:19
23/ The point I wanted to make is that while I found the root cause (unsoundness in WeakKeyDict), almost 20 hours ago, I'm still not done debugging, because I don't fully understand all the interactions yet. I already found two complications I didn't understand before
タグ:
posted at 07:48:18
22/ So I believe I understand this now, but I still can't get a minimal test case to work properly, so I'm probably still missing something, so I'll keep working on it.
タグ:
posted at 07:48:18
21/ This turns out not to matter though, because the GC already thought that the object was dead and the WeakKeyDict unsoundness basically necromanced it, which is very bad.
タグ:
posted at 07:48:18
20/ However, there is a special case for finalizers to be re-run just at the end of a critical region, though by that point the root should have been re-established.
タグ:
posted at 07:48:17
19/ I wake up, look at my notes, try some things and can't get it to work either because the WeakKeyDict unsoundness region is in a (mutex-protected) critical region, so finalizers are inhibited during it.
タグ:
posted at 07:48:17
18/ I want to try this, but at this point my brain is too fried, so I just write it down and try to get some sleep (didn't work very well).
タグ:
posted at 07:48:17
17/ So I decide to go to sleep and fix the WeakKeyDict unsoundness in the morning. Just before I fall asleep though, I realize that the table was empty during the first time, so some of the code paths would have not been hit, so there may be additional compilation the second time pic.twitter.com/7NmCfRLztH
タグ:
posted at 07:48:16
16/ because we're running everything optimized and compilation should have happened the first time we went through this code.
タグ:
posted at 07:48:14
15/ Of course the unsoundness is a general concern and needs to be fixed, since there are things that can cause GC even in code that doesn't allocate (e.g. recompilation of something or running unoptimized), but that doesn't explain the ongoing failures ...
タグ:
posted at 07:48:14
14/ At this point I'm pretty frustrated. It's almost 6am, I've been at this for more than 10 hours and while I have a possible root cause that could explain it, it doesn't quite fit yet.
タグ:
posted at 07:48:13
13/ I do notice that if a GC were to occur in a particular (small) critical region, it would cause unsound behavior from WeakKeyDict, but I still couldn't explain the issue, because after optimization, the region contained no allocations that could trigger GC.
タグ:
posted at 07:48:13
12/ So I start trying to break the WeakKeyDict by hammering the pattern repeatedly to try to see if I can reproduce the problematic behavior.
タグ:
posted at 07:48:13
11/ So I stare some more at the remote reference code and notice that we deliberate corrupt remote references that the GC asserted were no longer referenced. That seemed like a promising lead, but we were using a WeakKeyDict to basically prevent exactly this.
タグ:
posted at 07:48:12
10/ So I poke around some more and dump the network communication (thinking maybe two things are writing to the socket at the same time and corrupting it or something), but that turns out to look just fine (after playing manual deserializer).
タグ:
posted at 07:48:12
9/ The error turns out to be about a corrupted remote reference, which is odd, because we use remote references quite extensively (the entire test suite is built on our Distributed computing support)
タグ:
posted at 07:48:12
8/ This turns out to be useful and I end up seeing an error message that was previously suppressed (separate issue - github.com/JuliaLang/juli...)
タグ:
posted at 07:48:11
7/ So I mess around with that for a few hours, until I get the idea to write an lldb script to trace out all task switches so I have some idea of what's happening.
タグ:
posted at 07:48:11
6/ Unfortunately, any changes (even stupid things like adding additional comments to a file) like to make it go away and a source build on the machine doesn't show the symptoms. Debugging optimized binaries on mac is not fun (lldb is quite fussy and no rr)
タグ:
posted at 07:48:11
5/ Unfortunately, this doesn't fix it. Locally the error rate drops to <10% and coincidentally, we saw the hang on CI too still (though on win32 this time).
タグ:
posted at 07:48:10
4/ and logged into the exact machine said binary failed on. That luckily showed a hang about 30% of the time, so I look at the test and after some poking, find a race condition that would explain a hang (github.com/JuliaLang/juli...)
タグ:
posted at 07:48:10
3/ It tends to happen with some regularity (a few %) on the mac buildbots but not usually elsewhere (though we also saw a few win32 failures with similar issues), so I went and grabbed the exact binary that was failing (another learning - save binaries you ran on CI) ...
タグ:
posted at 07:48:10
2/ It's super useful, but can also be very frustrating. For example, I've been debugging an intermittent hang on CI (github.com/JuliaLang/juli...) for the better part of the past 24 hours.
タグ:
posted at 07:48:09
1/ Something I've learned over the years of #julialang development is to not stop debugging I have verified that I indeed got the root cause exactly right and can explain all observed behavior. Otherwise you just risk making an already hard bug harder to see without fixing it.
タグ: julialang
posted at 07:48:09
@vin_tea01 #Julia言語 括弧が必要です。
Juliaのパースの仕方は :( ) で囲むと分かります。
gist.github.com/genkuroki/c3b0... pic.twitter.com/BkxxCRqIqg
タグ: Julia言語
posted at 05:45:43
「Julia言語で入門するプログラミング」第3回を書きました。構造体も出てきてだんだん本格的になってきました。
はてなブログに投稿しました #はてなブログ #Julia言語
Julia言語で入門するプログラミング(その3) - SE教育パパむううみんのブログ
muuuminsan.hatenablog.com/entry/2020/12/...
posted at 02:15:41
低ランクの確率行列で近似することを確率行列分解(SMF)というみたいですね。
観測データから得た行列を確率行列分解することでLDAモデルを求められるのかな?
タグ:
posted at 02:08:51
その後、「SNSでアップされている画像も、授業の様子が分からない。もしかしたらAだったのかもしれない」「Aじゃない保証はない」「Aなんだろ」というようにして、
結局、Aという条件が成り立っているから✖にするのも当然、とか言い出す。
タグ:
posted at 01:55:10
大抵はこういうプロセスを踏む。
「バツには反対だ。しかし、Aという前提なら✖も理解できる」という、「Aが成り立っていないならバツに反対」という条件付き「バツに反対」に後退する。
タグ:
posted at 01:54:01
非公開
タグ:
posted at xx:xx:xx
あるある先生、完全に順序論者の側だったんだな。
ツンデレ先生、別件で何かあったみたいだけど、詳細は知らないのでそれはスルーする。
ツンデレ先生、掛け算順序でバツを付けることには反対だと言っていたが、実は賛成していることが判明した。
タグ:
posted at 01:47:06
プログラム言語Juliaの時代キタ━(゚∀゚)━! そのうちPythonも食われそう C++はもうダメだ
is.gd/dIw6tZ
1: 名無しさん@涙目です。(禿) [MX] 2019/02/24(日) 23:03:30.40 ID:wibnRdxn0 BE:155743237-PLT(12000)
... pic.twitter.com/WKTXS3eLuN
タグ:
posted at 01:41:31
Standing with Dr. Timnit Gebru — #ISupportTimnit #BelieveBlackWomen
googlewalkout.medium.com/standing-with-...
1400人を越えるGoogleスタッフと1900人の他の支援者が抗議の手紙に署名を行っている。
タグ: BelieveBlackWomen ISupportTimnit
posted at 01:06:46
@nhayashi1994 なるほど。ありがとうございます。
あと、例えばDNNモデル軽量化の為にパラメータ行列Wを低ランク近似する時って、EUCよりKLの意味で近似する方が妥当だったりしませんか?
パラメータ空間の距離はL2でなく、FIMなので、KLで近似する方が自然なのかな…などと思いました。
タグ:
posted at 00:40:48
標準的な家庭で、国立大学に通うのに、奨学金をもらうのが普通になるとよくないと思う。給付でないものも奨学金と呼ぶことの問題もあるが、大半の人が社会に出たときに、まず借金を返すことから始めなければならないとなるのはどうなんだろうか。
タグ:
posted at 00:38:39
#統計 WAICの優秀さの証拠の1つ
添付画像はベルヌイ分布モデルで「表の出る確率」をwとしたときの、汎化誤差(2つのGE)と情報量規準(AIC, WAIC, LOOCV)の期待値のサンプルサイズnでのプロットです。
すべてが一致してほしいのですが、nが小さいときAICだけ外れている。
nbviewer.jupyter.org/gist/genkuroki... pic.twitter.com/te6tUamHv6
タグ: 統計
posted at 00:38:04
@physics303 レコメンドのほうはちょっとわからないんですが、地点=ユーザの訪問回数行列みたいなものだと、行列の要素がかなり大きくなるのでKL-NMFの方がいいと聞いたことがあります
タグ:
posted at 00:24:48
@nhayashi1994 ありがとうございます!!
まだちょっとピンと来てないのですが、
1.行列の値が大きい時
2.過小推定されるのが嫌(過大推定の方が良い)
場合はEUC-NMFより、KL-NMFの方が適切という事ですよね…?
2を考えると、レコメンド機能を作る時とかは、KL-NMFの方が良いのかなと思いました。
タグ:
posted at 00:21:01