黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2022年06月24日(金)
対数尤度函数の-1倍よりも一般的な損失函数
f(y_1,…,y_n|x_1,…,x_n,a,b,…)
の場合であっても、もしも、
p(y_1,…,y_n|x_1,…,x_n,a,b,…)
= exp(-f(y_1,…,y_n|x_1,…,x_n,a,b,…))/Z(a,b,c,…)
の形で確率密度函数を作れれば、
log Z(a,b,c,…)
で正則化された最尤法の拡張に帰着する。
タグ:
posted at 00:00:56
だから、いきなり一般的な損失函数の話にせずに、尤度函数の最大化について丁寧に説明しておいた方がよいと思う。
尤度の単純な最大化だとパラメータを増やしたときのオーバーフィッティングに対処できないという事実が重要になってからでも、一般の損失函数の話をするのは遅くないと思う。
タグ:
posted at 00:03:38
尤度函数の形が場合によっては複雑になることを、具体例を通して知るようになれば、「これ、一体、どーすんの?」と誰だって考えると思う。
そこまでたどり着けば、特異モデルのベイズ統計の話をできて、ベイズ統計の優秀さに、主義に基く非科学的な統計学を経由せずに触れることができる。
タグ:
posted at 00:06:29
#プログラミング勉強中
#programming
#中心極限定理 の #実験
#experiment of
#centrallimittheorem
#julia #julialang #julia言語
#jupyternotebook
#macos #monterey
#macmini #macminim1 pic.twitter.com/nmwvLwRRD2
タグ: centrallimittheorem experiment julia julialang julia言語 jupyternotebook macmini macminim1 macos monterey programming プログラミング勉強中 中心極限定理 実験
posted at 00:17:15
Clojure、julia、Delphi触っておこ。そしたら言語だいたいコンプ。余裕あったらSolidityもかな(名前しかしらん)
他はとりあえずいいかな。明日じっくり見て考えよ
タグ:
posted at 02:43:42
#統計 logistic回帰は確率パラメータ p がlogistic変換で p = logistic(a + bx) とxごとに決まっているという設定のモデルです。
そこでロジスティック変換を使う必然性はあるか?
ありません。
無数にある選択肢の中から1つのモデル化の仕方を選んだだけです。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 06:43:07
疫学の教科書を見ると、yだけではなく、xも1または0の値しか取らない場合に、オッズ比、リスク比、リスク差を推定する方法が載っており、それぞれ、logistic(a+bx), exp(a+bx), a+bx の場合のbの推定に相当しています。
新型コロナウイルスの時代ではこういう疫学の知識も普及させた方がよいと思う。
タグ:
posted at 06:57:29
以下のリンク先では、まずxがない場合(もしくはパラメータpがxによらない定数の場合)を「モデル0」として解説し、その後で、確率パラメータpがp=logistic(a+bx)と書けている場合の最尤法をロジスティック回帰(←これも必須ではない単なるジャーゴン)と呼ぶことを説明しています。続く twitter.com/genkuroki/stat...
タグ:
posted at 07:07:09
最小二乗法による線形回帰も完全に同様の説明の仕方をできます。
「モデル0」として、平均パラメータμと分散パラメータσ²を持つ正規分布の標本分布モデルを採用。
そのとき、平均パラメータがμ=a+bxとxに依存するようにモデルを拡張して、最尤法でパラメータa,b,σ²を推定すると線形回帰になる。
タグ:
posted at 07:11:14
こういう決まり切ったパターンになっています。
部品になるBernoulli分布や正規分布とロジスティック変換のような一応非自明なパラメーター付けの仕方などに関する数学的知識が増えれば、自分で幾らでも複雑なモデルを考えることができる。
この「自分で」の部分が非常に重要。
タグ:
posted at 07:15:37
有名なジャーゴン化してしまった○○モデルや○○回帰のような名前を暗記するような勉強になるのは最悪。
そうならないようにするためには、ジャーゴンを乱舞させるあのような解説を高校生相手にするべきではないです。
「この程度のことは自分で思い付くよ」と言える方向に誘導する様にするべき。
タグ:
posted at 07:18:56
例えば、0 < p < 1 の範囲しか動けないパラメータ p についてMCMC法を適用したいときに、ランダムウォークで両端をはみ出すことを気にしなくてよいようにするには、ロジスティック変換で -∞<x<∞ にパラメータを変換すればよい。
タグ:
posted at 08:08:35
ロジスティック変換についてロジスティック回帰の文脈に過学習してしまうと、ロジスティック変換のロジスティック回帰以外の応用を素直に思い付けない状態になる。
現実の高等教育でもそういうまずい教え方をされている可能性が高いです。そういう教育は潜在能力を潰すことに役に立ってしまう。
タグ:
posted at 08:11:20
ごまふあざらし(GomahuAzaras @MathSorcerer
@genkuroki キューンwww(タイポ気づきませんでした.ありがとうございます)
タグ:
posted at 09:10:14
私の手書きの解説にも書いてあるように、尤度はもっともらしさの指標では__ない__です。この点は多くの教科書が間違っています。
英単語のlikelihoodの通常の意味で尤度を解釈しようとする人達は誤解しているということになります。
「尤度」と意味不明に訳されたことは幸運だった可能性さえある。 twitter.com/nogutetu/statu...
タグ:
posted at 09:21:09
Julia REPL stan now @miguelraz_
@genkuroki whoaaaah do you have code to make the logo?
Looks super cool!
タグ:
posted at 09:22:12
#統計 尤度については誤解に至る道が舗装されまくっていて、多くの人が流れ作業のように誤解しまくっています。
尤度については、余計なことを考えずに定義に戻って考えるようにし、漢字や英単語の意味は完全に無視した方がよいです。 twitter.com/genkuroki/stat... pic.twitter.com/ZgyZxU21tm
タグ: 統計
posted at 09:25:52
#統計 P値に関するASA声明 www.biometrics.gr.jp/news/all/ASA.pdf にも、
【P 値はデータと特定の統計モデル(訳注: 仮説も統計モデルの要素のひとつ)が矛 盾する程度をしめす指標のひとつである】
と書いてあります。
統計モデルに触れないP値の解釈はASA声明的には明瞭にアウト! pic.twitter.com/kp8ff9TpMj
タグ: 統計
posted at 10:15:16
#統計
Steven Goodman
A Dirty Dozen: Twelve P-Value Misconceptions
2008
www.ohri.ca//newsroom/semi...
これは読む価値のある論文です。しかし、帰無仮説が仮定されるのは現実についてではなく、統計モデルであるという点を避ける基本概念の定義を前提にしており、ASA声明的にはまずいと思います。
タグ: 統計
posted at 10:29:37
ああいうノータイムで「これはひどい」と分かる解説を高校生相手にできてしまう理由は、高等教育においても普段からああいうスタイルで説明されて来てかつ説明しているからです。
「きはじ」を習った人たちが「きはじ」で教えようとするのと似たような問題だと思って構わないと思います。 twitter.com/tsatie/status/...
タグ:
posted at 10:40:33
#統計 xの値ごとにyの値が1または0になる確率が違っているとき、xの値からその確率がどのように決まっているかについて、モデルを使って推定してみよう、というシンプルな話に過ぎません。
「ロジスティック回帰」「交差エントロピー」のようなジャーゴンは理解にとってはノイズになる。 twitter.com/tsatie/status/...
タグ: 統計
posted at 10:46:44
電子版出ます、ご安心ください! 紙面レイアウトを維持するためいわゆる「フィックス型」で制作しており、おそらく配信は早いと思います! 講談社BOOK倶楽部書誌情報ページに追加されますので、お手すきの際に注視をお願いしますm(__)m bookclub.kodansha.co.jp/product?item=0... twitter.com/Dolphin7473/st...
タグ:
posted at 11:19:08
以下のリンク先の添付画像のような解説に、「こんなにレベルの高いことを教えるようになったんだ!」のような反応があること自体が大問題だと思ったので、こんなスレッドができてしまった。
しかし、「これはひどい!」というニュアンスの反応も結構多い点はほっとする。 twitter.com/awellbottom/st...
タグ:
posted at 12:39:22
[www.itmedia.co.jp]世界中のIT技術者から愛されているプログラミング言語 3位は「Clojure」、2位は「Elixir」 1位は? Stack Overflow調べ bit.ly/3xOVquo
タグ:
posted at 13:00:03
Mark Kittisopikul ht @markkitti
@miguelraz_ The real package is github.com/mkitti/ArrayAl...
タグ:
posted at 13:28:39
Mark Kittisopikul ht @markkitti
@miguelraz_ My initial inspiration for this package was that numpy.zeros looks faster than #JuliaLang's zeros: pic.twitter.com/PQzu8AKZcH
タグ: JuliaLang
posted at 13:35:49
Mark Kittisopikul ht @markkitti
@miguelraz_ I decided that we should be able have "fast" zeros in #JuliaLang as well. pic.twitter.com/ESYICOS55c
タグ: JuliaLang
posted at 13:39:59
Mark Kittisopikul ht @markkitti
@miguelraz_ Eventually, I just implemented a direct zeros replacement. Here's a head-to-head comparison of ArrayAllocators.zeros (microseconds) versus Base.zeros (seconds). pic.twitter.com/KuYA3olKGo
タグ:
posted at 13:45:10
オンライン数学問題集(YUKI) @suugaku_monndai
これはひどすぎて笑えない💧 twitter.com/nekonyannyan82...
タグ:
posted at 14:31:03
#統計 1次元のシンプルなロジスティック回帰は数行で書ける。
#Julia言語
↓
github.com/genkuroki/publ...
「ロジスティックモデルはベルヌイ分布のパラメータをロジスティック変換したもので云々」をコードに直訳するだけ。 pic.twitter.com/XoCjbtIVvc
posted at 14:34:17
#統計
ロジスティック回帰のありがちな視覚化と尤度函数のヒートマップ。
ロジスティック回帰の実装よりも、プロットのためのコードの方が長い。
github.com/genkuroki/publ... pic.twitter.com/OmH6Nal8lr
タグ: 統計
posted at 14:35:58
#統計 2次元のロジスティック回帰のありがちな視覚化。
データが運悪く偏って推定結果が真の値からずれてしまっている場合をわざと選んだ。
github.com/genkuroki/publ... pic.twitter.com/2wH0FvsXwT
タグ: 統計
posted at 14:38:24
昔のXPのパソコンでも軽量Linuxとかで現在も使うことは可能だけど、それには知識と技術が必要。金か技術のどちらかが必要で、技術がない人は金を出すしかない
タグ:
posted at 14:45:20
「貧乏でも豊かに」というのもこれと同じかもなあ。知識と技術があればお金が足りなくてもなんとかできるかもしれないが、知識とお金の両方ない場合はどうしようもない
タグ:
posted at 14:46:56
#統計 これはロジスティック回帰の尤度函数のヒートマップ。
尤度函数の形を色々見たことがある経験は大事なので、パラメータ数が2以下のモデルに出会ったら必ず尤度函数を視覚化してみるべき。 twitter.com/genkuroki/stat... pic.twitter.com/y86HtXEqf7
タグ: 統計
posted at 14:58:00
#統計 以上で算出した数値は、その場で #Julia言語 のコードを書いて求めました。その様子を
github.com/genkuroki/publ...
で公開しておきました。
posted at 21:44:31
#統計 最尤法がうまく行くことを保障するための条件は結構厳しくて、忠実に最尤法を使ってしまうと破綻する統計モデルは容易に作れます。
破綻する場合の尤度函数の視覚化
↓
github.com/genkuroki/publ...
タグ: 統計
posted at 22:03:46
#統計 例えば、標準正規分布とパラメータμ,σを持つ正規分布を1対1で混合した2つ山の混合正規分布モデルでは、最尤法の忠実な適用は数楽的に破綻します。
添付画像はそのモデルの対数尤度函数のひーとまっぷです。続く
github.com/genkuroki/publ... pic.twitter.com/cHZo1tWAGp
タグ: 統計
posted at 22:06:56
#統計 添付画像のヒートマップはサイズn=10のサンプルx_1,…,x_nの対数尤度函数のグラフです。
μ = x_iのとき、log σ → ∞ でこの対数尤度函数は∞に単調に発散します。
この場合には最尤法を忠実に適用すると数楽的に破綻します。
github.com/genkuroki/publ... pic.twitter.com/4lEOQjQLMR
タグ: 統計
posted at 22:10:53
ヤフー・ニュースにも転載されているのを教えてもらいました──日本が抱える色覚の課題 宇宙飛行士にも〝多様性〟の確保を(Wedge)
#Yahooニュース
news.yahoo.co.jp/articles/ed1fd...
タグ: Yahooニュース
posted at 22:14:33
#統計 しかし、ローカルマキシマムを採用すれば、このモデルでもまともな推定は可能です。
テストデータはパラメータ(μ, σ)=(4, 1.5)で生成したのですが、ローカルマキシマムを与えるパラメータ値は (3.9, 2.2) なので結構うまくいっています。
添付画像③はその周辺での尤度函数の様子。 pic.twitter.com/EaLhE8rUVa
タグ: 統計
posted at 22:15:50
#統計 訂正:この対数尤度函数が∞に発散するのは、
❌μ = x_i で log σ → ∞
ではなく、
❌μ = x_i で log σ → -∞
です。負号を入力し忘れた。
この場合には、log σ が小さくなり過ぎないように、パラメータの動きを制限しないと最尤法は数学的に破綻します。 pic.twitter.com/GmIbLzhzed
タグ: 統計
posted at 22:20:39
#統計 いつも「プロットできる尤度函数はすべてプロットした方がよい」と言っているのですが、以下のプロットを私が初めてしたのは数日前です。
このプロットをして来なかったことをひどく後悔しました。
見た目が非常に面白いと思います。
github.com/genkuroki/publ... pic.twitter.com/6qPcfF0DTw
タグ: 統計
posted at 22:37:14
@genkuroki 混合モデルで試行してみました。たしかに収束の様子が違いますね。
ご指導、ありがとうございました。 pic.twitter.com/wSGcxigFSl
タグ:
posted at 22:47:25
Julia For Data Scien @JuliaForDataSci
📢 New Post! It's been a while! Let's learn about developing a package that uses artifacts! www.juliafordatascience.com/artifacts/
タグ:
posted at 22:48:30
Artifacts in #Julialang were a mystery to me until only recently. Want to ditch your deps/build.jl scripts for a more robust artifact system? Here's a high level overview to get you up and running! twitter.com/JuliaForDataSc...
タグ: Julialang
posted at 22:51:36
@yasudaidai 中心極限定理の証明を見ればすぐに分かることですが(cumulant母函数を見るようにする)、歪度(skewness E[((X-μ)/σ)³])の絶対値が大きな分布では、中心極限定理の収束は遅くなる。
左右対称な分布と非対称な分布で中心極限定理の収束の速さが全然違うことの確認をしておくと役に立つ知識になります。
タグ:
posted at 23:52:32
#統計 前にも書きましたが、中心極限定理の例として一様分布を出すことは、中心極限定理が余りにもうまく行く例外的な場合なので、ミスリーディングになりやすいと思います。
教科書では中心極限定理の収束が遅い場合もきちんと扱わないとまずいと思う。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 23:58:38