Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
Favolog ホーム » @genkuroki » 2020年02月13日
並び順 : 新→古 | 古→新

2020年02月13日(木)

黒木玄 Gen Kuroki @genkuroki

20年2月13日

自分で言うのがなんですが、私が仮に玄人だったら、多数の別スレでここまで面白い雑談に発展することはなかったと思う。😁

タグ:

posted at 23:59:00

某ことり @ktrmnm

20年2月13日

@genkuroki ニュアンスがあります(ただし、この単語の使い方自体が論文の主題であることはないので、あくまでニュアンスの上での話になってしまいます)。知人の統計学者と英語で話しているときも、「いい結果ですね」「いや、もっとfrequentistな保証をつけたいんだよね」、というような会話になることがあります

タグ:

posted at 23:57:00

某ことり @ktrmnm

20年2月13日

@genkuroki なるほど。私は、職業柄Annals of StatisticsやJournal of the Royal Statistical Society (B) といった論文を参照することが多いです(この選択自体はバイアスがあると思います)。特に前者に顕著ですが、frequentistといった場合は「真の分布を固定したもとで何らかの理論保証をつける」という (続)

タグ:

posted at 23:53:44

黒木玄 Gen Kuroki @genkuroki

20年2月13日

私は統計学は完全など素人なので数理統計の論文誌には普段全く目を通していません。

機械学習についてもど素人。

ガチでど素人です。 twitter.com/ktrmnm/status/...

タグ:

posted at 23:51:07

Tarotan @BluesNoNo

20年2月13日

(5/5) distribution of θ given by (1) tends to a calculable limit, independent of the a priori distribution."などと書かれています.

注:このアカウントでのツイートの全責任は,私個人だけにあります.

タグ:

posted at 23:48:38

Tarotan @BluesNoNo

20年2月13日

(4/5) Bernsteinのほうは文献名は挙げられていません.

同論文での定理説明は言葉だけで,"Both results give a theorem to the general effect that, if the a priori probability density of θ is continuous then, as the number of independent observations is increased, the a posteriori

タグ:

posted at 23:48:38

Tarotan @BluesNoNo

20年2月13日

(3/5) ことが述べられています(伝記の該当箇所が,おそらくNeyman(1962)に基づいて書かれている).

"I do not know when Bernstein published his result, but I learned it in Bernstein's lectures in 1915 or 1916. The result of von Mises was published in 1914[4]."と述べられており,

タグ:

posted at 23:48:38

Tarotan @BluesNoNo

20年2月13日

(2/5) Neymanは,Bernsteinの確率論の講義を受け,そこでBernstein-von Misesの定理を学んだとのことです.

jstorで検索した限り,"Bernstein-von Mises theorem"の初出は,Neyman(1962)"Two Breakthroughs in the Theory of Statistical Decision Making"(未読)でした.
同論文でも伝記と同じ

タグ:

posted at 23:48:37

Tarotan @BluesNoNo

20年2月13日

(1/5) RT言及> まったくもって無駄な緩い話なのですが&Bernstein-von Misesの定理【も】まったく理解できていませんが,

Reidによるインタビュー形式の伝記"Neyman" pp.23-24(日本語訳『数理統計学者ネイマンの生涯』もありますが少しきついかもしれません)によると,1915~1916年ぐらいに

タグ:

posted at 23:48:37

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 メモ

どういう話になっているのか分かりませんが、私が既存の統計学入門への批判で繰り返し述べて来た「検定や信頼区間の解説で数学的モデルを使っていることの説明が不十分なせいで、モデルと現実の区別が曖昧になり過ぎている」という指摘に通じるものがあると思ったのでメモっておきます。 twitter.com/not_identified...

タグ: 統計

posted at 23:36:55

某ことり @ktrmnm

20年2月13日

@genkuroki そうですか、躍起になられている感じかと思ったんですが、勘違いだったならすみません。ところで、黒木さんに対する個人的な質問ですが、いわゆる数理統計の論文誌はどのようなものを読まれていますか? もしかすると、日常的に読んでいる文化圏によって言葉の感覚に違和感があるかもしれないですね

タグ:

posted at 23:30:29

黒木玄 Gen Kuroki @genkuroki

20年2月13日

一般論: 誰もが認める標準的な専門書から引用できるなら、1個の引用でもかなりの説得力がありますよね。

私は、学部生向けの統計学入門について批判的な発言をするときには、読者が多い標準的教科書だと思われる東京大学教養学部統計学教室編『統計学入門』を引用することが多いです。

タグ:

posted at 23:23:16

黒木玄 Gen Kuroki @genkuroki

20年2月13日

根拠に関する情報を1つも示さずに、喧嘩腰だと決め付ける態度にも問題があると思いました。

しかし、当該ツイートが有益な情報の可能性もあるので約束通り、RTしておきました。

ただし、ある分野で普通だとされる考え方の引用に手間取るのは不思議なことだとも思いました。

twitter.com/ktrmnm/status/...

タグ:

posted at 23:18:38

某ことり @ktrmnm

20年2月13日

@genkuroki 特に拡散不要ですが、例えばこちらの論文に用例が見つかります projecteuclid.org/euclid.aos/133...
例を収集するのはさすがに大変なのでしませんが、ご興味があれば引用を辿っていくと見つかると思います。根拠を求めるのはとても良い態度とは思いますが、執拗に求めるのはコミュニケーションとしてどうなのか。

タグ:

posted at 23:12:33

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 喧嘩腰になってはいないです。

すでに述べたように、根拠情報皆無なのは全然駄目だと思いますが(←これを喧嘩腰扱いしてはいけないと思う)、根拠情報であれば拡散にお手伝いできます。 twitter.com/ktrmnm/status/...

タグ: 統計

posted at 23:07:46

田中紀子 Noriko Tanaka @kura_sara

20年2月13日

メディアの皆さん「薬物を一度やった人は止められない」という一般人の街録を報道することを止めて下さい。
自助グループに繋がり、止め続けている人が世界中に沢山います。
偏見が助長されます。報道のガイドラインを読んでください。

izon-hodo.net

タグ:

posted at 23:06:21

Yuki Nagai @cometscome_phys

20年2月13日

[“apple”,”banana”]だったのが[“apple” “banana”]になってる

タグ:

posted at 22:57:38

堀畑 和弘 @kazzhori

20年2月13日

measure theory - About Egorov's therorem for continuous sequences - Mathematics Stack Exchange ←これは知らなかったですw math.stackexchange.com/questions/6088...

タグ:

posted at 22:54:48

Yuki Nagai @cometscome_phys

20年2月13日

JuliaのPlotsのGRのlabelの仕様が微妙に変わってる?いつのまに。

タグ:

posted at 22:54:09

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 根拠に当たる情報を一切示さずに終えてよい話題ならばそれでもよいと思いますが、私なんかと無関係に広めた方がよい話題だとお考えなら、根拠に当たる情報も示した方が良いと思いました。

情報拡散ならRTでお手伝いできます。 twitter.com/ktrmnm/status/...

タグ: 統計

posted at 22:50:47

ごまふあざらし(GomahuAzaras @MathSorcerer

20年2月13日

というのはすでにQiitaで書いたし,ドキュメントも読めばできるできゅ!!!

タグ:

posted at 22:49:06

ごまふあざらし(GomahuAzaras @MathSorcerer

20年2月13日

- Python -> requirements.txt を置いておく
- Julia -> Project.toml をおいておく
- こまかいことをしたければ IDが1000の一般ユーザーを追加した Dockerfileを作っておく

かな? mybinder.org にアクセスして自分のリポジトリのURL,ブランチを指定しておけばあとはOK

タグ:

posted at 22:46:53

l_ppp @ppp3141592ppp

20年2月13日

古いPC使ってるけど
Binder環境(左)の方が、ローカル(右)より強かった。 twitter.com/MathSorcerer/s... pic.twitter.com/jY1IZrncBy

タグ:

posted at 22:46:52

某ことり @ktrmnm

20年2月13日

@genkuroki うーん、じゃあ、信用していただかなくて大丈夫だと思います。もともと定義して使うような言葉ではありませんが、数理統計の論文誌に論文を投稿するときに、そのような意味で単語を使ったとしても解釈に齟齬が生じないという程度の意味です。

タグ:

posted at 22:45:51

ごまふあざらし(GomahuAzaras @MathSorcerer

20年2月13日

リポジトリに ipynb をでーんって置いておくより, Binderで閲覧できるような環境を作っておいて
.py か .jl をクリックしたら jupytext によってノートブック形式に変換するというスタイルの方が開発側もリポジトリを見る人からの体験良い気がする.

タグ:

posted at 22:41:03

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 続き。「現在の統計分野」という範囲は曖昧で広すぎる可能性もあり、私はこのような言い方をされても信用しないし、みんなこの時点で信用するべきではないと思う。

具体的に、誰がどのようにそれらの言葉を使っているかを引用し、引用の総体で主張を正当化してくれるまで、私は信用しない。

タグ: 統計

posted at 22:38:53

Ryo @pys_ryo2019

20年2月13日

というか、ユーザーが知りたいのは歴史じゃないよね。

タグ:

posted at 22:27:31

Ryo @pys_ryo2019

20年2月13日

心理学ではヴント習うけど、あくまで心理学の成立過程を知るためだしなぁ 。というか、ヴントが具体的にどんな研究をしたのかって知らないことに気づいた。ワトソンもアルバート坊やの逸話しか知らない。フェヒナーは今でも通用する実験手続きを提案したから、歴史的な価値だけには留まらないよね。

タグ:

posted at 22:26:31

某ことり @ktrmnm

20年2月13日

@genkuroki ちなみに元ツイートの趣旨については、BvM定理というのはfrequentist guarantee for Bayesian methodsというような位置付けなので、これがどういう主張なのか理解することが現在の統計分野でfrequentistやBayesianという言葉がどのように使われているかを知る良い機会になるという気持ちです。

タグ:

posted at 22:22:05

Ryo @pys_ryo2019

20年2月13日

これは「ベイズ統計と頻度論という対立図式は歴史的にはあったのだから、それを無視するのはよくない」という主張だが、つまり燃焼の化学を学ぶにはフロギストン説から始めた方がいいし、重力を学ぶにはアリストテレスから読んだ方がいいということにはならないのか

タグ:

posted at 22:21:05

matheca @paulerdosh

20年2月13日

ハイエナみたいに大学に群がる教育何ちゃら企業たちは、何でこういい加減で品がないのだらけなんだ💢

タグ:

posted at 22:16:11

Ryo @pys_ryo2019

20年2月13日

関係ないけど、アンパンマンの作者やなせたかしは、戦時中は暗号の解読・作成に携わっていて、戦後は詩人としても名を馳せた傑出した人物である。

タグ:

posted at 22:16:09

Ryo @pys_ryo2019

20年2月13日

無教養なアンパンマンとしては、リベラルアーツというのは、こういう説明を疑えるような知性を育む教養であってほしいと思った。
liberal-arts-guide.com/bayesian-stati...

タグ:

posted at 22:16:09

某ことり @ktrmnm

20年2月13日

@genkuroki どの結果を指すかわかりませんが「より優れた」というのは語弊があると思います。Bernstein von Mises theoremというのは特定の定理ではなくてある種の主張の総称を指す印象です。また、正則パラメトリックモデルの結果を拡張する方向性はそれを特異モデルにするというだけではありません。

タグ:

posted at 22:14:13

TaKu @takusansu

20年2月13日

#超算数 「ファン・ヒーレの最初の水準で、正方形は長方形と見做せないとする文献」という題名で掲示板に書き込みました。
8254.teacup.com/kakezannojunjo...

タグ: 超算数

posted at 22:03:35

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 未知の確率法則について確率モデルを使って推定・推測・推論する話と、統計学入門における点推定・区間推定・仮説検定の話が全然違う話に見えてしまいがちなのは、後者でも確率モデル(特に正規分布モデルを)使用しているのにモデルの妥当性の問題に一切触れないからだと思います。

タグ: 統計

posted at 21:59:52

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 実は、確率モデルは、大学学部生向けの統計学入門の仮説検定や信頼区間にも出て来ています。「正規分布を仮定する」と書いてある項目では、もろに正規分布モデルを使用していることになる。

で、正規分布モデルを使った仮説検定や信頼区間計算をやっても、正規分布モデルの妥当性は不明のまま。

タグ: 統計

posted at 21:55:55

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 しかし、現実にはそのような都合のよい巨大データは得られないし、採用した確率モデルが妥当かどうかも実際にそれを使って統計分析してみるまで分からないし、使った後も分からないかもしれない。

しかし、それでも普遍的な数学的法則があって、何とか困難な問題に切り込んでいける場合がある。

タグ: 統計

posted at 21:47:28

(「・ω・)「ガオー @bicycle1885

20年2月13日

Juliaに詳しい人がすごく近くにいつもいるので助かる。

タグ:

posted at 21:46:19

(「・ω・)「ガオー @bicycle1885

20年2月13日

やっぱJuliaが最強なんやな。

タグ:

posted at 21:44:39

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 データサイズが十分に巨大で、データを生成した未知の確率分布の様子がデータだけからよく分かるはずならば、

確率モデルがデータを生成する確率の最大化

によって確率モデルをデータに適合させれば、確率モデルはデータを生成した未知の確率分布をよく近似するようになると期待できます。

タグ: 統計

posted at 21:44:32

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 数学がらみの分野では、概念の呼び名が歴史的な不幸によって決まってしまっていることが多いので、likelihoodのような専門用語に日常用語的な意味を一切付与することなく、数学的定義の意味で素直に解釈する習慣をつけないと10年オーダーで時間を無駄にすることになります。

タグ: 統計

posted at 21:40:06

(「・ω・)「ガオー @bicycle1885

20年2月13日

何もしてないのにR環境壊れた

タグ:

posted at 21:37:34

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計

尤度=確率モデルが偶然にデータを生成する確率(密度)

なので、尤度最大化は

確率モデルがデータを生成する確率の最大化

に過ぎず、それ以上の意味を持ちません。

定義に戻ればこの意味しか持たないのに、「もっともらしさ」というような余計な考え方をするからダメになる。

タグ: 統計

posted at 21:35:52

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 分かっている人たちは、渡辺澄夫『ベイズ統計の理論と方法』にあるより優れた結果を前提に自分の意見を述べているので、そういう話は話題になりにくいと思います。

あと現実にはサンプルサイズnは有限で、与えられたサンプルでは事後分布の違いによって推定精度に結構差がつく場合があります。 twitter.com/ktrmnm/status/...

タグ: 統計

posted at 21:22:53

Dr. nhayashi @nhayashi1994

20年2月13日

@genkuroki @stattan ヒストリア……!

タグ:

posted at 21:08:39

黒木玄 Gen Kuroki @genkuroki

20年2月13日

@stattan @nhayashi1994 私の家庭内でもKalafina曲がよく流れています。たとえば

www.youtube.com/watch?v=3YnDHY...

タグ:

posted at 20:56:53

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 私が、Waldの定理を一枚の絵にし、「主観的確率」という言葉を使って説明しているシーン。

これはこれで、「主観的確率」を内包するモデル内部でどのように普遍的なことが数学的に起こっているかを示す意味のある結果。

しかし、これを使っても現実とモデルの関係は原理的に分からない。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 20:50:53

the hash @yosuke_hash

20年2月13日

師匠には、お礼に渡辺ベイズ本を渡して「後で数学部分を教えてください」と頼んでおいた。さっそく4~5時間ぶっ通しで読んでいた。とても難しいが面白いとのこと。

タグ:

posted at 20:46:50

verbatim @infoseeker18

20年2月13日

深谷賢治先生と自分の指導教官が廊下で立ち話をしているのを聞いたことがあるんだけど、深谷先生が早口すぎてほとんど何を言っているかわからなかった記憶がある。指導教官に「さっきの話は何だったんですか」と訊いたら、「ようわからんかった」と仰っていた。僕も早口だと言われるけど、次元が違う。

タグ:

posted at 20:36:51

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 モデルのパラメータの最適化くんが

>データ中に新しい構造を見つけたよ!

とかわいい声でアナウンスを出しても(訓練誤差がポコッと下がっても)、発見された新しい構造は単なるノイズに過ぎず、そこへのフィッティングはオーバーフィッティングになってしまうかもしれない。

タグ: 統計

posted at 20:03:08

(「・ω・)「ガオー @bicycle1885

20年2月13日

condaちゃんほんとに色々なトラブルを誘発してくれるめうねぇ

タグ:

posted at 20:01:30

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 最適パラメータの探索過程を適当にプロットすると楽しめます。

最適パラメータ探索の過程で、対数尤度の-1倍(訓練誤差)がポコッと下がることが起こる、そのとき、現実の学習過程では見えない汎化誤差はポコッと下がったり上がったりする。上がる場合が多くて、そのとき過学習が起こっている。

タグ: 統計

posted at 20:00:00

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 サンプルサイズn=16、モデルが13次多項式の場合の最尤法でのオーバーフィッティングを抑えるためにパラメータに適当に調節されたLaplace分布の事前分布を仮定した場合(LASSO正則化、MAP法なのでベイズ法より最尤法に近い)。

素直にモデル自体を単純化して最尤法ですます方が良さそう。 pic.twitter.com/Z9oG1xtPQ4

タグ: 統計

posted at 19:49:58

Shuhei Kadowaki @kdwkshh

20年2月13日

とりあえず卒論提出してからこの1週間溜まってたOSS活動全て放出したった。 pic.twitter.com/UNGuDgakaH

タグ:

posted at 19:38:02

新帯秀樹 Hideki Shintai @hs_heddy

20年2月13日

Juliaのアプリケーションを実行形式にしてデプロイできてしまうんや.そう,(新しい) PackageCompiler ならね
#Julia言語

qiita.com/SatoshiTerasak... #Qiita

タグ: Julia言語 Qiita

posted at 19:21:16

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計

nbviewer.jupyter.org/gist/genkuroki...

n = 16 のとき、3次式による最尤法ではオーバーフィッティングが起こっていません。 pic.twitter.com/ji3CMveqdc

タグ: 統計

posted at 19:00:40

毎日新聞・囲碁 @mainichi_igo

20年2月13日

学生本因坊の栗田佳樹さんが、棋聖戦ファーストトーナメント予選決勝で外柳是聞三段に勝って予選突破を決め、アマチュアで初のCリーグ入りを決めました。 pic.twitter.com/fsfe7i6nZX

タグ:

posted at 19:00:05

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 サンプルサイズごとにモデルの複雑さを変えた方が推定がうまく行くわけです。

モデルによる未知の母集団分布の最良近似精度が低い場合の方が推定誤差が小さくなることがある。

仮にこういう基本的なことを知らずに

「確率モデルで母集団分布が実現可能である」

と前提するのはまずいです。 twitter.com/not_identified...

タグ: 統計

posted at 18:57:57

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 1つ前のモデルは13次多項式で、真の法則はx=0~2πでのsin x+ノイズです。多項式の次数を上げた方がsin xをより高い精度で近似できるのですが、サンプルサイズが16なので、13次多項式モデルは複雑すぎて、真実のsin xからかけ離れた推定結果を得てしまいます。

これは最尤法に限らず普遍的です。

タグ: 統計

posted at 18:47:23

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計

nbviewer.jupyter.org/gist/genkuroki...
オーバーフィッティングの過程の動画 LASSO版

添付動画は最尤法でのパラメータ探索の様子の動画です。generalization errorが予測誤差に対応しており、これが上昇するとまずい。訓練誤差が下がるにつれて予測誤差が上昇しまくっている(笑)。 pic.twitter.com/IOPRQEghIv

タグ: 統計

posted at 18:43:00

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 統計学の使用を他人に勧めることは、ギャンブルを他人に勧めることの一種なので、そのギャンブルでどのような損害が生じるリスクがあるかについて詳しく説明する責任が生じると思う。

統計学は決して「お墨付きを得るための道具」ではない。「ギャンブル」と「お墨付き」ではほぼ正反対。

タグ: 統計

posted at 18:31:44

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 続き

データへの適合度が上がっても、データを生成した未知の確率法則にモデルを近付けたことになるとは限らない。

例えば、モデルをどんどん複雑にして、データにぴったり適合するようにパラメータ調節すると、モデルとデータを生成した未知の確率法則は大きく違うものになってしまうだろう。

タグ: 統計

posted at 18:23:14

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 最尤法の解説

歴史的な理由で尤度(likelihood)とよばれることになった量は実際には「もっともらしさ」ではなく、「確率モデルのデータへの適合度」の指標に過ぎない。

「確率モデルのデータへの適合度」が最大になるパラメータを探すのが最尤法である(定義)。

続く

タグ: 統計

posted at 18:23:12

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 我々は、複雑で未知の現実の姿に近付きたいので統計学を使う。統計学の使用では確率的に間違う可能性を排除できないので常にギャンブルになる。

どんなに「主義」を振り回しても、非現実的な設定を含むモデル内部における最適化問題を解いても、複雑で未知の現実に立ち向かう手段は得られない。

タグ: 統計

posted at 18:16:45

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 James-Stein推定の手計算の詳細とコンピューターによる数値的確認のノートを

nbviewer.jupyter.org/github/genkuro...

で公開してあります(#Julia言語 and #Jupyter の組み合わせはこのような目的には最適だと思われる)。

その例は最尤法が最強でないシンプルな証拠になっています。

タグ: Jupyter 統計

posted at 18:12:20

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 上の最尤法の推定結果の平均二乗誤差を下げるためには、パラメータに関する適切な正規分布を事前分布として採用して、事後分布を最大化するパラメータ値を推定値とするとよいです。(所謂Ridge正則化を行なっている。)

これが所謂James-Stein推定の話です。手計算で確認できます。

タグ: 統計

posted at 18:08:25

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 続き。サンプルサイズN=1の最尤推定なのでちょっとアレなのですが、オーバーフィッティングは特にサンプルサイズが小さな場合に起こるので、最も簡単な場合を扱っていると思えば良いでしょう。

続く

タグ: 統計

posted at 18:04:25

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 例えば、未知の平均μ_1,…,μ_nを持つn個の独立な分散1の正規分布のサンプルをX_1,…,X_nが与えられたとき、n個の独立な分散1の正規分布モデルの最尤法によるμ_iの推定値はX_iになります。

実はこれは(私が知る限りにおいて最もシンプルな)オーバーフィッティングになることが知られています。

タグ: 統計

posted at 18:01:03

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 例えば、モデルのパラメータ数がサンプルサイズと同じオーダーで多いときに、最尤法はオーバーフィッティングで予測誤差が無用に大きくなります。

(ハイパーパラメータ入りの)事前分布を適切に調節して与えてMAP法(罰則項付きの最尤法)を行った法が平均予測誤差が小さくなることは有名。続く

タグ: 統計

posted at 17:56:49

こども先生 @kdmmental

20年2月13日

精神科医として言います。
覚醒剤は一度使用するとやめられません。芸能人が何度も再犯で逮捕されているのがその証拠です。もちろん二度と使わずに生活できている人もいますが、常に葛藤を抱きながら頭の中から覚醒剤が完全に消えてしまう人はいません。絶対に覚醒剤に手を出すのはやめてください。

タグ:

posted at 17:56:35

K.B.砂糖 @KB_satou

20年2月13日

Flux.jl 完全に理解した
( loss が減ってないように見えるバグを創り出し、死闘の末撃破した)

タグ:

posted at 17:45:12

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 頻度主義、ベイズ主義、尤度主義、などなど、全部やって来い!ただし、お前らの主義の部分は一切評価せずに、お前らが提示したモデルをデータで評価してやるから覚悟しな!

尤度がどれだけ有用な指標でどのような欠点を持つ指標であるかは、「主義」を捨て去った以上のスタイルで評価されます。

タグ: 統計

posted at 17:39:06

EARLの医学ツイート @EARL_med_tw

20年2月13日

専門じゃない医師を出演させてこれ以上混乱させるような真似はやめていただきたいですね twitter.com/hyakutanaoki/s...

タグ:

posted at 17:37:06

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 それが、赤池弘次さんが言うところの an information criterion (AIC)です(みんな Akaike's information criterion、赤池情報量規準と呼んでいる😊)。

主義にこだわるより、適切な数学的法則を見付けて、モデルのデータを用いた評価法を作る方がよいという、非常にもっともな話になったのです。

タグ: 統計

posted at 17:34:54

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 20世期を代表する統計学者の赤池弘次さんは、「主義」にこだわっても未知の現実の真の姿に迫る合理的な方法は得らないことを指摘し、未知の真の分布とモデルの分布の違いの大きさを測る適切な指標を未知の真の分布を参照せずに未知の真の分布が生成したデータのみから計算する方法を作りました。

タグ: 統計

posted at 17:29:59

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 ~統計的推論の数学的様子が当時よりもずっと見えている現代では、尤度だけでがんばると未知の値の推定結果の平均予測誤差が無駄に大きくなってしまう場合があることが分かっているので、尤度だけでなんとかしようとすることは主義に基く不合理な考え方であることが確定しています。

タグ: 統計

posted at 17:25:45

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 私は統計学も統計学史もど素人なので詳しいことは知らないのですが、20世紀の統計学黎明期には、客観的なデータだけを参照し、データのみの情報だけで計算できる尤度(likelihood=データへの確率モデルの適合度)を用いて推定を行うべきである、というような意見があったようです。

しかし~続く

タグ: 統計

posted at 17:21:43

統計たん @stattan

20年2月13日

またでた!幾らでも出てくる誤ったベイズ統計の説明! twitter.com/fuka_media/sta...

タグ:

posted at 14:06:17

a_yam @yachts111xenon

20年2月13日

これ以上しっくり来る尤度の説明はない.感動 twitter.com/genkuroki/stat...

タグ:

posted at 12:20:56

丸の内キジトラ猫 @MarunouchiPanda

20年2月13日

最尤記とかいうデータサイエンティストが色々頑張る小説のタイトルを思いついたので誰か書いて。

タグ:

posted at 11:42:07

ケフっち@Deterministic @__cheph__

20年2月13日

#julialang たんのいいところはなんでもやろうとしないことで発揮される気がするよね。1番好きなのは下手くそが書いてもそこそこ速いこと。 twitter.com/nomorepython/s...

タグ: julialang

posted at 10:56:28

Yuki Nagai @cometscome_phys

20年2月13日

Documenter.jlでmarkdownからhtml化してみた。数式入りのhtmlが作れてよい。
Juliaで学ぶ量子力学 · Juliaで学ぶ量子力学 cometscome.github.io/QM/docs/build/

タグ:

posted at 10:54:00

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 ベイズ統計のモデル内での平均予測誤差の最小化で、ベイズ法の予測分布が得られる。しかし、実質的にやっていることは、条件付き確率の最適性による特徴づけでしかない。

モデル内での最適化問題で特徴付けても、モデル全体や予測分布の良し悪しの評価はできない。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 10:52:28

Katsushi Kagaya @katzkagaya

20年2月13日

「従来の方法で行われたモデルの設計や検定の結果は、 信頼できるものだったのでしょうか」
watanabe-www.math.dis.titech.ac.jp/users/swatanab...

タグ:

posted at 10:30:16

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 「尤度」と不適切な名前で呼ばれる量を理解することは難しいです。赤池弘次さんの

ismrepo.ism.ac.jp/index.php?acti...

によれば、最尤法をひろめたFisherさんは尤度について理解していなかった。😅

赤池さんの

www.jstage.jst.go.jp/article/butsur...

も見るべき。以上の2つを見れば「尤度」の理解が深まります。

タグ: 統計

posted at 10:11:48

あ〜る菊池誠(反緊縮)公式 @kikumaco

20年2月13日

福島の甲状腺検査は、論文を書くためにデータが欲しい人たちと反原発運動のために甲状腺がんをたくさん見つけてほしい人たちと予算があるからやめられないと考える人たちの思惑が一致しているところが問題なんですよ。もちろん、どれも「人でなし」の思惑なんですが

タグ:

posted at 10:04:05

あ〜る菊池誠(反緊縮)公式 @kikumaco

20年2月13日

甲状腺検査に関する鈴木眞一さんの発言は科学的におかしいし、論理的にも破綻しているので、あれを何かの「お墨付き」のように使うと、その人の論理性が疑われますよ。診断基準を厳格にしているから過剰診断は殆どないなどと平気で言っちゃうし、被曝影響はないが検査は続けるべきと言っちゃうしね

タグ:

posted at 09:39:30

tomoyuki matoba @tama_lion

20年2月13日

(大学キャンパスで)ノラネコが増えるのは女性が餌をやるせいだと言わんばかりの、タイトルも内容もひどい論文がBiological Conservationに掲載されて炎上中。アブスト読むだけでも方法ガバガバ。投稿から掲載までの期間のせいで、エディターもレビュアーもクリスマス休暇やったん?と突っ込まれてる twitter.com/ecologyofgavin...

タグ:

posted at 09:34:10

黒木玄 Gen Kuroki @genkuroki

20年2月13日

@apap1031 ベイズ統計でのロス函数とそれでどうなるかの具体例を見せて下さい。具体例無しのこういう話は不毛。

私自身は事後分布での平均二乗誤差(ロス函数)を最小にするパラメータを求める話をすでにし、それがダメな理由も説明しました。

ロス函数の具体例を見せて下さい。

タグ:

posted at 09:13:40

統計たん @stattan

20年2月13日

@nhayashi1994 Obliviousは無限に聞いてます。

タグ:

posted at 09:07:54

非公開

タグ:

posted at xx:xx:xx

ジョージ @Kiriyama_George

20年2月13日

この犬度ってなんですか? twitter.com/tmaehara/statu...

タグ:

posted at 08:41:47

MMM @MMM140806

20年2月13日

まともな経済成長をしていないと、挑戦が報われる確率は大きく下がる。努力しても、発揮する挑戦の場がなければその差は見えない。

経済の低迷は、努力するものや挑戦するものに優しくはない。

タグ:

posted at 08:27:00

とんぼ@JavaScript完全に理解し @Tombo__Gokuraku

20年2月13日

発表者が尤度のことを「犬度」だと思っていて、質問者と発表者で話が噛み合わないという地獄の卒論発表会を見たことがある… twitter.com/tmaehara/statu...

タグ:

posted at 08:21:19

Dr. nhayashi @nhayashi1994

20年2月13日

@stattan トゲトゲギスギスしてきたら君の銀の庭

タグ:

posted at 08:05:22

統計たん @stattan

20年2月13日

人生の救いがKalafinaの曲にしかない。

タグ:

posted at 02:20:17

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 要するに、最尤法は決してベストの方法ではないし、事前分布を平均予測誤差を下げるためにも利用できるということです。(注意: まだベイズ統計の話はしていない。MAP法の話しかしていない。事前分布が出て来れば常にベイズになるわけではない。

例の解説↓
nbviewer.jupyter.org/github/genkuro...

タグ: 統計

posted at 01:41:23

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 最尤法がやっていることは、確率モデルのデータへのフィッティングに過ぎず、データを生成した未知の確率分布にモデルが近付くことを保証しません。

実際、すべてを手計算で確認できるシンプルな例で、適切な事前分布を採用した方が平均二乗誤差を小さくできる場合があります。

タグ: 統計

posted at 01:41:23

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 尤度(likelihood)と呼ばれるものが「もっともらしさ」を表す指標ではないことは強調されるべきだと思う。

尤度は確率モデルがデータ=サンプルを生成する確率(密度)。

確率モデルがデータを生成する確率が最大になるようにパラメータを調節するのが最尤法。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 01:41:22

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

20年2月13日

#統計 事前分布のような現実での対応物がないものや現実における妥当性が不明の確率モデルで構成されたモデル内での〇〇最小化を行なっても、現実において何を推定しているかは分からないと思います。

分かると主張したいなら、具体的な分かる例を示して欲しいです。 twitter.com/apap1031/statu...

タグ: 統計

posted at 01:28:16

おばけ @triwave33

20年2月13日

須山ベイズ本の図をJuliaで書いてる(4/N)レポジトリはこちらです

github.com/triwave33/juli...

タグ:

posted at 00:24:54

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました