黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2020年02月13日(木)
#統計 事前分布のような現実での対応物がないものや現実における妥当性が不明の確率モデルで構成されたモデル内での〇〇最小化を行なっても、現実において何を推定しているかは分からないと思います。
分かると主張したいなら、具体的な分かる例を示して欲しいです。 twitter.com/apap1031/statu...
タグ: 統計
posted at 01:28:16
非公開
タグ:
posted at xx:xx:xx
#統計 尤度(likelihood)と呼ばれるものが「もっともらしさ」を表す指標ではないことは強調されるべきだと思う。
尤度は確率モデルがデータ=サンプルを生成する確率(密度)。
確率モデルがデータを生成する確率が最大になるようにパラメータを調節するのが最尤法。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 01:41:22
#統計 要するに、最尤法は決してベストの方法ではないし、事前分布を平均予測誤差を下げるためにも利用できるということです。(注意: まだベイズ統計の話はしていない。MAP法の話しかしていない。事前分布が出て来れば常にベイズになるわけではない。
例の解説↓
nbviewer.jupyter.org/github/genkuro...
タグ: 統計
posted at 01:41:23
とんぼ@JavaScript完全に理解し @Tombo__Gokuraku
発表者が尤度のことを「犬度」だと思っていて、質問者と発表者で話が噛み合わないという地獄の卒論発表会を見たことがある… twitter.com/tmaehara/statu...
タグ:
posted at 08:21:19
まともな経済成長をしていないと、挑戦が報われる確率は大きく下がる。努力しても、発揮する挑戦の場がなければその差は見えない。
経済の低迷は、努力するものや挑戦するものに優しくはない。
タグ:
posted at 08:27:00
非公開
タグ:
posted at xx:xx:xx
(大学キャンパスで)ノラネコが増えるのは女性が餌をやるせいだと言わんばかりの、タイトルも内容もひどい論文がBiological Conservationに掲載されて炎上中。アブスト読むだけでも方法ガバガバ。投稿から掲載までの期間のせいで、エディターもレビュアーもクリスマス休暇やったん?と突っ込まれてる twitter.com/ecologyofgavin...
タグ:
posted at 09:34:10
甲状腺検査に関する鈴木眞一さんの発言は科学的におかしいし、論理的にも破綻しているので、あれを何かの「お墨付き」のように使うと、その人の論理性が疑われますよ。診断基準を厳格にしているから過剰診断は殆どないなどと平気で言っちゃうし、被曝影響はないが検査は続けるべきと言っちゃうしね
タグ:
posted at 09:39:30
福島の甲状腺検査は、論文を書くためにデータが欲しい人たちと反原発運動のために甲状腺がんをたくさん見つけてほしい人たちと予算があるからやめられないと考える人たちの思惑が一致しているところが問題なんですよ。もちろん、どれも「人でなし」の思惑なんですが
タグ:
posted at 10:04:05
#統計 「尤度」と不適切な名前で呼ばれる量を理解することは難しいです。赤池弘次さんの
ismrepo.ism.ac.jp/index.php?acti...
によれば、最尤法をひろめたFisherさんは尤度について理解していなかった。😅
赤池さんの
www.jstage.jst.go.jp/article/butsur...
も見るべき。以上の2つを見れば「尤度」の理解が深まります。
タグ: 統計
posted at 10:11:48
「従来の方法で行われたモデルの設計や検定の結果は、 信頼できるものだったのでしょうか」
watanabe-www.math.dis.titech.ac.jp/users/swatanab...
タグ:
posted at 10:30:16
#統計 ベイズ統計のモデル内での平均予測誤差の最小化で、ベイズ法の予測分布が得られる。しかし、実質的にやっていることは、条件付き確率の最適性による特徴づけでしかない。
モデル内での最適化問題で特徴付けても、モデル全体や予測分布の良し悪しの評価はできない。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 10:52:28
Documenter.jlでmarkdownからhtml化してみた。数式入りのhtmlが作れてよい。
Juliaで学ぶ量子力学 · Juliaで学ぶ量子力学 cometscome.github.io/QM/docs/build/
タグ:
posted at 10:54:00
#julialang たんのいいところはなんでもやろうとしないことで発揮される気がするよね。1番好きなのは下手くそが書いてもそこそこ速いこと。 twitter.com/nomorepython/s...
タグ: julialang
posted at 10:56:28
Universal Curiosity @UniverCurious
Balancing move. pic.twitter.com/pvOrdIXK9x
タグ:
posted at 14:40:15
ごまふあざらし(GomahuAzaras @MathSorcerer
plotlyバックエンドのJuliaコードを
Binderでスマホで試した様子
#Julia言語
#Julialang
mybinder.org/v2/gh/terasaki... pic.twitter.com/bUYR7mDepS
posted at 16:09:21
精神科医として言います。
覚醒剤は一度使用するとやめられません。芸能人が何度も再犯で逮捕されているのがその証拠です。もちろん二度と使わずに生活できている人もいますが、常に葛藤を抱きながら頭の中から覚醒剤が完全に消えてしまう人はいません。絶対に覚醒剤に手を出すのはやめてください。
タグ:
posted at 17:56:35
#統計 James-Stein推定の手計算の詳細とコンピューターによる数値的確認のノートを
nbviewer.jupyter.org/github/genkuro...
で公開してあります(#Julia言語 and #Jupyter の組み合わせはこのような目的には最適だと思われる)。
その例は最尤法が最強でないシンプルな証拠になっています。
posted at 18:12:20
#統計
nbviewer.jupyter.org/gist/genkuroki...
オーバーフィッティングの過程の動画 LASSO版
添付動画は最尤法でのパラメータ探索の様子の動画です。generalization errorが予測誤差に対応しており、これが上昇するとまずい。訓練誤差が下がるにつれて予測誤差が上昇しまくっている(笑)。 pic.twitter.com/IOPRQEghIv
タグ: 統計
posted at 18:43:00
#統計 サンプルサイズごとにモデルの複雑さを変えた方が推定がうまく行くわけです。
モデルによる未知の母集団分布の最良近似精度が低い場合の方が推定誤差が小さくなることがある。
仮にこういう基本的なことを知らずに
「確率モデルで母集団分布が実現可能である」
と前提するのはまずいです。 twitter.com/not_identified...
タグ: 統計
posted at 18:57:57
学生本因坊の栗田佳樹さんが、棋聖戦ファーストトーナメント予選決勝で外柳是聞三段に勝って予選突破を決め、アマチュアで初のCリーグ入りを決めました。 pic.twitter.com/fsfe7i6nZX
タグ:
posted at 19:00:05
#統計
nbviewer.jupyter.org/gist/genkuroki...
n = 16 のとき、3次式による最尤法ではオーバーフィッティングが起こっていません。 pic.twitter.com/ji3CMveqdc
タグ: 統計
posted at 19:00:40
Juliaのアプリケーションを実行形式にしてデプロイできてしまうんや.そう,(新しい) PackageCompiler ならね
#Julia言語
qiita.com/SatoshiTerasak... #Qiita
posted at 19:21:16
#統計 サンプルサイズn=16、モデルが13次多項式の場合の最尤法でのオーバーフィッティングを抑えるためにパラメータに適当に調節されたLaplace分布の事前分布を仮定した場合(LASSO正則化、MAP法なのでベイズ法より最尤法に近い)。
素直にモデル自体を単純化して最尤法ですます方が良さそう。 pic.twitter.com/Z9oG1xtPQ4
タグ: 統計
posted at 19:49:58
深谷賢治先生と自分の指導教官が廊下で立ち話をしているのを聞いたことがあるんだけど、深谷先生が早口すぎてほとんど何を言っているかわからなかった記憶がある。指導教官に「さっきの話は何だったんですか」と訊いたら、「ようわからんかった」と仰っていた。僕も早口だと言われるけど、次元が違う。
タグ:
posted at 20:36:51
師匠には、お礼に渡辺ベイズ本を渡して「後で数学部分を教えてください」と頼んでおいた。さっそく4~5時間ぶっ通しで読んでいた。とても難しいが面白いとのこと。
タグ:
posted at 20:46:50
#統計 私が、Waldの定理を一枚の絵にし、「主観的確率」という言葉を使って説明しているシーン。
これはこれで、「主観的確率」を内包するモデル内部でどのように普遍的なことが数学的に起こっているかを示す意味のある結果。
しかし、これを使っても現実とモデルの関係は原理的に分からない。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 20:50:53
@stattan @nhayashi1994 私の家庭内でもKalafina曲がよく流れています。たとえば
www.youtube.com/watch?v=3YnDHY...
タグ:
posted at 20:56:53
#統計 分かっている人たちは、渡辺澄夫『ベイズ統計の理論と方法』にあるより優れた結果を前提に自分の意見を述べているので、そういう話は話題になりにくいと思います。
あと現実にはサンプルサイズnは有限で、与えられたサンプルでは事後分布の違いによって推定精度に結構差がつく場合があります。 twitter.com/ktrmnm/status/...
タグ: 統計
posted at 21:22:53
#超算数 「ファン・ヒーレの最初の水準で、正方形は長方形と見做せないとする文献」という題名で掲示板に書き込みました。
8254.teacup.com/kakezannojunjo...
タグ: 超算数
posted at 22:03:35
ごまふあざらし(GomahuAzaras @MathSorcerer
#Julia言語
おおおおお,すごおいいぃぃ twitter.com/cometscome_phy...
タグ: Julia言語
posted at 22:09:14
@genkuroki どの結果を指すかわかりませんが「より優れた」というのは語弊があると思います。Bernstein von Mises theoremというのは特定の定理ではなくてある種の主張の総称を指す印象です。また、正則パラメトリックモデルの結果を拡張する方向性はそれを特異モデルにするというだけではありません。
タグ:
posted at 22:14:13
無教養なアンパンマンとしては、リベラルアーツというのは、こういう説明を疑えるような知性を育む教養であってほしいと思った。
liberal-arts-guide.com/bayesian-stati...
タグ:
posted at 22:16:09
これは「ベイズ統計と頻度論という対立図式は歴史的にはあったのだから、それを無視するのはよくない」という主張だが、つまり燃焼の化学を学ぶにはフロギストン説から始めた方がいいし、重力を学ぶにはアリストテレスから読んだ方がいいということにはならないのか
タグ:
posted at 22:21:05
@genkuroki ちなみに元ツイートの趣旨については、BvM定理というのはfrequentist guarantee for Bayesian methodsというような位置付けなので、これがどういう主張なのか理解することが現在の統計分野でfrequentistやBayesianという言葉がどのように使われているかを知る良い機会になるという気持ちです。
タグ:
posted at 22:22:05
心理学ではヴント習うけど、あくまで心理学の成立過程を知るためだしなぁ 。というか、ヴントが具体的にどんな研究をしたのかって知らないことに気づいた。ワトソンもアルバート坊やの逸話しか知らない。フェヒナーは今でも通用する実験手続きを提案したから、歴史的な価値だけには留まらないよね。
タグ:
posted at 22:26:31
ごまふあざらし(GomahuAzaras @MathSorcerer
リポジトリに ipynb をでーんって置いておくより, Binderで閲覧できるような環境を作っておいて
.py か .jl をクリックしたら jupytext によってノートブック形式に変換するというスタイルの方が開発側もリポジトリを見る人からの体験良い気がする.
タグ:
posted at 22:41:03
@genkuroki うーん、じゃあ、信用していただかなくて大丈夫だと思います。もともと定義して使うような言葉ではありませんが、数理統計の論文誌に論文を投稿するときに、そのような意味で単語を使ったとしても解釈に齟齬が生じないという程度の意味です。
タグ:
posted at 22:45:51
古いPC使ってるけど
Binder環境(左)の方が、ローカル(右)より強かった。 twitter.com/MathSorcerer/s... pic.twitter.com/jY1IZrncBy
タグ:
posted at 22:46:52
ごまふあざらし(GomahuAzaras @MathSorcerer
- Python -> requirements.txt を置いておく
- Julia -> Project.toml をおいておく
- こまかいことをしたければ IDが1000の一般ユーザーを追加した Dockerfileを作っておく
かな? mybinder.org にアクセスして自分のリポジトリのURL,ブランチを指定しておけばあとはOK
タグ:
posted at 22:46:53
#統計 根拠に当たる情報を一切示さずに終えてよい話題ならばそれでもよいと思いますが、私なんかと無関係に広めた方がよい話題だとお考えなら、根拠に当たる情報も示した方が良いと思いました。
情報拡散ならRTでお手伝いできます。 twitter.com/ktrmnm/status/...
タグ: 統計
posted at 22:50:47
measure theory - About Egorov's therorem for continuous sequences - Mathematics Stack Exchange ←これは知らなかったですw math.stackexchange.com/questions/6088...
タグ:
posted at 22:54:48
メディアの皆さん「薬物を一度やった人は止められない」という一般人の街録を報道することを止めて下さい。
自助グループに繋がり、止め続けている人が世界中に沢山います。
偏見が助長されます。報道のガイドラインを読んでください。
izon-hodo.net
タグ:
posted at 23:06:21
#統計 喧嘩腰になってはいないです。
すでに述べたように、根拠情報皆無なのは全然駄目だと思いますが(←これを喧嘩腰扱いしてはいけないと思う)、根拠情報であれば拡散にお手伝いできます。 twitter.com/ktrmnm/status/...
タグ: 統計
posted at 23:07:46
@genkuroki 特に拡散不要ですが、例えばこちらの論文に用例が見つかります projecteuclid.org/euclid.aos/133...
例を収集するのはさすがに大変なのでしませんが、ご興味があれば引用を辿っていくと見つかると思います。根拠を求めるのはとても良い態度とは思いますが、執拗に求めるのはコミュニケーションとしてどうなのか。
タグ:
posted at 23:12:33
根拠に関する情報を1つも示さずに、喧嘩腰だと決め付ける態度にも問題があると思いました。
しかし、当該ツイートが有益な情報の可能性もあるので約束通り、RTしておきました。
ただし、ある分野で普通だとされる考え方の引用に手間取るのは不思議なことだとも思いました。
twitter.com/ktrmnm/status/...
タグ:
posted at 23:18:38
一般論: 誰もが認める標準的な専門書から引用できるなら、1個の引用でもかなりの説得力がありますよね。
私は、学部生向けの統計学入門について批判的な発言をするときには、読者が多い標準的教科書だと思われる東京大学教養学部統計学教室編『統計学入門』を引用することが多いです。
タグ:
posted at 23:23:16
@genkuroki そうですか、躍起になられている感じかと思ったんですが、勘違いだったならすみません。ところで、黒木さんに対する個人的な質問ですが、いわゆる数理統計の論文誌はどのようなものを読まれていますか? もしかすると、日常的に読んでいる文化圏によって言葉の感覚に違和感があるかもしれないですね
タグ:
posted at 23:30:29
#統計 メモ
どういう話になっているのか分かりませんが、私が既存の統計学入門への批判で繰り返し述べて来た「検定や信頼区間の解説で数学的モデルを使っていることの説明が不十分なせいで、モデルと現実の区別が曖昧になり過ぎている」という指摘に通じるものがあると思ったのでメモっておきます。 twitter.com/not_identified...
タグ: 統計
posted at 23:36:55
(1/5) RT言及> まったくもって無駄な緩い話なのですが&Bernstein-von Misesの定理【も】まったく理解できていませんが,
Reidによるインタビュー形式の伝記"Neyman" pp.23-24(日本語訳『数理統計学者ネイマンの生涯』もありますが少しきついかもしれません)によると,1915~1916年ぐらいに
タグ:
posted at 23:48:37
(2/5) Neymanは,Bernsteinの確率論の講義を受け,そこでBernstein-von Misesの定理を学んだとのことです.
jstorで検索した限り,"Bernstein-von Mises theorem"の初出は,Neyman(1962)"Two Breakthroughs in the Theory of Statistical Decision Making"(未読)でした.
同論文でも伝記と同じ
タグ:
posted at 23:48:37
(3/5) ことが述べられています(伝記の該当箇所が,おそらくNeyman(1962)に基づいて書かれている).
"I do not know when Bernstein published his result, but I learned it in Bernstein's lectures in 1915 or 1916. The result of von Mises was published in 1914[4]."と述べられており,
タグ:
posted at 23:48:38
(4/5) Bernsteinのほうは文献名は挙げられていません.
同論文での定理説明は言葉だけで,"Both results give a theorem to the general effect that, if the a priori probability density of θ is continuous then, as the number of independent observations is increased, the a posteriori
タグ:
posted at 23:48:38
(5/5) distribution of θ given by (1) tends to a calculable limit, independent of the a priori distribution."などと書かれています.
注:このアカウントでのツイートの全責任は,私個人だけにあります.
タグ:
posted at 23:48:38
私は統計学は完全など素人なので数理統計の論文誌には普段全く目を通していません。
機械学習についてもど素人。
ガチでど素人です。 twitter.com/ktrmnm/status/...
タグ:
posted at 23:51:07
@genkuroki なるほど。私は、職業柄Annals of StatisticsやJournal of the Royal Statistical Society (B) といった論文を参照することが多いです(この選択自体はバイアスがあると思います)。特に前者に顕著ですが、frequentistといった場合は「真の分布を固定したもとで何らかの理論保証をつける」という (続)
タグ:
posted at 23:53:44
@genkuroki ニュアンスがあります(ただし、この単語の使い方自体が論文の主題であることはないので、あくまでニュアンスの上での話になってしまいます)。知人の統計学者と英語で話しているときも、「いい結果ですね」「いや、もっとfrequentistな保証をつけたいんだよね」、というような会話になることがあります
タグ:
posted at 23:57:00