Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
Favolog ホーム » @genkuroki » 2019年08月23日
並び順 : 新→古 | 古→新

2019年08月23日(金)

グレッグ @glegory

19年8月23日

社会保険料は個人も企業も大変な負担なんですよ。こういう隠れた税金を不況時に負担軽減すれば確実な景気対策になる。所得税を払ってない方も保険料は負担しているケースも多い。だが日本の役人は絶対に減税はしない。自分達に全く利がないから。

タグ:

posted at 23:46:13

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 東京大学教養学部統計学教室編『統計学入門』関連

twitter.com/genkuroki/stat...

タグ: 統計

posted at 23:24:37

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 このスレッドの上の方も見た方が良いかも。

twitter.com/fzw1212/status...

タグ: 統計

posted at 23:20:31

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 分割表の独立性のカイ二乗検定で使うカイ二乗分布の自由度が決まる仕組みに関するデタラメな説明を扱っているのは以下のリンク先。

正しくはWilks' theoremを使う。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 23:14:55

ʇɥƃıluooɯ ǝıʇɐs @tsatie

19年8月23日

流石♬ ポニョだけにノーチラス号でネモとは! twitter.com/mathsorcerer/s...

タグ:

posted at 23:13:00

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 統計の専門家であればWilks' theoremを当然知っていないとおかしいので、この誤りは解せない。

ここでは引用しないが、この誤りは他の教科書でも共通していた。英語の教科書でも間違っていたりする。

2×2の分割表でのFisher検定は自明な理由で正確ではない。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 23:11:56

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 多分、テクニカルなことを色々知っていないと、何がどう問題なのか特にわかりにくいのが、以下のリンク先の話題(既出)。

分割表の独立性について、ピアソンのカイ二乗統計量を使ったカイ二乗検定を行うときのカイ二乗分布の自由度が決まる仕組みの説明の誤り。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 23:09:11

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 東京大学教養学部統計学教室編『統計学入門』の初版は1991年出版なのですが、サベジの「主観確率」などを批判した赤池弘次さんの論説はその10年以上前の1980年。

1970年代には「主義に基く統計学」観ではダメだということになっていたのではないか?

twitter.com/genkuroki/stat...

タグ: 統計

posted at 22:37:14

桑満おさむ @kuwamitsuosamu

19年8月23日

このような結果が出たら、ワクチンを接種しないという理由が見当たらない。 www.afpbb.com/articles/-/324...

タグ:

posted at 22:37:12

Tsuyoshi Miyakawa @tsuyomiyakawa

19年8月23日

議論対象のトピックと関係のないことにはできるだけ言及しない、という慣習が欲しいですね。そういうトレーニングを十分にしていただければ、ネットの空気感も随分良い方向に向かうのではないかと思います。

タグ:

posted at 22:36:34

Tsuyoshi Miyakawa @tsuyomiyakawa

19年8月23日

あと、この種のピュアに学問的なトピックで、たんたん/粛々と感情を出さずに議論できる、ということがとても大切ですよね。そういうことも、「論理国語」や「実用国語」でしっかりトレーニングしていただきたいところ。

タグ:

posted at 22:34:28

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 このスレッドで批判をまとめている

東京大学教養学部統計学教室編『統計学入門』

の執筆者と版は添付画像の通り。

本書の執筆者

松原望
縄田和満
中井検裕

1991年7月10日 初版
2018年10月15日 第40刷 pic.twitter.com/pdpebBS891

タグ: 統計

posted at 22:32:20

Tsuyoshi Miyakawa @tsuyomiyakawa

19年8月23日

これ、そんなに難しいですかね...😨
しかし、この問題、日本の中学生の国語力が驚くほど低いことのエビデンスの一つとして、あちこちで紹介されているようなのですが、これまで誰もこの点を指摘していないようだ、というのが驚き。「論理国語」の必要性を示すエビデンスにはなってますね...。

タグ:

posted at 22:29:40

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 東京大学教養学部統計学教室編『統計学入門』関連スレッド↓

twitter.com/genkuroki/stat...

タグ: 統計

posted at 22:27:18

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 そうなんです。私が購入した

東京大学教養学部統計学教室編『統計学入門』

は初版1991年、第40刷2018年です。最近、批判するためにわざわざ購入した。

背景の理屈を初心者が正しく再構成できるほど詳しく書かれて__いない__ので、情報の密度は結構高い。

twitter.com/tomoak1n/statu...

タグ: 統計

posted at 22:22:08

Tsuyoshi Miyakawa @tsuyomiyakawa

19年8月23日

つまり、このような理解をする場合、この新井紀子先生のリーディングスキルテストの設問で正答とされる回答は、不適切、ということになると考えられるわけです。

タグ:

posted at 22:21:52

Tsuyoshi Miyakawa @tsuyomiyakawa

19年8月23日

「ネコは動物である」といったとき、「動物はネコである」とはいえないし、
「ハルは春子の愛称である」といったとき、「春子の愛称はハルである」とはいえない。ですので、
「AlexはAlexandraの愛称である」といったとき、
「Alexandraの愛称はAlexである」とはいえない、
と考えるということですね。

タグ:

posted at 22:19:51

Tsuyoshi Miyakawa @tsuyomiyakawa

19年8月23日

「AはBである」といったとき、日常的な言葉の使い方としては、「A=B(AとBは等しい)」ことを指す場合は少なく、ほとんどの場合は「A ∈ B(AはBの要素である)」を意味する、と。で、後者の場合であれば、
「BはAである」と言えないわけです。 twitter.com/tsuyomiyakawa/...

タグ:

posted at 22:17:04

TN @tomoak1n

19年8月23日

@genkuroki ちなみに、その本は、1991年に発行されたきり、改訂されていないんですね。28年前!

タグ:

posted at 22:13:10

ʇɥƃıluooɯ ǝıʇɐs @tsatie

19年8月23日

それはもうすでにやってる。でもあれはどう見ても確率の話でほぼ皆が納得してヘーホーしてくれるけど到底統計の話にはならない。いや,統計を取って調査することは大事だよねという話にはなるのだけれど。 twitter.com/genkuroki/stat...

タグ:

posted at 22:11:21

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月23日

Nemo.jlでの
((GF(17^11)[y])/(y^3 +3xy +1))[z] という複雑な環の計算方法とその他のフレームワークでのベンチマーク結果

画像は Nemo/Hecke: Computer Algebra and Number Theory Packages for the Julia Programming Language
arxiv.org/pdf/1705.06134...
から引用 pic.twitter.com/YCgIIDI9Nb

タグ:

posted at 22:01:53

matsumatsu @matsumatsu1977

19年8月23日

竜王戦挑戦者決定戦第2局は、
木村九段が勝利。
豊島名人とともに1勝1敗とはり、竜王挑戦権は9/5(木)の第3局にもつれ込みました。

木村九段、だいぶ劣勢でしたが豊島名人がまさかの失速で「千駄ヶ谷の受け師」の本領発揮で守りきりました。

いやー、これで本当に分からなくなった。 pic.twitter.com/AD7IUtB8Au

タグ:

posted at 21:51:45

結城浩 / Hiroshi Yuki @hyuki

19年8月23日

#今日のProcessing
#つぶやきProcessing
マウスカーソルの横方向の位置に応じてN角形を作るというもの。triangleの練習として作りました。
gist.github.com/hyuki/f2f73687... pic.twitter.com/pJLW7Fwie9

タグ: つぶやきProcessing 今日のProcessing

posted at 21:39:42

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@tsatie 「ベイズの定理」なるものがこの世に存在しないかのように考えた方が「ベイズの定理」についても理解が深まる(笑)

タグ:

posted at 21:33:12

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@tsatie ベイズの定理はそのままだと直観的把握が難しく、「ありうる全パターンをどのように制限しているか」を何度も繰り返し考えた経験がないと、「機械的に公式を使うだけ」で好ましい感じの直観的な理解に至らないと思う。

タグ:

posted at 21:28:35

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@tsatie まさにそれ!

ベイズ統計の仕組みも、ベイズ推測のために準備した数学的モデル内部での、あるうるパターンを全部イメージして、モデル内で偶然に現実に得られたのと同じサンプルが得られた様子を考えることによっても理解できます。その場合にはベイズの定理は使わない。

twitter.com/kikumaco/statu...

タグ:

posted at 21:25:05

K2Da @K2Da

19年8月23日

「アレクサ、awsの障害ってなに?」ときいてみたが「すみません、わかりませんでした」とのことだった。わかるようにしておいてほしい

タグ:

posted at 21:24:34

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@eman1972 #数楽

◻︎◻︎⊗◻︎◻︎

= ◻︎◻︎◻︎◻︎

+ ◻︎◻︎◻︎
◻︎

+ ◻︎◻︎
◻︎◻︎

= ◻︎◻︎◻︎◻︎
+ ◻︎◻︎
+ ∅

タグ: 数楽

posted at 21:15:58

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@eman1972 #数楽 ああ、なるほど。「テトリスルール」を適用する前の図ですね。SU(2), sl(2)の表現論では、2個縦に揃ったら消えるという「テトリスルール」で

◻︎◻︎◻︎
◻︎

は左端が消えて

◻︎◻︎

に等しく、

◻︎◻︎
◻︎◻︎

は全部消えて



に等しくなります。続く

twitter.com/kantu_tarmi/st...

タグ: 数楽

posted at 21:13:37

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@tsatie 「〇〇〇の定理」(〇〇〇は有名になっている人の名前、例えば「ベイズ」)のような名前が付けられてしまうと、しっかり教えなければいけないかのようなプレッシャーが生じる。

それが原因で不適切な教え方になってしまっている場合は結構多いと思う。

数学では大抵のことは定義に戻れば何とかなる。

タグ:

posted at 21:08:26

⸘ @kantu_tarmi

19年8月23日

@eman1972 @genkuroki 度々すみません。
すでにお気づきだったら恐縮ですが、画像で図形の下に書いている数字は、Young図から出る次元dではなく、スピン(d=2s+1のs)ですね。

タグ:

posted at 21:06:21

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@tsatie ベイズの定理を教えることにこだわらず、条件付き確率の定義に戻って直感的な把握ができるようになることの重要性を強調した方が真っ当な教え方になる可能性が高いと思う。

ベイズ統計も条件付き確率分布の定義に戻って理解可能です。(ベイズの定理を直接使わないベイズ統計!)

タグ:

posted at 21:05:05

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@tsatie あと以前見た統計教育の論説(見失った)には、臨床検査での偽陽性の確率をベイズの定理を使って求めさせる教え方よりも、全事象を考慮することを経由して条件付き確率の定義に戻って求めさせた方がうまく行くという話が書いてあったと思う。

タグ:

posted at 21:03:02

S.Kataoka @SKataoka44

19年8月23日

「主観確率」とかの用語はそのまま「確率」でいい

タグ:

posted at 20:55:45

⸘ @kantu_tarmi

19年8月23日

@eman1972 @genkuroki 外から失礼します。
画像のYoungタブローを、次のように表現させて下さい。
[2]×[2]=[4]+[3,1]+[2,2]
箱の個数を上の列から順番に並べた記法です。
SU(2)の時は[1]の次元が2ですが、この場合[n,m]の次元が[n-m]の次元と等しい事が言えます。「SU(2)で一直線型しか見ない」のはこのためだと思います。

タグ:

posted at 20:55:29

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@tsatie 「現実で実用的であること」の判定基準としては「お金を賭けるギャンブルで役に立つかどうか」を採用すればよいと思っています。

タグ:

posted at 20:54:48

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@tsatie これは個人的な意見なのですが、科学や技術関係で確率について説明するときには「頻度主義」「ベイズ主義」「客観確率」「主観確率」などなどのジャーゴンは排除する方が妥当だと思います。

タグ:

posted at 20:50:11

あ〜る菊池誠(反緊縮)公式 @kikumaco

19年8月23日

モンティホール問題は全列挙すれば分かる単純な確率の問題なのに、どうしてあれをベイズの定理だの主観確率だので説明しようとしたがるのか理解できません。あるうるパターンを全部書き下してみればいいだけですよ twitter.com/genkuroki/stat...

タグ:

posted at 20:49:04

⛩️ksg城⛩️ @enihsoknes

19年8月23日

@genkuroki この本の著者の松原望さんって
小島寛之さんの師匠だったはずなのでなんか納得

おすすめする人が多くて読みたかったのに残念

タグ:

posted at 20:47:40

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@tsatie ウィキペディア
ja.wikipedia.org/wiki/%E3%83%A2...
【モンティ・ホール問題~とは、確率論の問題で、ベイズの定理における事後確率、あるいは主観確率の例題の一つ】

とやはり「主観確率」とある。

モンティ・ホール問題での確率は確率が絡むと勝負事をやっていれば出会う典型的な確率なのに「主観確率」。

タグ:

posted at 20:44:19

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@tsatie 自分で正しく合理的に定式化した方が容易なのでわざわざ調べたりしていないのですが、「主観確率」だけではなく「頻度主義」というのも極論に走ったかなり怪しげな考え方っぽい感じ。

* 数学的に明瞭に定式化可能
* その定式化が現実で実用的

であれば「主義」にこだわる意味はないと思う。

タグ:

posted at 20:33:19

ʇɥƃıluooɯ ǝıʇɐs @tsatie

19年8月23日

主観確率って何?

タグ:

posted at 20:28:22

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月23日

@triwave33 計算グラフを伝搬させるように型を伝搬させることができればいいという理解でいます.

タグ:

posted at 20:10:03

Khovtoliv @Khovtoliv

19年8月23日

旧日本軍の敗因を分析した『失敗の本質』のおもしろいところは、ベストセラー当時読んでいた連中が今や経営者になって全く同じ失敗をしているところだぞ。いったい何を学んだのか。

タグ:

posted at 19:54:29

おばけ @triwave33

19年8月23日

@MathSorcerer 型はよくわかってないですね…黒木さんがツイートされてるのしっかり追ってみようかなと思います

タグ:

posted at 19:38:17

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 一般に、確率分布Qを確率分布Pで予測する場合の予測誤差としてのKL情報量は予測分布Pの台が確率分布Qの台を含んでいる必要あり。

実際には起こらないケースも許容する分布を予測分布にしないと予測誤差が∞になってしまう危険性が増す。KL情報量による予測誤差の定義はこういう意味で保守的。

タグ: 統計

posted at 18:54:28

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 要するに、予測誤差をKL情報量で定義する立場では、99%の確率で起こることを100%起こると予想することは、予測誤差∞の許されない予測だということになります。

これを見ただけでも、KL情報量に関する知識が基本的な素養であることがわかります。

タグ: 統計

posted at 18:48:56

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 一般に真の確率が「確率qでA、確率1-qでB」であるとき、予測確率「確率pでA、確率1-pでB」のKL情報量で定義された予測誤差は

KL(q,p)
= q log(q/p)
+ (1-q)log((1-q)/(1-p))

になります。q=0.99, p=1ならば

KL(1, 0.99)=∞.

予測誤差が∞!

タグ: 統計

posted at 18:44:33

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月23日

Twitterをみるとベイズといえば渡辺ベイズだけれど
Webをみるとと渡辺ベイズとは思えないベイズを読んでいる感があるのでTwitter民および私が読んでいる本は別世界の本なんじゃないかと不安になる.

タグ:

posted at 18:39:27

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 99%の確率でAになるので、「常にAになる」という予測は99%の確率で当たります。この99%を予測精度の高さと定義すると、予測精度は非常に高いことになっていしまい、残りの1%を無視したくない場合には不適切な定義になります。続く

タグ: 統計

posted at 18:37:41

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 予測誤差をKL情報量で定義することの価値は、真の確率が「99%でAになり1%でBになる」であるとき、「常にAになる」という間違った予測の精度をどのように定義すれば良さそうかを考えても少しわかります。続く

タグ: 統計

posted at 18:37:39

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月23日

@triwave33 条件によって戻り値の型が異なるとよろしくない
というのはありますね.(JITコンパイルに優しくない意味で)

function f(x):
if x>0
return 1.
else
return 0
end
end

的なのはありますね.

タグ:

posted at 18:34:19

天むす名古屋 Temmus @temmusu_n

19年8月23日

#超算数 学年が上がるごとにどの課題も成績が向上するが、3年生でも正解率はそれぞれ、95.3%、96%、96% (330人のうち)。最低の正解率は1年生の正方形等分。323人の74.2%だった。リンゴを6個図示し半分を問う問題では、1年の53.0%、2年の58.0% (311人)、3年の57.6%が正解。

タグ: 超算数

posted at 18:33:06

天むす名古屋 Temmus @temmusu_n

19年8月23日

#超算数 この調査は分数概念の発達を調査した。1〜3年生に課されたテストに、図形を半分にする課題がある。円、正方形、
およそ1×2の横置き長方形を図示し【したの え に せんを ひいて はんぶんにしなさい。】と指示した。円は中心、正方形、長方形は各辺の中点に点が打たれている。

タグ: 超算数

posted at 18:26:07

天むす名古屋 Temmus @temmusu_n

19年8月23日

#超算数 『ケーキの切れない非行少年たち』には書いてあるのかもしれないが、ケーキを等分する以前の課題が結構難しいという結果が戦後すぐの調査で出ている。
神奈川県教育研究所編『数理概念の発達段階の調査』研究叢書 第2巻 横浜、神奈川県教育研究所、1952年。
小学校全学年が対象。日時不明。

タグ: 超算数

posted at 18:26:06

おばけ @triwave33

19年8月23日

julia、How toよりもアンチパターン(べからず集)が見たいなぁ
#julialang

タグ: julialang

posted at 18:25:33

ʇɥƃıluooɯ ǝıʇɐs @tsatie

19年8月23日

@genkuroki 主観確率ってのが気になってWikipediaを繰ったら項目があり「ところがこのように後になってから前の事実を推測する確率(後の結果を条件とする前の事実についての条件付き確率つまり事後確率)も頻度主義から見れば一種の主観確率である。」とあり頭を抱えている。何それ?

タグ:

posted at 18:23:23

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 統計学ど素人の私の勝手な想像なのですが、

ベイズ統計は【主観確率に基づく統計分析】である

などと解説する人達は真っ当な考え方をできていないことを自覚できていない、と専門家であれば当然考えているのではないでしょうか?

専門的な話と一般向けの解説のギャップが大き過ぎ。

タグ: 統計

posted at 18:05:53

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 非常に単純なモデルでは最尤法でやってもベイズ法でやっても結果に大した違いはありません。

ベイズ特有の利点を説明したければある程度以上複雑なモデルを例に使う必要がある。

こういう話と、ベイズ統計は【主観確率に基づく統計分析】だと説明すること(誤り)の違いは余りにも大きい。

タグ: 統計

posted at 18:02:27

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 以下のリンク先は同様のことの「頻度主義」版です。最尤法で繰り返し推定して、予測精度とAICを比較。

上で紹介したベイズ&WAICの場合のプロットと、以下のリンク先の最尤法&AICのプロットはほぼ同じ。

これ、単純な正規分布モデルなので違いがほとんど出ない。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 18:02:25

砂___の___女 @vecchio_ciao

19年8月23日

次男が思い出してくれた!
なんて親孝行なの!! twitter.com/vecchio_ciao/s...

タグ:

posted at 17:51:27

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 以下のリンク先のように、事前分布がどのように選ばれていようと(主観を入れてもよいし、計算の都合で選んでもよい)、WAICのような情報量規準を計算することによって、どちらの推定結果の予測精度が高いかをそれなりに高い確率で当てることができる場合があります。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 17:47:50

広江 克彦 @eman1972

19年8月23日

@genkuroki ありがとうございます!これについて悩むのはやめて安心して先へ進むことにします。

タグ:

posted at 17:45:37

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@eman1972 #数楽 SU(2)の有限次元既約表現=sl(2)の有限次元既約表現

で対応するYoung図形は「一直線型」で「2列」になったりはしません。そこの時点で理解できない。というわけでよくわかりません。

SU(2)の3次元表現とそれ自身のテンソル積は

3×3 = 5 + 3 + 1

と既約分解(数字は既約表現の次元)。

タグ: 数楽

posted at 17:42:30

小嶋 徹也 @coJJyMAN

19年8月23日

いったい、いつからおかしな話がまかり通るようになってしまったのだろう?🤔

タグ:

posted at 17:32:26

小嶋 徹也 @coJJyMAN

19年8月23日

一番、大事なところだと思います。「そもそも、ベイズ統計で主観確率は必須じゃない」 twitter.com/genkuroki/stat...

タグ:

posted at 17:32:25

広江 克彦 @eman1972

19年8月23日

@genkuroki スピン1とスピン1の合成で次のような説明図を見たのですが、右辺で黒のボックスを2分割して良い理由は何でしょうか?SU(2)の話をしているところにSO(3)であるスピン1を持ってきて無理な説明をしているのだろうかと疑っているところなのですけど。 pic.twitter.com/gT7xgnZaK1

タグ:

posted at 17:28:49

WIRED.jp @wired_jp

19年8月23日

垂直跳びから目の前に置かれた物に飛び乗る「ボックスジャンプ」と呼ばれる競技で、160cm以上の世界記録をもつ男がいる。彼はいったい、なぜこんな記録を出せるのか? (アーカイヴ記事)bit.ly/2yR85Pb

タグ:

posted at 17:15:01

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#数楽 もうちょっと「高級」な使い方が

佐武一郎『線型代数学』

にある。置換群S_rと一般線型群GL_nのあいだの関係(Weylの双対性)。このような結果のアフィンLie環版については、長谷川浩司氏の仕事が専門家のあいだでは結構有名だと思う。長谷川論文にもYoung図形の図があります。 pic.twitter.com/fuBNFKQoTi

タグ: 数楽

posted at 17:03:17

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#数楽 表現論とYoung図形の関係で易しいのは、GL_n, U(n), SL_n, SU(n) の有限次元既約表現のhighest weight (dominant integral weight)とYoung図形を対応付けることです。

GL, U と SL, SU での違いは「テトリスルール」(一段揃ったら消える)です。続く

twitter.com/eman1972/statu...

タグ: 数楽

posted at 17:03:14

名取宏(なとろむ) @NATROM

19年8月23日

がんの統計学(疫学)を医師も理解していない。アメリカ合衆国のプライマリケア医に、がん検診の疫学の問題を出したところ、半分以上が間違えた。完全正解はもっと少ない[ www.ncbi.nlm.nih.gov/pubmed/22393129 ]。間違った医師たちも、「臨床研究するまでもない」と考えていたんでしょうね。

タグ:

posted at 16:58:22

Kazuya Gokita @kazoo04

19年8月23日

京都の人に「そのモデル精度高いですね」って言われたらそれ過学習してるぞって意味

タグ:

posted at 16:50:07

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 関連

以下のリンク先のプロットでは、異なる事前分布に基くベイズ推定を繰り返したときの、予測誤差(KL情報量)とWAICを比較しています。

その例では、WAICを使えば84%の確率で予測誤差が小さい事前分布の選択に成功しています。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 16:39:16

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 ベイズ統計では「よく分からないことはサイコロの出目で決まっている」という非現実的な設定を数学的モデルとして採用するのですが、その「サイコロ」を「主観確率」の表現だと解釈して固定してしまっているのが、ベイズ統計は【主観確率に基づく統計分析】だと説明し続けている人達なわけです。

タグ: 統計

posted at 16:32:46

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 数学的モデルはフィクションなので、その内部では非現実的な任意の設定が可能になる。ベイズ統計では「よく分からないものはサイコロの出目で確定させる」という非現実的な設定を採用。

そういう非現実的な設定であっても、現実から得たデータを使った推測に役に立つ所が面白いわけです。

タグ: 統計

posted at 16:25:46

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 東京大学教養学部統計学教室『統計学入門』の、ベイズ統計を

【主観確率に基づく統計分析】

だと説明しているのも論外にひどい。こういう説明が標準的教科書に生き残っていること自体が不思議。

「主観確率」と呼んでいるものの実体は「数学的モデル内部での確率」
twitter.com/genkuroki/stat...

タグ: 統計

posted at 16:22:03

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 続き~のように思うだけで

>自分の主観や信念を事前分布に込めたつもりはない

と感じる可能性が高い。実際のベイズ統計の使い方についても「事前分布は主観や信念を表す」という解説はおかしいと思います。

ベイズ統計入門では主観やら信念やら確信やらの話は単に余計なだけ。

タグ: 統計

posted at 16:15:56

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 実際にベイズ推定を行なってみたことがある人であれば

>事前分布は主観や信念を表す

などと言われても

>真のパラメータ値がよく分からないからテキトーに広がった分布を事前分布として選んだだけなんですが

>計算を楽にするための都合で共役事前分布を選んだだけなんですが

続く

タグ: 統計

posted at 16:15:54

名取宏(なとろむ) @NATROM

19年8月23日

「臨床研究するまでも無い」。韓国で甲状腺がん検診を行い、手術を行ってきた臨床医たちも、そう考えていたんでしょう。とても危険な考え方です。 twitter.com/takeshi_kine/s...

タグ:

posted at 16:11:48

名取宏(なとろむ) @NATROM

19年8月23日

@ma_ko_tan @takeshi_kine @kikumaco 「(甲状腺がん検診に)メリットがある」と主張している人たち(臨床医も含む)は根拠を提示できていません。「4割に外部浸潤がある」「経過観察しながら手術の要不要を治療指針にしている」はなんら根拠にならないことをご理解していただくにはどうすればいいのかを、日々考えています。

タグ:

posted at 15:55:18

名取宏(なとろむ) @NATROM

19年8月23日

@ma_ko_tan @takeshi_kine @kikumaco 甲状腺がん検診にメリットはないか、あってもすごく小さいことを示すことはできますが、それはそれとして、メリットがあると主張する側に立証責任があるんです。

タグ:

posted at 15:52:25

名取宏(なとろむ) @NATROM

19年8月23日

@ma_ko_tan @takeshi_kine @kikumaco 「メリットがあるっていう説明をしていない」のなら幸いです。なにしろ『「メリット有り」は甲状腺検査評価部会の議事録を読めば分かる』『早期発見のメリットは明確です』などというとんでもない誤解をしている人も中にはいるわけですから。

タグ:

posted at 15:44:15

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 我々には道が2つあって、

【ベイズ推定は主観確率を用いて行われている】

という点を強調して(この説明は単純に誤り)先に進む道と、

データに基いて数学的モデルを客観的に評価する方法を統計学(ベイズ統計を含む)は与える

と次世代に伝える道がある。

前者は論外で後者が正しい。

タグ: 統計

posted at 15:30:56

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 汎化誤差の適切な推定量をうまく作って比較するというアイデアは赤池弘次さんが発展させました。それは

データを使って数学的モデルを評価する

という科学のイロハの特別な場合。

タグ: 統計

posted at 15:30:55

名取宏(なとろむ) @NATROM

19年8月23日

@ma_ko_tan @takeshi_kine @kikumaco 福島県については、メリットはないかもしれないけど(不安に対する対策としてなど)検診をやらざるを得ないという事情はあるかもしれません。しかし、証明されていないメリットを「ある」と虚偽説明して検診するのは、インフォームドコンセントの観点からはよくありません。

タグ:

posted at 15:25:26

名取宏(なとろむ) @NATROM

19年8月23日

@ma_ko_tan @takeshi_kine @kikumaco がん検診は長年研究されていますが、「こういうメリットがあるだろう」という見込みで行われて、しかし、実際にはメリットがなかったり、思ったよりずっと小さかったりしたという事例がたくさんあります。

タグ:

posted at 15:23:44

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 ~データに基いて行う方法も考えられているという事実を覆い隠す非常に有害な説明だと思います。

そもそも、ベイズ統計で主観確率は必須じゃないので、その説明は単純に間違っているのですが、間違っている以上に有害。

タグ: 統計

posted at 15:23:26

名取宏(なとろむ) @NATROM

19年8月23日

@ma_ko_tan @takeshi_kine @kikumaco 甲状腺がん検診について、「こういうメリットがある」と主張している先生方はいらっしゃいましたが、本当にそういうメリットがあることは議事録では示されていません。たとえば、「手術侵襲は少ない」と主張されていますが、本当にそうなのかどうかは、臨床研究をやらないとわかりません。

タグ:

posted at 15:22:29

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 学習指導要領解説にある

【ベイズ推定は主観確率を用いて行われている】

という説明の仕方は、ベイズ統計においては、異なる主観が入っている事前分布どうしの優劣や、単なるrandomizerとして導入された事前分布や、それ以前の問題として異なる数学的モデルどうしの優劣を~続く

タグ: 統計

posted at 15:21:14

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 「主観確率」的な考え方では、各主観ごとの意思決定は扱えても、異なる主観のもとでの推測結果の優劣を客観的な基準でつけることはできない。

ベイズ統計であろうがなかろうが、事前分布に主観が含まれていようがいまいが、出て来た推測結果の優劣を何らかの客観的な基準で判定する方法は必須。

タグ: 統計

posted at 15:21:13

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 続き~どちらの推測結果を採用した方が勝ち目が高いかを判断する必要があります。

既出の赤池さんの論説で「主観確率」の件で批判されているSavageの統計的意思決定論はAとBのどちらの推測結果の方がましであるかを客観的に判定する方法を与えません。続く

タグ: 統計

posted at 15:21:12

名取宏(なとろむ) @NATROM

19年8月23日

@takeshi_kine @kikumaco 「早期甲状腺癌の4割に外部浸潤がある」「経過観察しながら手術の要不要を治療指針にしている」ことは、がん検診にメリットがあることをなんら示していないことはご理解しておられますか?

タグ:

posted at 15:14:03

名取宏(なとろむ) @NATROM

19年8月23日

「がん死」の減少という、少数だけど大きな利益があるからこそ、がん検診に伴うさまざまな害が容認されているんです。ただ、この検診に伴う害が認識されにくいので、検診の疫学に不案内な人たち(一般臨床医も含む)は、がん検診に有効性を過大に評価してしまう。

タグ:

posted at 15:11:58

名取宏(なとろむ) @NATROM

19年8月23日

現在、有効とされているがん検診は、すべて、例外なく、広く薄くQOLを下げるという「害」を容認する代わりに、がん死の減少という「利益」を得ている。甲状腺がん検診だけ、例外的に、「がん死は減少しないかもしれないけど、QOLは改善する」なんてことがはたしてありうるだろうか?

タグ:

posted at 15:11:28

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 統計的推測結果を利用するのは個人ではなく集団である場合が多い。そのとき、誰か個人の主観が入った推測結果を集団内でどのように扱うかが問題になります。

例えばAとBのことなる2人が異なる方法、異なる主観に基いて、異なる推測結果を得たとする。

そのとき、集団内でAとBの~続く

タグ: 統計

posted at 15:07:14

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 続き。ベイズ統計であろうがなかろうが、現実の母集団におけるパラメータの真の値は未知ではあるが確定した定数です。そして、現実の母集団からの無作為抽出で得られたデータは、無作為抽出で使った乱数の出目によって変化するものなので、ベイズであろうがなかろうが、データは確率変数です。

タグ: 統計

posted at 15:01:49

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 補足:「頻度主義ではパラメータxは定数で、ベイズではパラメータxは確率変数になる」という説明がひどい理由は、前者の頻度主義でのxは現実の母集団におけるパラメータの真の値(未知だが確定した定数)を意味し、後者のベイズでのxは数学的モデル内部でのパラメータを意味しているからです。続く

タグ: 統計

posted at 15:01:48

名取宏(なとろむ) @NATROM

19年8月23日

「早期発見のメリットは明確だ」などという誤解に基づいて甲状腺がん検診が行われているとするならば、これはインフォームドコンセントに基づいているとはとても言えません。

タグ:

posted at 14:56:45

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 続き~

* ベイズ統計は頻度主義と全く異なる確率の考え方を基礎としている。

というような解説に出会うはずです。これらはことごとく誤りです。添付画像は

watanabe-www.math.dis.titech.ac.jp/users/swatanab...

より。 pic.twitter.com/Xe910mIbQG

タグ: 統計

posted at 14:56:06

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 仮に【ベイズ推定は主観確率を用いて行われている】と教わった高校生がインターネットで検索したとしましょう。すると、

* 頻度主義統計学は客観確率を扱い、ベイズ統計は主観確率を扱う。

* 頻度主義では母数は定数でデータは確率変数だが、ベイズではデータが定数で母数が確率変数になる。

タグ: 統計

posted at 14:55:55

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 学習指導要領解説にある

【ベイズ推定は主観確率を用いて行われている】

は誤り。正しくは

ベイズ推定に主観確率の概念は必須ではない

です。赤池弘次さんが指摘しているように、事前分布は単なるrandomizerであっても問題ない。続く

twitter.com/Ohsaworks/stat...

タグ: 統計

posted at 14:55:53

名取宏(なとろむ) @NATROM

19年8月23日

甲状腺がん検診について、早期発見のメリットは不明確です。がん死亡率の減少はもちろん、QOLが改善するかどうかも不明です。そうした点が十分に情報提供されているかどうか、つまり、きちんとインフォームドコンセントがなされているのかを危惧します。 twitter.com/takeshi_kine/s...

タグ:

posted at 14:55:27

PreBell by So-net @PreBell_JP

19年8月23日

まだメールを打っている途中なのに、間違えて送信しちゃった😥!そんな経験ありませんか?Gmailなら送信取り消しができるよってインターネットネコ😺が教えてくれました😊#インターネットネコ #PreBell

詳しくはこちら!spr.ly/6019E4Jx3 pic.twitter.com/mIx2o5gwPH

タグ: PreBell

posted at 14:34:01

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi #統計 真の分布を与えるパラメーター値が特異でなくても、特異パラメーター集合に近ければ、サンプルサイズが余り大きくなくて「解像度」が高くない段階では「特異モデルの漸近論」による近似が有効になる。

こういうことを知らないと「測度零集合なのに現実で意味あるの?」という質問で潰される。

タグ: 統計

posted at 14:10:40

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi #統計 ~、渡辺澄夫さんの本を読んでもあんまり意味がない。

実際にコンピューターで計算してみると、真の分布をモデルが特異になるパラメーター値に近い値で与えた場合には、有限の余り大きくないサンプルサイズで、近似的に「特異モデルの漸近論」による近似が有効になっていることが分かります。

タグ: 統計

posted at 14:01:52

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi #統計 渡辺澄夫さんの本の売りは「特異モデルの漸近論」。

しかし、モデルが特異になるパラメーター集合が測度零集合になります。現実にはモデルが特異になるパラメーターがぴったり実現することはない。

それにも関わらず、「特異モデルの漸近論」に実用的な価値があることを理解しないと~続く

タグ: 統計

posted at 13:59:05

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi コンピューターを使った具体例の計算の仕方については、須山さんや松浦さんが気前良く見せてくれています。

松浦さんはR+Stanを使ってWAICやWBICを計算する方法まで書いている。

あと、私のツイッターの過去ログを検索しても具体例の計算例が沢山出て来るはずです。

タグ:

posted at 13:55:59

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi 渡辺澄夫さんの本の内容を普通「理解している」ためには単に「証明が追えた」だけでは論外で、「具体例をそれなりに知っている」必要あり。(判定は計算に使ったコードを出せるかどうかで可能)

実際にそうなっていれば、ググって出て来た話も渡辺さんの本の路線で再解釈可能なはず。

タグ:

posted at 13:51:35

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi ベイズ統計入門として、私がよく勧めて来たのは

* 渡辺澄夫さんの本とウェブサイト
watanabe-www.math.dis.titech.ac.jp/users/swatanab...

* 須山敦志さんの本とブログ
machine-learning.hatenablog.com

* 松浦健太郎さんの本とブログ
statmodeling.hatenablog.com/archive

* 具体例の計算をコンピューターで十分にやらないと理解は無理。

タグ:

posted at 13:45:03

@kuri_kurita

19年8月23日

@hayashi_r ほんの一瞬だけ。😅
すぐにバトルに移行します。

タグ:

posted at 13:41:11

非公開

タグ:

posted at xx:xx:xx

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月23日

あと具体的な計算は多次元正規分布の二乗期待値が計算できれば進めるのでつまづいたら3章冒頭の公式集を自分でもう一回導出すると良い。

3章はそんなに誤植なかった気がするがこのテキストの論理・導出順序が必ずしも最適でないので自分で計算して整理すると良い。(当たり前であるが)

タグ:

posted at 13:01:24

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月23日

渡辺ベイズに出てくる∇の冪付き演算子はテイラー展開(本では平均値の定理と呼ぶ)の係数を表しているとみなすと良い。この本の中ではそれが自然。

タグ:

posted at 12:56:18

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月23日

私3章の発表者じゃないから、計算は埋めたけど。ノート適当なんだよなぁ。

タグ:

posted at 12:51:41

Hiroo Yamagata @hiyori13

19年8月23日

マイクロプラスチック、これまで何一つ被害も影響も観測されていないのに「たくさんあるからまずいかもー」と言い続け、影響ないからという報告が出てきたら「まだ何もわかっていない云々」って、火のないところに煙をたてる気満々だな、BBC(それ以外のエコ団体も)
www.bbc.com/japanese/49430...

タグ:

posted at 11:42:16

カイヤン @389jan

19年8月23日

代数幾何と学習理論は漸近論構築だけでなく学習係数・実対数閾値を実際に求めてみるときに必要な話なのに対して、ベイズ統計の理論と方法では漸近論構築とWAIC導出に必要な話が四章までは書いてある。前者ではイデアルの議論は不可避だが後者の範囲では標準形作るために特異点解消を認めればよいだけ。

タグ:

posted at 09:49:24

カイヤン @389jan

19年8月23日

代数幾何と学習理論だと、学習の問題提起→必要な数学の概説→学習理論、という構成なので(中身の読みやすさと難度はともかく)一つの話題に絞ってるとは思う。
読みやすさと新しさ的にはベイズ統計の理論と方法の方がいいと思う。

タグ:

posted at 09:46:30

カイヤン @389jan

19年8月23日

四章までの目的意識は完全にこれだが、五章ではMCMCと変分推論について軽く触れて、六章では最小自乗損失を使った回帰やLOOCVについての話など、それぞれ別のトピックを扱ってるのが迷子になる人が出てくる理由なのかしら。

タグ:

posted at 09:43:52

非公開

タグ:

posted at xx:xx:xx

カイヤン @389jan

19年8月23日

何がしたいのかわからないってのも妙で、事後分布・予測分布作ったときに自由エネルギー、汎化損失、経験損失がどのような挙動になるのかを調べていて、なぜこれらの量を考えるのかもKLdiv認めればわかるように書いてあるのだが。

タグ:

posted at 09:37:34

カイヤン @389jan

19年8月23日

ベイズ本、エクセルの最小自乗法関数使った分析しかやったことなくても問題なく読めたんだがそんなにわかりにくいか? と思ったが先に代数幾何と学習理論を斜め読みしてたんだった

タグ:

posted at 09:35:53

非公開

タグ:

posted at xx:xx:xx

ケアネットの犬コム太《公式》 @mch_carenet

19年8月23日

【タミフル異常行動問題に決着】

10年以上にわたる追跡調査の結果、「異常行動はタミフルではなくインフルエンザの症状である」という結論が出されたわん。

添付文書からも、10代の使用制限は解除されたわん
www.carenet.com/report/yorozu/...
pic.twitter.com/DI7uE6tFpt

タグ:

posted at 07:55:54

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#数楽 合っていると思う。

さらに特異点解消後の積分を直接計算すれば、ゼータ函数を経由する議論も消せて大学1年生レベルの計算で処理できると思う(上述)。

twitter.com/nan_makersstat...

タグ: 数楽

posted at 07:55:27

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi ベイズ統計について真っ当なことをブログなどに書いている人達もいて、私は参考にしています。

解説では「客観確率vs.主観確率」的なおかしなことを書いていても、実践的には面白くて真っ当なことをやっている人も沢山いる。

眼力が問われる世界

タグ:

posted at 07:39:19

Space Explorer Mike @MichaelGalanin

19年8月23日

Full rotation of the Moon.
Credit: NASA pic.twitter.com/rbQ9nx7IGa

タグ:

posted at 07:25:31

〈 Berger | Dillon 〉 @InertialObservr

19年8月23日

I always find it amazing how such simple rules can yield such beautifully complex regions

The Mandelbrot Set is the set of all a∈ ℂ such that the sequence S⁽ⁿ⁾=|fₐ⁽ⁿ⁾(0)| does not diverge as n→∞

• fₐ(z) = z² +a
• fₐ⁽ⁿ⁾(0) = fₐ(fₐ( ..fₐ(0) )) (n times) pic.twitter.com/qXJwXLvpQC

タグ:

posted at 06:59:18

松浦 健太郎 @hankagosa

19年8月23日

A/Bテストで利益を最大化するために、過去データに階層モデルを使った例。 twitter.com/mcmc_stan/stat...

タグ:

posted at 06:43:12

松浦 健太郎 @hankagosa

19年8月23日

Chronikis(クロニーキースと発音)、adobeでメンテされている時系列モデリング専門の確率的プログラミング言語らしい。すごいもん作るなぁ。 twitter.com/mcmc_stan/stat...

タグ:

posted at 06:41:41

アマナ @amananama

19年8月23日

t=20の時は分散が20になるから、95%信頼区間は±1.96×2√5でだいたい4×2.236で±9ってところかな……まぁ概ねそうなってますね pic.twitter.com/5FOGjUgSBR

タグ:

posted at 05:50:01

アマナ @amananama

19年8月23日

何となくブラウン運動 pic.twitter.com/nHEPjciisa

タグ:

posted at 05:42:56

Massimo @Rainmaker1973

19年8月23日

In the village of Nashtifan, Iran, some of the oldest windmills in the world, with what may be the earliest windmill design in the world, still spin. Made of natural clay, straw, and wood, they have been milling grain for flour for an estimated 1,000 years buff.ly/2zeGJTz pic.twitter.com/ukkfwiNOrx

タグ:

posted at 05:15:23

victoria shen @EvicShen

19年8月23日

Millipede Shadow!

ヤスデの影 😍 pic.twitter.com/uYMMoGkhF0

タグ:

posted at 04:20:18

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi 「事後確率の最頻値」を求めることをベイズ推定だと誤解している人達は沢山いますね。それMAP推定。もしくは正則化項を入りの学習。

不合理でおかしな考え方をしている人達のベイズ統計について知りたいのか、もっと真っ当な話を知りたいのか?それが最初に決めるべき問題。

タグ:

posted at 02:59:32

尾上正人 @9w9w9w92

19年8月23日

「うまく機能している制度というものはたいがい、このようなヒト特有のステータス心理を、思いがけない方法で、引き出したり抑えたりしているものだ」210頁
好例として、年少者から発言するユダヤの「サンヘドリン」…山本七平が「全員一致は無効」とデタラメ書いて浅見定雄にボコされたサンヘドリンw

タグ:

posted at 02:20:26

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi 例えば、「大学入試でも丸をもらえるような合理的な確率の計算であることがすぐにわかる例」として、モンティ・ホール問題があります。

モンティ・ホール問題へのベイズの定理の適用は、ベイズ統計の話ではない。

単に真の確率分布のもとで真の確率を計算しただけ。実際、勝率は2/3になります。

タグ:

posted at 01:47:07

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 訂正

❌「n-1項分布」→⭕️「n項分布」

n=rc項分布のパラメータはp_{11},p{12},…,p_{r,c-1}のrc-1個。p_{rc}は1からそれらを引けば得られる。

独立性を満たす分布のパラメータはp_1,…,p_{r-1}, q_1,…,q_{c-1}の(r-1)+(c-1)個。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 01:41:39

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi よく分からないうちは「大学入試でマルをもらえるような合理的な確率の計算をやっていることがすぐに分かる場合は、ベイズ統計の話になってない」と思っておけば良いと思います。

「え?どうしてそんなことをしても合理的だと言えるの?」という話になっていなければベイズ統計の話ではない。

タグ:

posted at 01:36:16

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi 私が合理的だと思っているベイズ統計でも、「主観確率」を扱っているらしい「ベイズ統計」でも、結構大胆なことをやっています。

現実世界と一致するはずがない数学的設定とデータを使って推定を行う。

計算に必要な真の確率分布が全部見えているというようなクリアな設定にはなっていないです!

タグ:

posted at 01:28:29

クッキー @CookieBox26

19年8月23日

「ベイズ統計の理論と方法」の特異点解消定理の登場シーンだけかいたスライドです(流し読みなのでおかしい点があったら教えてください
github.com/CookieBox26/To...

タグ:

posted at 01:22:23

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi さらに、後の方のリンク先の内容は、ベイズの定理を用いて(仮想的な設定内での)真の確率分布を使って真の確率を求めているだけであり、未知の確率分布に関する真のベイズ推定を行なってはいません。

真の確率分布が既知なら何も推定することはなくて、単なる計算問題になります。

タグ:

posted at 01:19:07

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi そっちはさっきのと違うページ。

タグ:

posted at 01:14:57

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi 渡辺澄夫『ベイズ統計の理論と方法』の最大の欠点は、具体例の計算の紹介が余りにも少ないこと。

読者は自分でコンピューターを回して具体例を計算する必要がある。

そういうことをやっていない人がこの本の内容を理解していないと断言できます。

証明と手計算だけでは感じがつかめない。

タグ:

posted at 01:14:22

黒木玄 Gen Kuroki @genkuroki

19年8月23日

@coJJyMAN @subarusatosi ベイズ統計とベイズの定理は違う話です。

ベイズの定理は条件付き確率の定義の自明な書き直しに過ぎません。条件付き確率が出てくるケースの多くで(ベイズ統計やら「主観確率」とは無関係に)使える自明な定理。

タグ:

posted at 01:10:17

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#Jupyter

【Remove Python 2.x support in favor of Python 3.5 and higher】

Python 2.xを使っていると小2開発者に馬鹿にされます。 twitter.com/lresende1975/s...

タグ: Jupyter

posted at 01:00:28

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計学 続き~のようなことを知らないと困ると思います。

そういう実用時の誤りを防ぐための教養として重要な部分について、ミスリーディングであったり、本質的に間違ったことが、教科書に書いてあるわけです。

どうして「教科書ひどすぎ!」という声が上がらないのか?

それが不思議。

タグ: 統計学

posted at 00:37:54

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 実用的に

* Fisher検定は正確ではない。

* ベイズ統計では普通「主観確率」なるものを扱っていない。

* 最小二乗法は正規分布モデルであり、最良とは限らない。

* 95%信頼区間の計算に用いた数学的モデルが現実を適切に近似していなければ、「95%」という数値を現実には適用できない。

タグ: 統計

posted at 00:37:51

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 東京大学教養学部統計学教室編『統計学入門』関連

私は「統計学入門のためのよい教科書を知らないか?」と質問されても、「知らない」と答えざるを得ないと思っています。

理由は以上で示した引用を見れば想像できると思う。

引用した教科書だけの問題ではない。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 00:28:30

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 本当は全てを固定できないはずの周辺度数を全て固定して良いかのような誤解をしてしまうと、「2×2の分割表でのFisher検定は正確であり、χ²検定はFisher検定の近似に過ぎない」というような酷い誤解をすることになります。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 00:24:35

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 漸近的に出て来るχ²分布の自由度はWilks' theoremによって得られます。例えば、nのみが固定されているとき、n-1項分布のパラメータ数はn-1=rc-1で、独立性を満たす分布に入るパラメータ数は(r-1)+(c-1)になり、それらの差(rc-1)-(r-1)-(c-1)=(r-1)(c-1)が出て来るχ²分布の自由度になります。

タグ: 統計

posted at 00:24:34

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 おそらく、「自由度は(r-1)(c-1)」と言いたい理由は、r×cの分割表におけるピアソンのχ²統計量が漸近的に自由度(r-1)(c-1)のχ²分布に従うという事実を使うときの、「自由度(r-1)(c-1)」の由来を説明したいからです。

しかし、その説明を周辺度数を全て固定することによって行うのは誤り。

タグ: 統計

posted at 00:24:34

黒木玄 Gen Kuroki @genkuroki

19年8月23日

#統計 添付画像は、東京大学教養学部統計学教室編『統計学入門』より。

現実のデータに関するr×cの分割表の自由度を、周辺度数を全て固定することによって、(r-1)(c-1)だと主張することは、ひどく間違った議論。

現実の調査で周辺度数を全て固定することは普通は不可能。

twitter.com/genkuroki/stat... pic.twitter.com/tuMkG4gShZ

タグ: 統計

posted at 00:24:33

H. Miyoshi (ALC Japa @metaphusika

19年8月23日

確実に持っているけれど本の山から取り出せなくて(取り出すには引っ越し並みの肉体労働が必要)仕方なく買いなおしたことはあるなあ。

タグ:

posted at 00:14:10

村田雄介 @NEBU_KURO

19年8月23日

となジャン版ワンパンマン、最新話更新されました。ぜひ! tonarinoyj.jp/episode/108341...

タグ:

posted at 00:01:47

パーセプトロンくん @Lc5Gaj

19年8月23日

RMarkdown使いづかったのでJupyter NotebookからR呼び出したら最高に使いやすくなった

タグ:

posted at 00:00:02

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました