黒木玄 Gen Kuroki(@genkuroki)/Page 1399

社会保険料は個人も企業も大変な負担なんですよ。こういう隠れた税金を不況時に負担軽減すれば確実な景気対策になる。所得税を払ってない方も保険料は負担しているケースも多い。だが日本の役人は絶対に減税はしない。自分達に全く利がないから。

タグ：

posted at 23:46:13

#統計東京大学教養学部統計学教室編『統計学入門』関連

twitter.com/genkuroki/stat...

タグ：統計

posted at 23:24:37

#統計以下の前後とか

twitter.com/genkuroki/stat...

タグ：統計

posted at 23:21:15

#統計このスレッドの上の方も見た方が良いかも。

twitter.com/fzw1212/status...

タグ：統計

posted at 23:20:31

非公開

タグ：

posted at xx:xx:xx

#統計分割表の独立性のカイ二乗検定で使うカイ二乗分布の自由度が決まる仕組みに関するデタラメな説明を扱っているのは以下のリンク先。

正しくはWilks' theoremを使う。

twitter.com/genkuroki/stat...

タグ：統計

posted at 23:14:55

流石♬ ポニョだけにノーチラス号でネモとは！ twitter.com/mathsorcerer/s...

タグ：

posted at 23:13:00

#統計統計の専門家であればWilks' theoremを当然知っていないとおかしいので、この誤りは解せない。

ここでは引用しないが、この誤りは他の教科書でも共通していた。英語の教科書でも間違っていたりする。

2×2の分割表でのFisher検定は自明な理由で正確ではない。

twitter.com/genkuroki/stat...

タグ：統計

posted at 23:11:56

#統計多分、テクニカルなことを色々知っていないと、何がどう問題なのか特にわかりにくいのが、以下のリンク先の話題(既出)。

分割表の独立性について、ピアソンのカイ二乗統計量を使ったカイ二乗検定を行うときのカイ二乗分布の自由度が決まる仕組みの説明の誤り。

twitter.com/genkuroki/stat...

タグ：統計

posted at 23:09:11

非公開

タグ：

posted at xx:xx:xx

#統計関連

twitter.com/genkuroki/stat...

タグ：統計

posted at 23:05:52

#統計東京大学教養学部統計学教室編『統計学入門』の初版は1991年出版なのですが、サベジの「主観確率」などを批判した赤池弘次さんの論説はその10年以上前の1980年。

1970年代には「主義に基く統計学」観ではダメだということになっていたのではないか？

twitter.com/genkuroki/stat...

タグ：統計

posted at 22:37:14

桑満おさむ @kuwamitsuosamu

このような結果が出たら、ワクチンを接種しないという理由が見当たらない。 www.afpbb.com/articles/-/324...

タグ：

posted at 22:37:12

議論対象のトピックと関係のないことにはできるだけ言及しない、という慣習が欲しいですね。そういうトレーニングを十分にしていただければ、ネットの空気感も随分良い方向に向かうのではないかと思います。

タグ：

posted at 22:36:34

あと、この種のピュアに学問的なトピックで、たんたん/粛々と感情を出さずに議論できる、ということがとても大切ですよね。そういうことも、「論理国語」や「実用国語」でしっかりトレーニングしていただきたいところ。

タグ：

posted at 22:34:28

#統計このスレッドで批判をまとめている

東京大学教養学部統計学教室編『統計学入門』

の執筆者と版は添付画像の通り。

本書の執筆者

松原望
縄田和満
中井検裕

1991年7月10日初版
2018年10月15日第40刷 pic.twitter.com/pdpebBS891

タグ：統計

posted at 22:32:20

これ、そんなに難しいですかね...😨
しかし、この問題、日本の中学生の国語力が驚くほど低いことのエビデンスの一つとして、あちこちで紹介されているようなのですが、これまで誰もこの点を指摘していないようだ、というのが驚き。「論理国語」の必要性を示すエビデンスにはなってますね...。

タグ：

posted at 22:29:40

#統計東京大学教養学部統計学教室編『統計学入門』関連スレッド↓

twitter.com/genkuroki/stat...

タグ：統計

posted at 22:27:18

#統計そうなんです。私が購入した

東京大学教養学部統計学教室編『統計学入門』

は初版1991年、第40刷2018年です。最近、批判するためにわざわざ購入した。

背景の理屈を初心者が正しく再構成できるほど詳しく書かれて__いない__ので、情報の密度は結構高い。

twitter.com/tomoak1n/statu...

タグ：統計

posted at 22:22:08

つまり、このような理解をする場合、この新井紀子先生のリーディングスキルテストの設問で正答とされる回答は、不適切、ということになると考えられるわけです。

タグ：

posted at 22:21:52

「ネコは動物である」といったとき、「動物はネコである」とはいえないし、
「ハルは春子の愛称である」といったとき、「春子の愛称はハルである」とはいえない。ですので、
「AlexはAlexandraの愛称である」といったとき、
「Alexandraの愛称はAlexである」とはいえない、
と考えるということですね。

タグ：

posted at 22:19:51

「AはBである」といったとき、日常的な言葉の使い方としては、「A=B（AとBは等しい）」ことを指す場合は少なく、ほとんどの場合は「A ∈ B（AはBの要素である）」を意味する、と。で、後者の場合であれば、
「BはAである」と言えないわけです。 twitter.com/tsuyomiyakawa/...

タグ：

posted at 22:17:04

TN @tomoak1n

@genkuroki ちなみに、その本は、1991年に発行されたきり、改訂されていないんですね。28年前！

タグ：

posted at 22:13:10

それはもうすでにやってる。でもあれはどう見ても確率の話でほぼ皆が納得してヘーホーしてくれるけど到底統計の話にはならない。いや，統計を取って調査することは大事だよねという話にはなるのだけれど。 twitter.com/genkuroki/stat...

タグ：

posted at 22:11:21

Nemo.jlでの
((GF(17^11)[y])/(y^3 +3xy +1))[z] という複雑な環の計算方法とその他のフレームワークでのベンチマーク結果

画像は Nemo/Hecke: Computer Algebra and Number Theory Packages for the Julia Programming Language
arxiv.org/pdf/1705.06134...
から引用 pic.twitter.com/YCgIIDI9Nb

タグ：

posted at 22:01:53

matsumatsu @matsumatsu1977

竜王戦挑戦者決定戦第2局は、
木村九段が勝利。
豊島名人とともに1勝1敗とはり、竜王挑戦権は9/5(木)の第3局にもつれ込みました。

木村九段、だいぶ劣勢でしたが豊島名人がまさかの失速で「千駄ヶ谷の受け師」の本領発揮で守りきりました。

いやー、これで本当に分からなくなった。 pic.twitter.com/AD7IUtB8Au

タグ：

posted at 21:51:45

結城浩 / Hiroshi Yuki @hyuki

#今日のProcessing
#つぶやきProcessing
マウスカーソルの横方向の位置に応じてN角形を作るというもの。triangleの練習として作りました。
gist.github.com/hyuki/f2f73687... pic.twitter.com/pJLW7Fwie9

タグ：つぶやきProcessing 今日のProcessing

posted at 21:39:42

@tsatie 「ベイズの定理」なるものがこの世に存在しないかのように考えた方が「ベイズの定理」についても理解が深まる(笑)

タグ：

posted at 21:33:12

@tsatie ベイズの定理はそのままだと直観的把握が難しく、「ありうる全パターンをどのように制限しているか」を何度も繰り返し考えた経験がないと、「機械的に公式を使うだけ」で好ましい感じの直観的な理解に至らないと思う。

タグ：

posted at 21:28:35

@tsatie まさにそれ！

ベイズ統計の仕組みも、ベイズ推測のために準備した数学的モデル内部での、あるうるパターンを全部イメージして、モデル内で偶然に現実に得られたのと同じサンプルが得られた様子を考えることによっても理解できます。その場合にはベイズの定理は使わない。

twitter.com/kikumaco/statu...

タグ：

posted at 21:25:05

K2Da @K2Da

「アレクサ、awsの障害ってなに？」ときいてみたが「すみません、わかりませんでした」とのことだった。わかるようにしておいてほしい

タグ：

posted at 21:24:34

@eman1972 #数楽

◻︎◻︎⊗◻︎◻︎

= ◻︎◻︎◻︎◻︎

+ ◻︎◻︎◻︎
◻︎

+ ◻︎◻︎
◻︎◻︎

= ◻︎◻︎◻︎◻︎
+ ◻︎◻︎
+ ∅

タグ：数楽

posted at 21:15:58

@eman1972 #数楽ああ、なるほど。「テトリスルール」を適用する前の図ですね。SU(2), sl(2)の表現論では、2個縦に揃ったら消えるという「テトリスルール」で

◻︎◻︎◻︎
◻︎

は左端が消えて

◻︎◻︎

に等しく、

◻︎◻︎
◻︎◻︎

は全部消えて

∅

に等しくなります。続く

twitter.com/kantu_tarmi/st...

タグ：数楽

posted at 21:13:37

@tsatie 「〇〇〇の定理」(〇〇〇は有名になっている人の名前、例えば「ベイズ」)のような名前が付けられてしまうと、しっかり教えなければいけないかのようなプレッシャーが生じる。

それが原因で不適切な教え方になってしまっている場合は結構多いと思う。

数学では大抵のことは定義に戻れば何とかなる。

タグ：

posted at 21:08:26

⸘ @kantu_tarmi

@eman1972 @genkuroki 度々すみません。
すでにお気づきだったら恐縮ですが、画像で図形の下に書いている数字は、Young図から出る次元dではなく、スピン（d=2s+1のs）ですね。

タグ：

posted at 21:06:21

@tsatie ベイズの定理を教えることにこだわらず、条件付き確率の定義に戻って直感的な把握ができるようになることの重要性を強調した方が真っ当な教え方になる可能性が高いと思う。

ベイズ統計も条件付き確率分布の定義に戻って理解可能です。(ベイズの定理を直接使わないベイズ統計！)

タグ：

posted at 21:05:05

@tsatie あと以前見た統計教育の論説(見失った)には、臨床検査での偽陽性の確率をベイズの定理を使って求めさせる教え方よりも、全事象を考慮することを経由して条件付き確率の定義に戻って求めさせた方がうまく行くという話が書いてあったと思う。

タグ：

posted at 21:03:02

S.Kataoka @SKataoka44

「主観確率」とかの用語はそのまま「確率」でいい

タグ：

posted at 20:55:45

⸘ @kantu_tarmi

@eman1972 @genkuroki 外から失礼します。
画像のYoungタブローを、次のように表現させて下さい。
[2]×[2]=[4]+[3,1]+[2,2]
箱の個数を上の列から順番に並べた記法です。
SU(2)の時は[1]の次元が2ですが、この場合[n,m]の次元が[n-m]の次元と等しい事が言えます。「SU(2)で一直線型しか見ない」のはこのためだと思います。

タグ：

posted at 20:55:29

@tsatie 「現実で実用的であること」の判定基準としては「お金を賭けるギャンブルで役に立つかどうか」を採用すればよいと思っています。

タグ：

posted at 20:54:48

あ〜る菊池誠(反緊縮)公式 @kikumaco

@tsatie これは個人的な意見なのですが、科学や技術関係で確率について説明するときには「頻度主義」「ベイズ主義」「客観確率」「主観確率」などなどのジャーゴンは排除する方が妥当だと思います。

タグ：

posted at 20:50:11

モンティホール問題は全列挙すれば分かる単純な確率の問題なのに、どうしてあれをベイズの定理だの主観確率だので説明しようとしたがるのか理解できません。あるうるパターンを全部書き下してみればいいだけですよ twitter.com/genkuroki/stat...

タグ：

posted at 20:49:04

⛩️ksg城⛩️ @enihsoknes

@genkuroki この本の著者の松原望さんって
小島寛之さんの師匠だったはずなのでなんか納得

おすすめする人が多くて読みたかったのに残念

タグ：

posted at 20:47:40

@tsatie ウィキペディア
ja.wikipedia.org/wiki/%E3%83%A2...
【モンティ・ホール問題～とは、確率論の問題で、ベイズの定理における事後確率、あるいは主観確率の例題の一つ】

とやはり「主観確率」とある。

モンティ・ホール問題での確率は確率が絡むと勝負事をやっていれば出会う典型的な確率なのに「主観確率」。

タグ：

posted at 20:44:19

@tsatie 自分で正しく合理的に定式化した方が容易なのでわざわざ調べたりしていないのですが、「主観確率」だけではなく「頻度主義」というのも極論に走ったかなり怪しげな考え方っぽい感じ。

* 数学的に明瞭に定式化可能
* その定式化が現実で実用的

であれば「主義」にこだわる意味はないと思う。

タグ：

posted at 20:33:19

主観確率って何？

タグ：

posted at 20:28:22

Ninja DAO | CryptoNi @CryptoNlnjaNFT

@triwave33 計算グラフを伝搬させるように型を伝搬させることができればいいという理解でいます．

タグ：

posted at 20:10:03

これはあかんやつや。 twitter.com/hellopolicy/st...

タグ：

posted at 20:02:19

Khovtoliv @Khovtoliv

旧日本軍の敗因を分析した『失敗の本質』のおもしろいところは、ベストセラー当時読んでいた連中が今や経営者になって全く同じ失敗をしているところだぞ。いったい何を学んだのか。

タグ：

posted at 19:54:29

おばけ @triwave33

@MathSorcerer 型はよくわかってないですね…黒木さんがツイートされてるのしっかり追ってみようかなと思います

タグ：

posted at 19:38:17

#統計一般に、確率分布Qを確率分布Pで予測する場合の予測誤差としてのKL情報量は予測分布Pの台が確率分布Qの台を含んでいる必要あり。

実際には起こらないケースも許容する分布を予測分布にしないと予測誤差が∞になってしまう危険性が増す。KL情報量による予測誤差の定義はこういう意味で保守的。

タグ：統計

posted at 18:54:28

#統計要するに、予測誤差をKL情報量で定義する立場では、99%の確率で起こることを100%起こると予想することは、予測誤差∞の許されない予測だということになります。

これを見ただけでも、KL情報量に関する知識が基本的な素養であることがわかります。

タグ：統計

posted at 18:48:56

#統計一般に真の確率が「確率qでA、確率1-qでB」であるとき、予測確率「確率pでA、確率1-pでB」のKL情報量で定義された予測誤差は

KL(q,p)
= q log(q/p)
+ (1-q)log((1-q)/(1-p))

になります。q=0.99, p=1ならば

KL(1, 0.99)=∞.

予測誤差が∞！

タグ：統計

posted at 18:44:33

Twitterをみるとベイズといえば渡辺ベイズだけれど
Webをみるとと渡辺ベイズとは思えないベイズを読んでいる感があるのでTwitter民および私が読んでいる本は別世界の本なんじゃないかと不安になる．

タグ：

posted at 18:39:27

#統計 99%の確率でAになるので、「常にAになる」という予測は99%の確率で当たります。この99%を予測精度の高さと定義すると、予測精度は非常に高いことになっていしまい、残りの1%を無視したくない場合には不適切な定義になります。続く

タグ：統計

posted at 18:37:41

#統計予測誤差をKL情報量で定義することの価値は、真の確率が「99%でAになり1%でBになる」であるとき、「常にAになる」という間違った予測の精度をどのように定義すれば良さそうかを考えても少しわかります。続く

タグ：統計

posted at 18:37:39

天むす名古屋 Temmus @temmusu_n

@triwave33 条件によって戻り値の型が異なるとよろしくない
というのはありますね．（JITコンパイルに優しくない意味で）

function f(x):
if x>0
return 1.
else
return 0
end
end

的なのはありますね．

タグ：

posted at 18:34:19

天むす名古屋 Temmus @temmusu_n

#超算数学年が上がるごとにどの課題も成績が向上するが、3年生でも正解率はそれぞれ、95.3%、96%、96% (330人のうち)。最低の正解率は1年生の正方形等分。323人の74.2%だった。リンゴを6個図示し半分を問う問題では、1年の53.0%、2年の58.0% (311人)、3年の57.6%が正解。

タグ：超算数

posted at 18:33:06

天むす名古屋 Temmus @temmusu_n

#超算数この調査は分数概念の発達を調査した。1〜3年生に課されたテストに、図形を半分にする課題がある。円、正方形、
およそ1×2の横置き長方形を図示し【したのえにせんをひいてはんぶんにしなさい。】と指示した。円は中心、正方形、長方形は各辺の中点に点が打たれている。

タグ：超算数

posted at 18:26:07

#超算数『ケーキの切れない非行少年たち』には書いてあるのかもしれないが、ケーキを等分する以前の課題が結構難しいという結果が戦後すぐの調査で出ている。
神奈川県教育研究所編『数理概念の発達段階の調査』研究叢書第2巻横浜、神奈川県教育研究所、1952年。
小学校全学年が対象。日時不明。

タグ：超算数

posted at 18:26:06

おばけ @triwave33

julia、How toよりもアンチパターン(べからず集)が見たいなぁ
#julialang

タグ： julialang

posted at 18:25:33

@genkuroki 主観確率ってのが気になってWikipediaを繰ったら項目があり「ところがこのように後になってから前の事実を推測する確率（後の結果を条件とする前の事実についての条件付き確率つまり事後確率）も頻度主義から見れば一種の主観確率である。」とあり頭を抱えている。何それ？

タグ：

posted at 18:23:23

#統計統計学ど素人の私の勝手な想像なのですが、

ベイズ統計は【主観確率に基づく統計分析】である

などと解説する人達は真っ当な考え方をできていないことを自覚できていない、と専門家であれば当然考えているのではないでしょうか？

専門的な話と一般向けの解説のギャップが大き過ぎ。

タグ：統計

posted at 18:05:53

#統計非常に単純なモデルでは最尤法でやってもベイズ法でやっても結果に大した違いはありません。

ベイズ特有の利点を説明したければある程度以上複雑なモデルを例に使う必要がある。

こういう話と、ベイズ統計は【主観確率に基づく統計分析】だと説明すること(誤り)の違いは余りにも大きい。

タグ：統計

posted at 18:02:27

#統計以下のリンク先は同様のことの「頻度主義」版です。最尤法で繰り返し推定して、予測精度とAICを比較。

上で紹介したベイズ&WAICの場合のプロットと、以下のリンク先の最尤法&AICのプロットはほぼ同じ。

これ、単純な正規分布モデルなので違いがほとんど出ない。

twitter.com/genkuroki/stat...

タグ：統計

posted at 18:02:25

砂___の___女 @vecchio_ciao

次男が思い出してくれた！
なんて親孝行なの！！ twitter.com/vecchio_ciao/s...

タグ：

posted at 17:51:27

#統計以下のリンク先のように、事前分布がどのように選ばれていようと(主観を入れてもよいし、計算の都合で選んでもよい)、WAICのような情報量規準を計算することによって、どちらの推定結果の予測精度が高いかをそれなりに高い確率で当てることができる場合があります。

twitter.com/genkuroki/stat...

タグ：統計

posted at 17:47:50

広江克彦 @eman1972

@genkuroki ありがとうございます！これについて悩むのはやめて安心して先へ進むことにします。

タグ：

posted at 17:45:37

@eman1972 #数楽 SU(2)の有限次元既約表現=sl(2)の有限次元既約表現

で対応するYoung図形は「一直線型」で「2列」になったりはしません。そこの時点で理解できない。というわけでよくわかりません。

SU(2)の3次元表現とそれ自身のテンソル積は

3×3 = 5 + 3 + 1

と既約分解(数字は既約表現の次元)。

タグ：数楽

posted at 17:42:30

小嶋徹也 @coJJyMAN

いったい、いつからおかしな話がまかり通るようになってしまったのだろう？🤔

タグ：

posted at 17:32:26

小嶋徹也 @coJJyMAN

一番、大事なところだと思います。「そもそも、ベイズ統計で主観確率は必須じゃない」 twitter.com/genkuroki/stat...

タグ：

posted at 17:32:25

広江克彦 @eman1972

@genkuroki スピン1とスピン1の合成で次のような説明図を見たのですが、右辺で黒のボックスを2分割して良い理由は何でしょうか？SU(2)の話をしているところにSO(3)であるスピン1を持ってきて無理な説明をしているのだろうかと疑っているところなのですけど。 pic.twitter.com/gT7xgnZaK1

タグ：

posted at 17:28:49

WIRED.jp @wired_jp

垂直跳びから目の前に置かれた物に飛び乗る「ボックスジャンプ」と呼ばれる競技で、160cm以上の世界記録をもつ男がいる。彼はいったい、なぜこんな記録を出せるのか？（アーカイヴ記事）bit.ly/2yR85Pb

タグ：

posted at 17:15:01

#数楽もうちょっと「高級」な使い方が

佐武一郎『線型代数学』

にある。置換群S_rと一般線型群GL_nのあいだの関係(Weylの双対性)。このような結果のアフィンLie環版については、長谷川浩司氏の仕事が専門家のあいだでは結構有名だと思う。長谷川論文にもYoung図形の図があります。 pic.twitter.com/fuBNFKQoTi

タグ：数楽

posted at 17:03:17

#数楽表現論とYoung図形の関係で易しいのは、GL_n, U(n), SL_n, SU(n) の有限次元既約表現のhighest weight (dominant integral weight)とYoung図形を対応付けることです。

GL, U と SL, SU での違いは「テトリスルール」(一段揃ったら消える)です。続く

twitter.com/eman1972/statu...

タグ：数楽

posted at 17:03:14

がんの統計学（疫学）を医師も理解していない。アメリカ合衆国のプライマリケア医に、がん検診の疫学の問題を出したところ、半分以上が間違えた。完全正解はもっと少ない[ www.ncbi.nlm.nih.gov/pubmed/22393129 ]。間違った医師たちも、「臨床研究するまでもない」と考えていたんでしょうね。

タグ：

posted at 16:58:22

Kazuya Gokita @kazoo04

京都の人に「そのモデル精度高いですね」って言われたらそれ過学習してるぞって意味

タグ：

posted at 16:50:07

あかげふ(/・ω・)/にゃー！ @juvenile_crimes

#統計関連

以下のリンク先のプロットでは、異なる事前分布に基くベイズ推定を繰り返したときの、予測誤差(KL情報量)とWAICを比較しています。

その例では、WAICを使えば84%の確率で予測誤差が小さい事前分布の選択に成功しています。

twitter.com/genkuroki/stat...

タグ：統計

posted at 16:39:16

twitter.com/Paul_Painleve/...

タグ：

posted at 16:37:38

#統計ベイズ統計では「よく分からないことはサイコロの出目で決まっている」という非現実的な設定を数学的モデルとして採用するのですが、その「サイコロ」を「主観確率」の表現だと解釈して固定してしまっているのが、ベイズ統計は【主観確率に基づく統計分析】だと説明し続けている人達なわけです。

タグ：統計

posted at 16:32:46

#統計数学的モデルはフィクションなので、その内部では非現実的な任意の設定が可能になる。ベイズ統計では「よく分からないものはサイコロの出目で確定させる」という非現実的な設定を採用。

そういう非現実的な設定であっても、現実から得たデータを使った推測に役に立つ所が面白いわけです。

タグ：統計

posted at 16:25:46

#統計東京大学教養学部統計学教室『統計学入門』の、ベイズ統計を

【主観確率に基づく統計分析】

だと説明しているのも論外にひどい。こういう説明が標準的教科書に生き残っていること自体が不思議。

「主観確率」と呼んでいるものの実体は「数学的モデル内部での確率」
twitter.com/genkuroki/stat...

タグ：統計

posted at 16:22:03

#統計続き～のように思うだけで

＞自分の主観や信念を事前分布に込めたつもりはない

と感じる可能性が高い。実際のベイズ統計の使い方についても「事前分布は主観や信念を表す」という解説はおかしいと思います。

ベイズ統計入門では主観やら信念やら確信やらの話は単に余計なだけ。

タグ：統計

posted at 16:15:56

#統計実際にベイズ推定を行なってみたことがある人であれば

＞事前分布は主観や信念を表す

などと言われても

＞真のパラメータ値がよく分からないからテキトーに広がった分布を事前分布として選んだだけなんですが

＞計算を楽にするための都合で共役事前分布を選んだだけなんですが

続く

タグ：統計

posted at 16:15:54

「臨床研究するまでも無い」。韓国で甲状腺がん検診を行い、手術を行ってきた臨床医たちも、そう考えていたんでしょう。とても危険な考え方です。 twitter.com/takeshi_kine/s...

タグ：

posted at 16:11:48

@ma_ko_tan @takeshi_kine @kikumaco 「（甲状腺がん検診に）メリットがある」と主張している人たち（臨床医も含む）は根拠を提示できていません。「4割に外部浸潤がある」「経過観察しながら手術の要不要を治療指針にしている」はなんら根拠にならないことをご理解していただくにはどうすればいいのかを、日々考えています。

タグ：

posted at 15:55:18

@ma_ko_tan @takeshi_kine @kikumaco 甲状腺がん検診にメリットはないか、あってもすごく小さいことを示すことはできますが、それはそれとして、メリットがあると主張する側に立証責任があるんです。

タグ：

posted at 15:52:25

@ma_ko_tan @takeshi_kine @kikumaco 「メリットがあるっていう説明をしていない」のなら幸いです。なにしろ『「メリット有り」は甲状腺検査評価部会の議事録を読めば分かる』『早期発見のメリットは明確です』などというとんでもない誤解をしている人も中にはいるわけですから。

タグ：

posted at 15:44:15

#統計我々には道が2つあって、

【ベイズ推定は主観確率を用いて行われている】

という点を強調して(この説明は単純に誤り)先に進む道と、

データに基いて数学的モデルを客観的に評価する方法を統計学(ベイズ統計を含む)は与える

と次世代に伝える道がある。

前者は論外で後者が正しい。

タグ：統計

posted at 15:30:56

#統計汎化誤差の適切な推定量をうまく作って比較するというアイデアは赤池弘次さんが発展させました。それは

データを使って数学的モデルを評価する

という科学のイロハの特別な場合。

タグ：統計

posted at 15:30:55

@ma_ko_tan @takeshi_kine @kikumaco 福島県については、メリットはないかもしれないけど（不安に対する対策としてなど）検診をやらざるを得ないという事情はあるかもしれません。しかし、証明されていないメリットを「ある」と虚偽説明して検診するのは、インフォームドコンセントの観点からはよくありません。

タグ：

posted at 15:25:26

@ma_ko_tan @takeshi_kine @kikumaco がん検診は長年研究されていますが、「こういうメリットがあるだろう」という見込みで行われて、しかし、実際にはメリットがなかったり、思ったよりずっと小さかったりしたという事例がたくさんあります。

タグ：

posted at 15:23:44

#統計～データに基いて行う方法も考えられているという事実を覆い隠す非常に有害な説明だと思います。

そもそも、ベイズ統計で主観確率は必須じゃないので、その説明は単純に間違っているのですが、間違っている以上に有害。

タグ：統計

posted at 15:23:26

@ma_ko_tan @takeshi_kine @kikumaco 甲状腺がん検診について、「こういうメリットがある」と主張している先生方はいらっしゃいましたが、本当にそういうメリットがあることは議事録では示されていません。たとえば、「手術侵襲は少ない」と主張されていますが、本当にそうなのかどうかは、臨床研究をやらないとわかりません。

タグ：

posted at 15:22:29

#統計学習指導要領解説にある

【ベイズ推定は主観確率を用いて行われている】

という説明の仕方は、ベイズ統計においては、異なる主観が入っている事前分布どうしの優劣や、単なるrandomizerとして導入された事前分布や、それ以前の問題として異なる数学的モデルどうしの優劣を～続く

タグ：統計

posted at 15:21:14

#統計「主観確率」的な考え方では、各主観ごとの意思決定は扱えても、異なる主観のもとでの推測結果の優劣を客観的な基準でつけることはできない。

ベイズ統計であろうがなかろうが、事前分布に主観が含まれていようがいまいが、出て来た推測結果の優劣を何らかの客観的な基準で判定する方法は必須。

タグ：統計

posted at 15:21:13

#統計続き～どちらの推測結果を採用した方が勝ち目が高いかを判断する必要があります。

既出の赤池さんの論説で「主観確率」の件で批判されているSavageの統計的意思決定論はAとBのどちらの推測結果の方がましであるかを客観的に判定する方法を与えません。続く

タグ：統計

posted at 15:21:12

@takeshi_kine @kikumaco 「早期甲状腺癌の4割に外部浸潤がある」「経過観察しながら手術の要不要を治療指針にしている」ことは、がん検診にメリットがあることをなんら示していないことはご理解しておられますか？

タグ：

posted at 15:14:03

「がん死」の減少という、少数だけど大きな利益があるからこそ、がん検診に伴うさまざまな害が容認されているんです。ただ、この検診に伴う害が認識されにくいので、検診の疫学に不案内な人たち（一般臨床医も含む）は、がん検診に有効性を過大に評価してしまう。

タグ：

posted at 15:11:58

現在、有効とされているがん検診は、すべて、例外なく、広く薄くQOLを下げるという「害」を容認する代わりに、がん死の減少という「利益」を得ている。甲状腺がん検診だけ、例外的に、「がん死は減少しないかもしれないけど、QOLは改善する」なんてことがはたしてありうるだろうか？

タグ：

posted at 15:11:28

残り66件のツイートを見る

#統計統計的推測結果を利用するのは個人ではなく集団である場合が多い。そのとき、誰か個人の主観が入った推測結果を集団内でどのように扱うかが問題になります。

例えばAとBのことなる2人が異なる方法、異なる主観に基いて、異なる推測結果を得たとする。

そのとき、集団内でAとBの～続く

タグ：統計

posted at 15:07:14

#統計続き。ベイズ統計であろうがなかろうが、現実の母集団におけるパラメータの真の値は未知ではあるが確定した定数です。そして、現実の母集団からの無作為抽出で得られたデータは、無作為抽出で使った乱数の出目によって変化するものなので、ベイズであろうがなかろうが、データは確率変数です。

タグ：統計

posted at 15:01:49

#統計補足：「頻度主義ではパラメータxは定数で、ベイズではパラメータxは確率変数になる」という説明がひどい理由は、前者の頻度主義でのxは現実の母集団におけるパラメータの真の値(未知だが確定した定数)を意味し、後者のベイズでのxは数学的モデル内部でのパラメータを意味しているからです。続く

タグ：統計

posted at 15:01:48

「早期発見のメリットは明確だ」などという誤解に基づいて甲状腺がん検診が行われているとするならば、これはインフォームドコンセントに基づいているとはとても言えません。

タグ：

posted at 14:56:45

#統計続き～

* ベイズ統計は頻度主義と全く異なる確率の考え方を基礎としている。

というような解説に出会うはずです。これらはことごとく誤りです。添付画像は

watanabe-www.math.dis.titech.ac.jp/users/swatanab...

より。 pic.twitter.com/Xe910mIbQG

タグ：統計

posted at 14:56:06

#統計仮に【ベイズ推定は主観確率を用いて行われている】と教わった高校生がインターネットで検索したとしましょう。すると、

* 頻度主義統計学は客観確率を扱い、ベイズ統計は主観確率を扱う。

* 頻度主義では母数は定数でデータは確率変数だが、ベイズではデータが定数で母数が確率変数になる。

タグ：統計

posted at 14:55:55

#統計学習指導要領解説にある

【ベイズ推定は主観確率を用いて行われている】

は誤り。正しくは

ベイズ推定に主観確率の概念は必須ではない

です。赤池弘次さんが指摘しているように、事前分布は単なるrandomizerであっても問題ない。続く

twitter.com/Ohsaworks/stat...

タグ：統計

posted at 14:55:53

甲状腺がん検診について、早期発見のメリットは不明確です。がん死亡率の減少はもちろん、QOLが改善するかどうかも不明です。そうした点が十分に情報提供されているかどうか、つまり、きちんとインフォームドコンセントがなされているのかを危惧します。 twitter.com/takeshi_kine/s...

タグ：

posted at 14:55:27

PreBell by So-net @PreBell_JP

まだメールを打っている途中なのに、間違えて送信しちゃった😥！そんな経験ありませんか？Gmailなら送信取り消しができるよってインターネットネコ😺が教えてくれました😊#インターネットネコ #PreBell

詳しくはこちら！spr.ly/6019E4Jx3 pic.twitter.com/mIx2o5gwPH

タグ： PreBell

posted at 14:34:01

@coJJyMAN @subarusatosi #統計真の分布を与えるパラメーター値が特異でなくても、特異パラメーター集合に近ければ、サンプルサイズが余り大きくなくて「解像度」が高くない段階では「特異モデルの漸近論」による近似が有効になる。

こういうことを知らないと「測度零集合なのに現実で意味あるの？」という質問で潰される。

タグ：統計

posted at 14:10:40

@coJJyMAN @subarusatosi #統計～、渡辺澄夫さんの本を読んでもあんまり意味がない。

実際にコンピューターで計算してみると、真の分布をモデルが特異になるパラメーター値に近い値で与えた場合には、有限の余り大きくないサンプルサイズで、近似的に「特異モデルの漸近論」による近似が有効になっていることが分かります。

タグ：統計

posted at 14:01:52

@coJJyMAN @subarusatosi #統計渡辺澄夫さんの本の売りは「特異モデルの漸近論」。

しかし、モデルが特異になるパラメーター集合が測度零集合になります。現実にはモデルが特異になるパラメーターがぴったり実現することはない。

それにも関わらず、「特異モデルの漸近論」に実用的な価値があることを理解しないと～続く

タグ：統計

posted at 13:59:05

@coJJyMAN @subarusatosi コンピューターを使った具体例の計算の仕方については、須山さんや松浦さんが気前良く見せてくれています。

松浦さんはR+Stanを使ってWAICやWBICを計算する方法まで書いている。

あと、私のツイッターの過去ログを検索しても具体例の計算例が沢山出て来るはずです。

タグ：

posted at 13:55:59

@coJJyMAN @subarusatosi 渡辺澄夫さんの本の内容を普通「理解している」ためには単に「証明が追えた」だけでは論外で、「具体例をそれなりに知っている」必要あり。(判定は計算に使ったコードを出せるかどうかで可能)

実際にそうなっていれば、ググって出て来た話も渡辺さんの本の路線で再解釈可能なはず。

タグ：

posted at 13:51:35

@coJJyMAN @subarusatosi ベイズ統計入門として、私がよく勧めて来たのは

* 渡辺澄夫さんの本とウェブサイト
watanabe-www.math.dis.titech.ac.jp/users/swatanab...

* 須山敦志さんの本とブログ
machine-learning.hatenablog.com

* 松浦健太郎さんの本とブログ
statmodeling.hatenablog.com/archive

* 具体例の計算をコンピューターで十分にやらないと理解は無理。

タグ：

posted at 13:45:03

@kuri_kurita

@hayashi_r ほんの一瞬だけ。😅
すぐにバトルに移行します。

タグ：

posted at 13:41:11

非公開

タグ：

posted at xx:xx:xx

@kuri_kurita

pic.twitter.com/MUhVeG8mEe

タグ：

posted at 13:38:33

@kuri_kurita

pic.twitter.com/ht4RbY8fic

タグ：

posted at 13:31:36

あと具体的な計算は多次元正規分布の二乗期待値が計算できれば進めるのでつまづいたら3章冒頭の公式集を自分でもう一回導出すると良い。

3章はそんなに誤植なかった気がするがこのテキストの論理・導出順序が必ずしも最適でないので自分で計算して整理すると良い。(当たり前であるが)

タグ：

posted at 13:01:24

渡辺ベイズに出てくる∇の冪付き演算子はテイラー展開(本では平均値の定理と呼ぶ)の係数を表しているとみなすと良い。この本の中ではそれが自然。

タグ：

posted at 12:56:18

私3章の発表者じゃないから、計算は埋めたけど。ノート適当なんだよなぁ。

タグ：

posted at 12:51:41

Hiroo Yamagata @hiyori13

マイクロプラスチック、これまで何一つ被害も影響も観測されていないのに「たくさんあるからまずいかもー」と言い続け、影響ないからという報告が出てきたら「まだ何もわかっていない云々」って、火のないところに煙をたてる気満々だな、BBC(それ以外のエコ団体も)
www.bbc.com/japanese/49430...

タグ：

posted at 11:42:16

代数幾何と学習理論は漸近論構築だけでなく学習係数・実対数閾値を実際に求めてみるときに必要な話なのに対して、ベイズ統計の理論と方法では漸近論構築とWAIC導出に必要な話が四章までは書いてある。前者ではイデアルの議論は不可避だが後者の範囲では標準形作るために特異点解消を認めればよいだけ。

タグ：

posted at 09:49:24

代数幾何と学習理論だと、学習の問題提起→必要な数学の概説→学習理論、という構成なので（中身の読みやすさと難度はともかく）一つの話題に絞ってるとは思う。
読みやすさと新しさ的にはベイズ統計の理論と方法の方がいいと思う。

タグ：

posted at 09:46:30

四章までの目的意識は完全にこれだが、五章ではMCMCと変分推論について軽く触れて、六章では最小自乗損失を使った回帰やLOOCVについての話など、それぞれ別のトピックを扱ってるのが迷子になる人が出てくる理由なのかしら。

タグ：

posted at 09:43:52

非公開

タグ：

posted at xx:xx:xx

何がしたいのかわからないってのも妙で、事後分布・予測分布作ったときに自由エネルギー、汎化損失、経験損失がどのような挙動になるのかを調べていて、なぜこれらの量を考えるのかもKLdiv認めればわかるように書いてあるのだが。

タグ：

posted at 09:37:34

ケアネットの犬コム太《公式》 @mch_carenet

ベイズ本、エクセルの最小自乗法関数使った分析しかやったことなくても問題なく読めたんだがそんなにわかりにくいか？と思ったが先に代数幾何と学習理論を斜め読みしてたんだった

タグ：

posted at 09:35:53

非公開

タグ：

posted at xx:xx:xx

【タミフル異常行動問題に決着】

10年以上にわたる追跡調査の結果、「異常行動はタミフルではなくインフルエンザの症状である」という結論が出されたわん。

添付文書からも、10代の使用制限は解除されたわん
www.carenet.com/report/yorozu/...
pic.twitter.com/DI7uE6tFpt

タグ：

posted at 07:55:54

#数楽合っていると思う。

さらに特異点解消後の積分を直接計算すれば、ゼータ函数を経由する議論も消せて大学1年生レベルの計算で処理できると思う(上述)。

twitter.com/nan_makersstat...

タグ：数楽

posted at 07:55:27

@coJJyMAN @subarusatosi ベイズ統計について真っ当なことをブログなどに書いている人達もいて、私は参考にしています。

解説では「客観確率vs.主観確率」的なおかしなことを書いていても、実践的には面白くて真っ当なことをやっている人も沢山いる。

眼力が問われる世界

タグ：

posted at 07:39:19

Space Explorer Mike @MichaelGalanin

〈 Berger | Dillon 〉 @InertialObservr

Full rotation of the Moon.
Credit: NASA pic.twitter.com/rbQ9nx7IGa

タグ：

posted at 07:25:31

I always find it amazing how such simple rules can yield such beautifully complex regions

The Mandelbrot Set is the set of all a∈ ℂ such that the sequence S⁽ⁿ⁾=|fₐ⁽ⁿ⁾(0)| does not diverge as n→∞

• fₐ(z) = z² +a
• fₐ⁽ⁿ⁾(0) = fₐ(fₐ( ..fₐ(0) )) (n times) pic.twitter.com/qXJwXLvpQC

タグ：

posted at 06:59:18

松浦健太郎 @hankagosa

A/Bテストで利益を最大化するために、過去データに階層モデルを使った例。 twitter.com/mcmc_stan/stat...

タグ：

posted at 06:43:12

松浦健太郎 @hankagosa

Chronikis(クロニーキースと発音)、adobeでメンテされている時系列モデリング専門の確率的プログラミング言語らしい。すごいもん作るなぁ。 twitter.com/mcmc_stan/stat...

タグ：

posted at 06:41:41

アマナ @amananama

t=20の時は分散が20になるから、95%信頼区間は±1.96×2√5でだいたい4×2.236で±9ってところかな……まぁ概ねそうなってますね pic.twitter.com/5FOGjUgSBR

タグ：

posted at 05:50:01

アマナ @amananama

何となくブラウン運動 pic.twitter.com/nHEPjciisa

タグ：

posted at 05:42:56

Massimo @Rainmaker1973

In the village of Nashtifan, Iran, some of the oldest windmills in the world, with what may be the earliest windmill design in the world, still spin. Made of natural clay, straw, and wood, they have been milling grain for flour for an estimated 1,000 years buff.ly/2zeGJTz pic.twitter.com/ukkfwiNOrx

タグ：

posted at 05:15:23

victoria shen @EvicShen

Millipede Shadow!

ヤスデの影 😍 pic.twitter.com/uYMMoGkhF0

タグ：

posted at 04:20:18

@coJJyMAN @subarusatosi 「事後確率の最頻値」を求めることをベイズ推定だと誤解している人達は沢山いますね。それMAP推定。もしくは正則化項を入りの学習。

不合理でおかしな考え方をしている人達のベイズ統計について知りたいのか、もっと真っ当な話を知りたいのか？それが最初に決めるべき問題。

タグ：

posted at 02:59:32

尾上正人 @9w9w9w92

「うまく機能している制度というものはたいがい、このようなヒト特有のステータス心理を、思いがけない方法で、引き出したり抑えたりしているものだ」210頁
好例として、年少者から発言するユダヤの「サンヘドリン」…山本七平が「全員一致は無効」とデタラメ書いて浅見定雄にボコされたサンヘドリンw

タグ：

posted at 02:20:26

非公開

タグ：

posted at xx:xx:xx

@coJJyMAN @subarusatosi 例えば、「大学入試でも丸をもらえるような合理的な確率の計算であることがすぐにわかる例」として、モンティ・ホール問題があります。

モンティ・ホール問題へのベイズの定理の適用は、ベイズ統計の話ではない。

単に真の確率分布のもとで真の確率を計算しただけ。実際、勝率は2/3になります。

タグ：

posted at 01:47:07

#統計訂正

❌「n-1項分布」→⭕️「n項分布」

n=rc項分布のパラメータはp_{11},p{12},…,p_{r,c-1}のrc-1個。p_{rc}は1からそれらを引けば得られる。

独立性を満たす分布のパラメータはp_1,…,p_{r-1}, q_1,…,q_{c-1}の(r-1)+(c-1)個。

twitter.com/genkuroki/stat...

タグ：統計

posted at 01:41:39

@coJJyMAN @subarusatosi よく分からないうちは「大学入試でマルをもらえるような合理的な確率の計算をやっていることがすぐに分かる場合は、ベイズ統計の話になってない」と思っておけば良いと思います。

「え？どうしてそんなことをしても合理的だと言えるの？」という話になっていなければベイズ統計の話ではない。

タグ：

posted at 01:36:16

@coJJyMAN @subarusatosi 私が合理的だと思っているベイズ統計でも、「主観確率」を扱っているらしい「ベイズ統計」でも、結構大胆なことをやっています。

現実世界と一致するはずがない数学的設定とデータを使って推定を行う。

計算に必要な真の確率分布が全部見えているというようなクリアな設定にはなっていないです！

タグ：

posted at 01:28:29

クッキー @CookieBox26

「ベイズ統計の理論と方法」の特異点解消定理の登場シーンだけかいたスライドです（流し読みなのでおかしい点があったら教えてください
github.com/CookieBox26/To...

タグ：

posted at 01:22:23

@coJJyMAN @subarusatosi というわけで2つ目も不適切。

twitter.com/cojjyman/statu...

タグ：

posted at 01:20:03

@coJJyMAN @subarusatosi さらに、後の方のリンク先の内容は、ベイズの定理を用いて(仮想的な設定内での)真の確率分布を使って真の確率を求めているだけであり、未知の確率分布に関する真のベイズ推定を行なってはいません。

真の確率分布が既知なら何も推定することはなくて、単なる計算問題になります。

タグ：

posted at 01:19:07

@coJJyMAN @subarusatosi そっちはさっきのと違うページ。

タグ：

posted at 01:14:57

@coJJyMAN @subarusatosi 渡辺澄夫『ベイズ統計の理論と方法』の最大の欠点は、具体例の計算の紹介が余りにも少ないこと。

読者は自分でコンピューターを回して具体例を計算する必要がある。

そういうことをやっていない人がこの本の内容を理解していないと断言できます。

証明と手計算だけでは感じがつかめない。

タグ：

posted at 01:14:22

@coJJyMAN @subarusatosi ベイズ統計とベイズの定理は違う話です。

ベイズの定理は条件付き確率の定義の自明な書き直しに過ぎません。条件付き確率が出てくるケースの多くで(ベイズ統計やら「主観確率」とは無関係に)使える自明な定理。

タグ：

posted at 01:10:17

twitter.com/monotarosamura...

タグ：

posted at 01:00:31

#Jupyter

【Remove Python 2.x support in favor of Python 3.5 and higher】

Python 2.xを使っていると小2開発者に馬鹿にされます。 twitter.com/lresende1975/s...

タグ： Jupyter

posted at 01:00:28

#統計学続き～のようなことを知らないと困ると思います。

そういう実用時の誤りを防ぐための教養として重要な部分について、ミスリーディングであったり、本質的に間違ったことが、教科書に書いてあるわけです。

どうして「教科書ひどすぎ！」という声が上がらないのか？

それが不思議。

タグ：統計学

posted at 00:37:54

#統計実用的に

* Fisher検定は正確ではない。

* ベイズ統計では普通「主観確率」なるものを扱っていない。

* 最小二乗法は正規分布モデルであり、最良とは限らない。

* 95%信頼区間の計算に用いた数学的モデルが現実を適切に近似していなければ、「95%」という数値を現実には適用できない。

タグ：統計

posted at 00:37:51

#統計東京大学教養学部統計学教室編『統計学入門』関連

私は「統計学入門のためのよい教科書を知らないか？」と質問されても、「知らない」と答えざるを得ないと思っています。

理由は以上で示した引用を見れば想像できると思う。

引用した教科書だけの問題ではない。

twitter.com/genkuroki/stat...

タグ：統計

posted at 00:28:30

#統計本当は全てを固定できないはずの周辺度数を全て固定して良いかのような誤解をしてしまうと、「2×2の分割表でのFisher検定は正確であり、χ²検定はFisher検定の近似に過ぎない」というような酷い誤解をすることになります。

twitter.com/genkuroki/stat...

タグ：統計

posted at 00:24:35

#統計漸近的に出て来るχ²分布の自由度はWilks' theoremによって得られます。例えば、nのみが固定されているとき、n-1項分布のパラメータ数はn-1=rc-1で、独立性を満たす分布に入るパラメータ数は(r-1)+(c-1)になり、それらの差(rc-1)-(r-1)-(c-1)=(r-1)(c-1)が出て来るχ²分布の自由度になります。

タグ：統計

posted at 00:24:34

#統計おそらく、「自由度は(r-1)(c-1)」と言いたい理由は、r×cの分割表におけるピアソンのχ²統計量が漸近的に自由度(r-1)(c-1)のχ²分布に従うという事実を使うときの、「自由度(r-1)(c-1)」の由来を説明したいからです。

しかし、その説明を周辺度数を全て固定することによって行うのは誤り。

タグ：統計

posted at 00:24:34