黒木玄 Gen Kuroki(@genkuroki)/2020年02月11日

現実の母集団が実現不可能でも、意味のある推論は可能であるというのが重要な点である理解している。

タグ：

posted at 23:54:44

「修正版心理学のためのベイズ統計入門」、確率モデルによって母集団分布が実現可能であると仮定して進むと解説しているが、そうなのか。そんな「見做し」がなくてもモデルの相対評価ができるのが統計学の貢献だと思っていた。最後の引用は「ベイズ統計の理論と方法」4p
www.slideshare.net/simizu706/ss-2... pic.twitter.com/iWTQCLjD4o

タグ：

posted at 23:45:24

#統計同感！

みんな同じように変なことを書いているので、震源地があると思うのですが、変なことを書いている人達は参照文献を示さない習慣を持っているようなので、全然遡れないのだ。

何を読んで変な考えを知ったのかに関する情報をみんなで共有するべきだと思います。

twitter.com/stattan/status...

タグ：統計

posted at 22:36:31

積ん読はなかなか金のかかる趣味で，5cm積むのに大体1万円ぐらいはかかる。

タグ：

posted at 22:33:53

TaKu @takusansu

#超算数 #掛算「児童の発達段階に合わせて、そのように教えている」
大人になってもそこから抜け出せない人は発達障害かｗ
年齢を重ねても抜け出せない人達の存在は、発達段階説が間違っている傍証だと思っています。

タグ：掛算超算数

posted at 22:32:44

#統計資料

twitter.com/hk_st2009/stat...

タグ：統計

posted at 22:26:15

#超算数集合数×関係数という定義は、50年代結構流布したようです。そしてどこかの段階で関係数を×記号の後に書くのが日本の流儀であるという主張が登場します。

タグ：超算数

posted at 22:17:42

ごまふあざらし(GomahuAzaras @MathSorcerer

#超算数確か、ブルクナーとグロスニケルの『算数を意味付ける方法(勝手訳)』twitter.com/temmusu_n/stat...も、かけ算せgroup sizeに言及していたかも。とにかく和田は指導要領執筆中にかけ算をアメリカの流儀で定義した。

タグ：超算数

posted at 22:14:37

PacakgeCompilerX.jl が旧 PackageCompiler.jl に取り込まれたのでX付きの方はアーカイブされました．今後はPackageCompiler．jl の方を楽しみください．

タグ：

posted at 22:01:44

#超算数補足。相対度数を英語では、relative figureというみたいですね。

タグ：超算数

posted at 22:01:11

#超算数遠山啓は関係数の語をドイツ語由来だと考え、ドイツ語では絶対値ではない正または負の数をいうと批判しました。しかし、どのような語を定めるのもカラスの勝手です。とはいえこれは和田の創意ではなく、おそらく英語に由来する概念と思われます。group sizeとかと関係すると予想。

タグ：超算数

posted at 21:59:48

#超算数この著作は、遠山啓が『教師のための数学入門』で批判していますから、数教協派の人はそっちで知っていると思います。この中で和田は、かけ算は集合数×関係数であると定義しました。この段階では掛順は規定されていませんでした。遠山は関係数という用語を批判していますが下らない。

タグ：超算数

posted at 21:55:47

#統計以上のように、最尤法とベイズ法の両方が同じように使える道具であることを強調した上で、それらの汎化性能の優劣を比較するのであれば、「頻度論vs.ベイズ」の話も有益な議論になると思います。

擬似哲学的な「主義に基づく統計学」観に基く比較は非科学的過ぎるので止めた方がよいと思う。

タグ：統計

posted at 21:55:46

#統計同書の他の部分の未知の分布サイドのデータの分布が

q(x_1)…q(x_n)

の形であるという設定では、事前分布がからむパラメータwがないので、「パラメータwに関する仮説が正しい確率」自体最初からナンセンスだということになります。モデル内部の仮想世界でのみそういう確率は考えられる。

タグ：統計

posted at 21:48:19

#統計仮に推定先の未知の分布サイドのサンプル(データ)の分布が

∫P(x_1|w)…P(x_n|w)Φ(w)dw

の形ならば、事前分布がΦ(w)で確率モデル部分がP(x|w)の正しいモデルを採用できれば、パラメーターwに関する仮説が正しい確率を求めることができます。

しかし、この設定は同書の他の部分の設定と違う。

タグ：統計

posted at 21:44:44

#超算数 #掛算|の順序の起源は、1951年指導要領です。そこでは、乗数×被乗数という順序を単なる誤りとして記述していました。できない子対策とかそういう言い訳は一切ありません。最近知ったのですが、同指導要領の算数責任者である和田義信に、「数学のカリキュラム」という1950年の著作あり。

タグ：掛算超算数

posted at 21:39:32

#統計訂正

❌ L(X) = p₁(x)/p₀(x)
⭕️ L(X) = p₁(X)/p₀(X)

例によって、x→Ｘの違いです。まあ、以上の説明で理解できる人はネイマン・ピアソンの補題を知っている人だけだと思うので、害はないと思いますが、念のために訂正しておきます。

twitter.com/genkuroki/stat...

タグ：統計

posted at 21:38:51

きろかろりー @umishama

でも最近はジュリアが好き。ジュリア好きすぎて先輩さんに「Juliaって知ってる？」って訊かれたとき真っ先に「知ってます！！大好きです！！かっこいいですよね！！！」とか言ったぐらい。
プログラミング言語の話だった。

タグ：

posted at 21:33:24

#統計さらに、既出ですが、第4章の4.3節が難しいと感じた人は以下のリンク先に書いたより初等的な議論もあることを知っておいた方がよいかもしれません。

genkuroki.github.io/documents/2016...
大学1年レベルまで初等化

nbviewer.jupyter.org/github/genkuro...
大学2～3年レベルまで初等化

タグ：統計

posted at 21:31:49

#統計ネイマン・ピアソンの補題の内容はシンプルに「2つの分布p₁(x), p₀(x) (後者が帰無仮説)について、L(X) = p₁(x)/p₀(x)が最強力検定を与える」と言えます。

これを Z(x)=Z(x_1,…,x_n) (x=(x_1,…,x_n)) 型の分布に適用すればp.184 定理25が得られます。

タグ：統計

posted at 21:28:30

#統計続き～、ネイマン・ピアソンの補題をp.184 定理25の特別な場合とみなしています。その説明は論理的には誤りではないのですが、実際には、シンプルなネイマン・ピアソンの定理からp.184 定理25が容易に出せるので、この説明の仕方に読者は従わない方がよいと私は思っています。続く

タグ：統計

posted at 21:28:30

#統計ついでに述べておくと、6.4節「統計的検定」を読むときにも、よりすっきりした理解をするために注意を要する部分があります。

p.184 定理25では、上のZ(X_1,…,X_n)型の尤度の商を扱い、p.185 注意67(2)では事前分布がデルタ分布の場合を扱っており～続く

タグ：統計

posted at 21:28:29

#統計ところが同書7.1節では、未知の分布側のサンプルも

∫P(x_1|w)…P(x_n|w)Φ(w)dw

型の分布に従うという設定を採用しています。この設定は同書の他の部分にはないものなので、この点に注意しないと読者はひどい誤解をしてしまう可能性があります。7.1節の内容は他の部分にはほとんど無関係です。

タグ：統計

posted at 21:21:01

#統計渡辺澄夫『ベイズ統計の理論と方法』が採用している基本設定では、未知の分布q(x)のサンプルは分布

q(x_1)…q(x_n)

に従い、モデル内サンプルは分布

Z(x_1,…,x_n) = ∫p(x_1|w)…p(x_n|w)φ(w)dw

に従うという設定になっています。未知の分布サイドには事前分布というものがない。続く

タグ：統計

posted at 21:17:17

#統計「仮説が正しい確率」というような考え方を捨てても何も失われない。

渡辺澄夫『ベイズ統計の理論と方法』を読めば、最尤法やベイズ法を使えば、サンプルサイズ→大で、採用した正しくないモデルの範囲内でベストの推定結果が得られることが分かり、さらにモデル間の相対評価の方法も得られる。 twitter.com/not_identified...

タグ：統計

posted at 21:10:30

#統計 1つ前のツイートで指摘した通り、「(事前分布も含めて)正しいモデルの下では、仮説が正しい確率を求められる」という主張もナンセンスである。

「仮説が正しい確率」なるものは最初からナンセンス。

救いようがない。続く twitter.com/not_identified...

タグ：統計

posted at 21:01:50

#統計正しい。

未知の母集団分布に「正しい事前分布」なんてものはないし、事前分布はモデルの一部分なので、

「ベイズ統計では、モデルが正しければ、仮説が正しい確率を計算できる」

という主張をしても意味がない。

渡辺澄夫『ベイズ統計の理論と方法』7.1節の説明はミスリィーディング。 twitter.com/not_identified...

タグ：統計

posted at 20:58:21

Movie 1 にメンフクロウ入れてないのはなんで？っていま聞いてみたら、こいつはLED光をつけたらと左右どっちかに寄ってしまいがちで、片翼が見切れてるから、らしい…それだけなら別に載せてもよかったと思うんだけどな。Education purpose でもあるから、なのかな。

タグ：

posted at 20:51:37

あ〜る菊池誠(反緊縮)公式 @kikumaco

このヘリウムバブルを使って鳥が飛行した後に残す気流を可視化したのが movies 1 & 2. パッと見て翼端渦に目が行くわけですが、よく見ると胴体・尾羽の真下にかなり強い吹き下ろしがあることもわかります。これがこの論文のポイント。

タグ：

posted at 20:48:29

広瀬隆があるというので見てみたら、広河隆一も小出裕章も日野行介もアーニー・ガンダーセンもあって、さながら「放射能デマ文庫」の様相。改めて、菅直人はすごいなあと思いました twitter.com/NaotoKan/statu...

タグ：

posted at 20:33:46

BTEH @HK_ST2009

心理学のためのベイズ統計入門【スライド修正】 by @simizu706 #bayes #psychology www.slideshare.net/simizu706/ss-2... @SlideShareより

タグ： bayes psychology

posted at 20:26:17

非公開

タグ：

posted at xx:xx:xx

kenkatz @Cross_Stream2

とうとう娘も掛け算の順序問題に直面！私は娘の答案で正しい派ですが、担任の先生に勝っても得るものが殆どないので、娘に「君ので正しい」と教えて、後は放置します。 pic.twitter.com/xInpdwgJQe

タグ：

posted at 20:09:25

PIV: particle image velocimetryとは、流れの中にたくさん入れた粒子を撮影し、2時刻の粒子群の相関から移動ベクトルつまり流速を求める手法。空気中だと細かい霧状の粒子を使うので、光らせるには強力なレーザが使われる。ヘリウムバブルは大きいので、LEDでもいけるらしい。

タグ：

posted at 19:40:56

ごまふあざらし(GomahuAzaras @MathSorcerer

飛行実験に使った鳥はメンフクロウ・モリフクロウ・オオタカの3種類。バブルを使う利点の一つは、風洞内で飛ばすには大きいような鳥でも実験しやすいことにあります。また、普通のPIVと違いレーザを使わないので、人や鳥がゴーグルをかぶる必要がなく扱いやすいです(広告みたいになってしまった)。

タグ：

posted at 19:34:36

わかりやすい twitter.com/toyo9/status/1...

タグ：

posted at 19:31:08

Daisuke KATO @Dsuke_KATO

www.reddit.com/r/rust/comment...

タグ：

posted at 19:26:11

なべきち @nabekichi32

教育界隈には100マス先生の信者がマジで多いから、ココでちゃんと叩いて置かないと多分大変なコトになる。
すでに信者はどうしようもねぇけど、少なくともココからは増やさないために。
だって信者は現場にも多いから水伝・EM・江戸しぐさの二の舞になりかねない。

タグ：

posted at 19:07:56

名取宏（なとろむ） @NATROM

ただ、一般的に、ニセ医学批判は「PVが取れる」どころか、なかなか広がらない。例外的に血液クレンジング批判が広まった理由の一つは、推進側に強力なインフルエンサーがいたからこそではないか（加えて「見た目のインパクト」「わかりやすい」のも理由）。

タグ：

posted at 19:05:42

名取宏（なとろむ） @NATROM

はあちゅう氏に「血液クレンジングには予防医療の観点で部分的効果がある。ニセ医療じゃない」と吹き込んだ医師がいるはず。インフルエンサーよりもニセ医学を自由診療で提供している医師のほうが悪い。

タグ：

posted at 19:05:22

toyo @toyo9

＜図解＞ twitter.com/nekomath271828... pic.twitter.com/QkJik4Atmz

タグ：

posted at 18:53:51

koume @koume_nouka

ニセ医療批判がそんなにPV稼げるならそれこそNATROMさんなんてものすごいインフルエンサーになってそうだけど実際には焼き肉も奢ってくれないんだぞ

タグ：

posted at 18:31:16

松枝春 @ascendbba

この連ツイ、大学入試改革の利権構造のおぞましき実態を簡潔にまとめてあります。知っている方には復習、知らない方は、"パラサイト　半地下の家族"　級のミステリーですよ、ぜひお読み下さい。題して”パラサイト　教育を食う官の奴らと民の奴ら” twitter.com/KITspeakee/sta...

タグ：

posted at 18:29:27

タビトラ @tabitora1013

はあちゅうさんの痛いところは、少なくとも医療に関しては一切インフルエンサーなどではないのに自分をインフルエンサーだと思い込んでるとこよな。裸の王様的な滑稽さがある。情報を見極める力が絶望的になく、逆に自らが流れてきた情報を信じ込む「インフルエンスされる人」なんだよ

タグ：

posted at 18:14:27

万博@盲学校マジック @bampaku

掛け算の順序と見積書のテンプレートを混同するのはすごい。

タグ：

posted at 18:05:30

Keisuke Nishitani @Keisuke69

Juliaってプログラミング言語初めて知った。多重ディスパッチやらもさることながらとにかく速いことが特徴らしい。こんな感じで書く模様

The Julia Language: julialang.org pic.twitter.com/AvCu16bpHU

タグ：

posted at 17:46:39

#統計 #Julia言語更新された

nbviewer.jupyter.org/gist/genkuroki...

を見ればわかるように、成功確率が0または1に非常に近い場合には最尤法の方が(Jeffreys事前分布の)ベイズ法よりも平均予測誤差(ただし「n回中0回成功」「n回中n回成功」は除いてある)が小さくなっています。平均二乗誤差も同様です。 pic.twitter.com/NmJFO5wBmh

タグ： Julia言語統計

posted at 16:27:34

#統計以下のリンク先では、真の成功確率が0.3でn=10の場合には、Jeffreys事前分布のベイズ法の方が最尤法よりも平均予測誤差(KL情報量で定義)が小さくなることに言及しました。

常にベイズ法が最尤法勝つわけではないことに注意！続く

twitter.com/genkuroki/stat...

タグ：統計

posted at 16:19:04

（入試改革ウオッチャーが知らなかった情報は限られているが，このズブズブ・ドロドロを世間一般が知らないのはメディアの怠慢！ことは教育問題。知れば政権の大きな打撃にもなるのに，大手メディアが腰抜けで本当に情けない。）

タグ：

posted at 16:06:46

また，安倍首相の父，晋太郎氏の側近だった加藤六月氏の娘，康子氏はベネッセグループの「東京個別指導学院」の大株主だった。加藤康子氏は安倍首相と半ば兄妹のように育った幼馴染で，昨年7月まで内閣官房参与を務めた，「アベトモ」の筆頭格。

タグ：

posted at 16:00:48

この部分は入門書で｢モンティホール問題｣や｢医療診断の偽陽性率｣みたいな、ただベイズの定理で計算するだけの話からものすごくジャンプを感じたんだけど、そのときは素通りしてしまった。当時の私、それは遠回りだぞ。

タグ：

posted at 15:54:43

教育再生実行会議の委員の元シンクロスイマー武田美保氏（元経産官僚で第一次安倍内閣官邸スタッフ・現三重県知事の鈴木英敬氏の妻）も理事を務めていたが，３氏とも一連の騒動の渦中にCEESからフェードアウトした。

タグ：

posted at 15:54:23

新帯秀樹 Hideki Shintai @hs_heddy

ここで仮に事前分布を用意したところで、現実の未知の母集団分布に｢正しい事前分布」なんてものはないので、そこから導かれる事後分布の区間を見ても結局日常言語で理解される意味での｢仮説が正しい確率｣にはならないわけだ。

タグ：

posted at 15:53:53

Constraint Solver: How to use JuMP for your own solver?
#Julia言語

 disq.us/t/3l62oan

タグ： Julia言語

posted at 15:53:14

Sugiyama @sig_kdy

新帯秀樹 Hideki Shintai @hs_heddy

watanabe-www.math.dis.titech.ac.jp/users/swatanab...
まさにこの資料に同じことが書いてありました笑

タグ：

posted at 15:51:48

Types in C/C++ and Julia by Erik Engheim
#Julia言語

 link.medium.com/QGWp1gv8Y3

タグ： Julia言語

posted at 15:50:39

◇「アベトモ」もベネッセ人脈に
主役は「三木谷連合」からベネッセに移ったが，中心にいるのは下村氏と鈴木氏のコンビ。他にも，ベネッセ関連の「進学基準研究機構（CEES)」の理事長を佐藤禎一・元文部事務次官が，評議委員を中教審会長として改革の旗振りをした安西祐一郎・元慶應大塾長が務めていた

タグ：

posted at 15:49:42

Re: RT ニセ医療を叩くと視聴率を上げられる！

この認識はもっと広がるべき。

お医者さん達がしている「医療の常識」に関係していると思われる雑談は滅茶苦茶面白いですよね。

娯楽として成立していると思う。

ツイッターの有効な使い方としては最上位に入ると思う。

タグ：

posted at 15:45:54

文科省もこの両氏をサポートし続けると同時に，ベネッセへの「便宜」を図っている。たとえば，導入延期決定の直前になっての，伯井高等教育局長から各都道府県知事や教育長らに宛てた試験会場借用に係る依頼文書。この次期，英検の試験会場はほぼ決まっていたので，ベネッセへの便宜供与と言ってよい。

タグ：

posted at 15:42:31

#Julia言語の Plots.jl で区間の両端で発散している函数のグラフをプロットするときには、ylim=(ymin, ymax) オプションを指定して、プロット範囲を制限するのが定跡だと思います。x軸方向の制限でプロット範囲が適切になるようにするよりもずっと簡単です。

タグ： Julia言語

posted at 15:36:35

Julia何も分からんつらい

タグ：

posted at 15:36:35

#統計ベルヌイ分布モデルは

pdf(1|p) = p,
pdf(0|p) = 1-p

でパラメータpについて一次函数になる点に関しては非常に特殊。ベイズ予測分布はパラメータpに事後分布の平均値を代入したものになってしまう。

この点は余りにも特殊過ぎるので、教育用の例として使う場合には要注意。

タグ：統計

posted at 15:34:30

下村氏は教育再生実行会議の委員に「懇意の塾経営者」を就かせ，鈴木寛氏を引っ張り込み，後で自分の補佐官に抜擢。「鈴木氏とのコンビで作った新テスト導入の行程表を15年1月に大臣決定すると，なぜか重要な部分は審議非公開のブラックボックスの中で決められていった」→

タグ：

posted at 15:34:03

K.B.砂糖 @KB_satou

え、何このわかりやすい資料……知らなかった。
juliagpu.gitlab.io/CUDA.jl/tutori...

タグ：

posted at 15:30:43

#統計ベルヌイ分布モデル(もしくは二項分布モデル)のJeffreys事前分布 Beta(1/2, 1/2) の密度函数は両端の x=0,1 で発散しており、下に凸な函数です。

両端の重みを大きくした方が最尤法に近付くんですね。こういう基本的なことにも気付いていなかった。私は統計学はど素人なので仕方がない。 pic.twitter.com/9nTDsSXZLE

タグ：統計

posted at 15:29:51

◇「便宜供与」する文部科学省（ここでも説明は詳細）
結局TOEFLではなく「英語成績提供システム」を設置することになったが，再三問題が指摘される中，「ここまでデタラメな試験が危うく実施されそうになった」のは第二次安倍内閣で文科大臣に就任した下村衆議院議員によるところが大きい。→

タグ：

posted at 15:28:26

Sugiyama @sig_kdy

最尤でもベイズでも、誰もわからない真の分布を近似したくて
・最尤(とかMAPとか)なら推定量w'の実現値で条件付けられたモデルの分布を
・ベイズなら事後予測分布を
それぞれ真の分布を近似していると期待する

…のかな？やっと自分の中で明確になってきた

タグ：

posted at 15:22:25

#統計共役事前分布の中で最も極端な Beta(a,b)でa,b→0とした「極限」(一様分布からどんどん離れ、分布として収束しない)を事前分布とした場合のベイズ予測分布が最尤法と一致。

Jeffreys事前分布Beta(1/2, 1/2)は、極端な場合でなくてかつ最尤法の場合から離れ過ぎていない事前分布なんですね。

タグ：統計

posted at 15:20:34

当時，三木谷氏は「利害関係は今後も一切ないし，楽天のビジネスには何の利益もない」と強弁していた。ところが，2017年，楽天は英語教育市場に参入，ITを用いた英語教材販売会社ReDucateを傘下に収め，葛城氏を社長に据えた。（←これを野党もメディアも追及しなかった。）

タグ：

posted at 15:19:23

#統計続き。なぜならば、事前分布が一様分布に近い場合の方が、ベイズ法が最尤法とより一致するように思っている人が多いと思うからです。(私だけの誤解だったらごめんなさい。)

正のa,bを0に近付けると、x^{a-1}(1-x)^{b-1} のグラフは両端の x=0,1 により鋭く集中するようになります！続く

タグ：統計

posted at 15:16:46

#統計ベルヌイ分布モデルの場合には、事前分布をimproperな"Beta(0,0)"にした場合に、予測分布が最尤法と一致するのですが、Beta(a,b)の密度函数が

x^{a-1}(1-x)^{b-1}

に比例していることを知っていると、ぎょっとするはず。続く

タグ：統計

posted at 15:16:45

◇英語問題の発端は楽天・三木谷（詳細だが端折ると）
「最初に利権のにおいを嗅ぎ取った」のは楽天の三木谷氏。経済同友会のPTでTOEFLの大規模活用を提言。自社の英語公用語プロジェクトリーダーだった葛城崇氏を文科省に送り込んだ。→

タグ：

posted at 15:14:13

#統計そうか、以前、ベルヌイ分布モデルはベイズ統計を紹介するときの例としてシンプル過ぎて不適切だと述べたことがありましたが、KL情報量や平均二乗誤差で予測誤差を定義して計算すれば、ベルヌイ分布モデルのようなシンプルなモデルでも十分に楽しめる！

以前の発言は__その意味で__撤回。

タグ：統計

posted at 15:10:36

ベネッセが大部分の受験生を囲い込んでいる。JePは経産省と総務省が主導する「情報銀行」構想とリンクして進めることが決まっている情報の「宝の山」。それをベネッセの関連会社に丸投げすること自体が危うい。ベネッセが巨大データを管理するに至った経緯や情報の安全性の確認が必須。

タグ：

posted at 15:06:20

「最もクレームが多かったのがベネッセでアルバイトがほとんど」と。JAPAN eポートフォリオについても，情報を管理しているのは実はベネッセの関連会社。「なりすまし」を防ぐためという名目でベネッセのID, PWを使うことになったが詳しい経緯は不透明。1学年40万人が受験する進研模試があるので，→

タグ：

posted at 14:59:36

以下，見出しと概要
◇ベネッセの知られざる「利権」
記述式の採点を61億円で落札した「学力評価研究機構」。その裏にはテスト採点業務の寡占構造があった。学テの採点もベネッセ，内田洋行，教育測定研究所の「三社で棲み分けしていた」と言う，その下請けをしていた企業の経営者は→

タグ：

posted at 14:51:24

2月号の『選択』は必読だが書店で買えないのが残念。2020年度大学入試改革にからむ利権構造をこれまでに出たどの記事より正確かつ比較的詳しく報じている。www.sentaku.co.jp/articles/view/...

タグ：

posted at 14:42:57

#統計 #Julia言語既出の

nbviewer.jupyter.org/gist/genkuroki...

を大幅に更新した。

真の成功確率0.3
n = 100

の場合には、最尤法MLEとベイズ法でKL情報量で定義した予測誤差の分布はほぼ同じになります。

KL情報量で定義した予測誤差の2n倍は近似的に自由度1のχ²分布に従います。正則モデルの普遍的な性質。 pic.twitter.com/F9SCCjDaiG

タグ： Julia言語統計

posted at 14:36:18

@sekibunnteisuu @genkuroki あなたのツイートをトゥギャりました。読んでいただけると幸いです。 togetter.com/li/1467105

タグ：

posted at 13:53:01

#統計 #Julia言語計算で使用したプログラムは

nbviewer.jupyter.org/gist/genkuroki...

で公開しておきました。間違った計算をしていたら教えて下さい。訂正して計算をやり直します。

タグ： Julia言語統計

posted at 13:41:58

#統計それでは、「n回中0回成功」「n回中n回成功」の両極端な場合を除いて比較したらどうでしょうか？

真の成功確率が0.3、n=10、事前分布Jeffreysの場合に、KL情報量で定義された予測誤差の両極端な場合を除いた場合の平均を計算すると

ベイズ→0.039
最尤法→0.050

でベイズの勝ち。 pic.twitter.com/mFXwTPkk2Z

タグ：統計

posted at 13:40:15

#統計真の成功確率が0より大きく1より小さい場合に、「n回中0回成功」「n回中n回成功」の場合の最尤推定の予測分布の汎化誤差は無限大になってしまいます。だから、平均汎化誤差も無限大になってしまう。

ベイズ法では事前分布のおかげで極端な場合も無難な推定を行うのでそういうことは起こらない。

タグ：統計

posted at 13:32:38

#統計続き

それに対して、データが「n回中0回成功」のときベイズ法では「成功確率はa/(n+a+b)である」と推測します。

この場合には、事前分布Beta(a,b)を決めるa,bは「n回中0回成功」「n回中n回成功」のような極端な場合が起こったときにどの程度無難に推定するかを決めているわけです。

タグ：統計

posted at 13:32:37

#統計続き

データが「n回中0回成功」になった場合には、真の成功確率が正であっても、最尤法では「成功確率は0である」と推測してしまう。真の成功確率が小さめの場合にこれは結構起こります。

続く

タグ：統計

posted at 13:32:37

#統計続き

予測分布を「成功確率k/n」(最尤法)と「成功確率(k+a)/(n+a+b)」(ベイズ法)のどちらにする方が良さそうか？

最尤法とベイズ法の推定結果はa=b=0の場合に一致するのですが、Beta(0,0)は定義されない(improper case)。

a=b=1/2の場合のBeta(1/2, 1/2)が所謂Jeffreys事前分布の場合。

タグ：統計

posted at 13:32:37

#統計ベルヌイ分布モデル(サンプルサイズnの場合の二項分布モデル)によるベイズ推定に関するメモ

独立試行で得たデータが「n回中k回成功」のとき、

(1) 最尤法では、成功確率はk/nだと推定する。

(2) 事前分布Beta(a,b)のベイズ法では、成功確率は(k+a)/(n+a+b) だと推定することになる。

続く

タグ：統計

posted at 13:32:36

kamekura(リベラルきのこ派) @kamekurasan1

#統計私のTLでは「頻度vs.ベイズ」の話題は皆無で、

「頻度vs.ベイズ」というおかしな対立図式を煽って来た人達に対する非常に厳しい批判

意外に見当たらない。

「頻度vs.ベイズ」の話題が盛り上がっているなら、「資料収集」のために是非とも見てみたい。検索しても見つけられない。 twitter.com/__sugiura/stat...

タグ：統計

posted at 13:10:08

非公開

タグ：

posted at xx:xx:xx

>「ニセ医療」を叩くとPVが取れる

これは正しい情報が拡散され、かつ正しい情報の発信者が適切な報酬を得られる、理想的な状況だと思うのですが、何が気に入らないのでしょうか？

エビデンスのない医療についてはメディアだろうがインフルエンサーだろうが批判されます。それが科学というものです。 twitter.com/ha_chu/status/...

タグ：

posted at 12:53:27

名取宏（なとろむ） @NATROM

「ニセ医療」ではないと断言する医師は残念ながらいるだろうね。ただ、そう断言する医師がいるからといって、血液クレンジングがニセ医療ではないことにはならない。 twitter.com/ha_chu/status/...

タグ：

posted at 12:51:44

おばけ @triwave33

須山さんの本の3D barplotをJuliaで書きたいんだよぉぉぉ！（右はしょうがないからPythonで書いた）誰か…知ってたら…教えて…

（引用: ベイズ推論による機械学習入門須山敦志 2.2.4 多項分布） pic.twitter.com/0mnwCXhI8Q

タグ：

posted at 12:18:14

不思議ベイズ紹介スライドを作成した人たちも真面目にテキストとか読んだのだろうけど，どういったテキストに好ましくないことが書いてあったのか，共有してくださったら世の中のためになると思うのです。

タグ：

posted at 12:07:59

ふみん305 @fuminn_hotaru

心理のおたけPh.D｜AWARD @psycle44

自分「JuliaでExcelファイル扱うで！」
自分「まずはテストデータを作って……」
自分「XLSXっちゅうパッケージがあるんやな」
Juliaくん「データ読み込んだで」
自分「ファッ！？　日本語だとふりがながついてくるんか！？」
※ちなみに日付はちゃんとDate型で読めるらしい
#Julia言語 pic.twitter.com/xDuNKUSGMb

タグ： Julia言語

posted at 11:26:04

下記資料で、主義による対立を助長しかねない不適切なベイズ推定に関する説明をしていました（@genkuroki 先生ご指摘ありがとうございます！）。元の資料はそのままに残し、コメント欄に適切な理解につながる資料へのリンク共有しました。
www.slideshare.net/yoshitaket/32-...
www.slideshare.net/yoshitaket/ws-...

タグ：

posted at 11:23:30

Katsushi Kagaya @katzkagaya

このように英語のテキストにもふつうに出てくるので注意が必要です。

タグ：

posted at 09:52:26

Katsushi Kagaya @katzkagaya

「事後分布はひとつ」という良くないと思う強調の例 pic.twitter.com/EUXrOvgjXL

タグ：

posted at 09:48:33

過去の論文ではそう意識してなかったからいざデータほしいとコンタクトがあったときにまごついたりして恥ずかしい。少なくとも今後は論文化のときにはちゃんとフォーマットしておきたいと思って今回の投稿以降はとか考えていたり。

タグ：

posted at 09:44:05

Katsushi Kagaya @katzkagaya

このように得られたデータセットはひとつにすぎなくて、それを元に事後分布を計算してもそれは定義しその上実現したとみなし多くは近似的に得たもの。結果の評価なしに正しいとみなしてしまうリスクが大きいと黒木さんは繰り返し警告、批判されていると思っています。twitter.com/genkuroki/stat... twitter.com/genkuroki/stat...

タグ：

posted at 09:39:01

自分のスタンスとしては再現するためのコードやデータは基本的にオープンにする、コンパイルしていたらその前のものを出す、データセットを入れ替えても使えるぐらいには可読性を高めておく、ぐらいまではデフォルトとして目指したい。共著者の所属団体の関係でいつもそうできるとは限らないだろうけど

タグ：

posted at 09:34:54

数理がわからないから，主義に走る。気持ちはわからんではない。哲学っぽい（深いっぽい）甘い言葉でくるむと人は簡単に流される。ということで，正しい推測方法は存在しないが予測が当たるかどうかを評価できる，ということをいつでもどこでも思い出して欲しい。

タグ：

posted at 09:32:04

残り62件のツイートを見る

論文化の際に全部公開した場合、競合チームを安易に利するのではないかともやる気持ちもわからんでもない。でもそれって今後のオープンサイエンス（特にFAIR principle）の流れとは相容れない考えなんですよね。

タグ：

posted at 09:31:30

特に植物分野での機械学習データセット非公開にしがち問題は結構深刻だと思ってる。この分野では、取得とラベル付けに（他分野と比べて相対的に）ものすごく労力とお金のコストがかかるので（続

タグ：

posted at 09:29:58

論文の査読者コメントが嬉しい。
「筆者らは論文に関わる再現に必要なコードやデータセットを全て公開している。summerizeされた論文のmethod sectionを読むしかなく、再現性や実装に苦しんでいた近年の植物科学者が機械学習を実際やってみようとmotivateする良い試みである」

タグ：

posted at 09:16:30

atusy @Atsushi776

モデル式をRmdの数式にできる！これは便利！！
bookdown.org/yihui/rmarkdow... pic.twitter.com/E8IS75RAMG

タグ：

posted at 09:08:32

yamazaks @yamazaksv2

「掛け算の順序で意味が変わるから困ることになる」と言っているのは、掛け順固定派のマッチポンプに過ぎません。むしろ実社会では、(ひとつ分×いくつ)も(いくつ×ひとつ分)もどちらも普通に使われているので、前者だと思い込んでしまう方が実害があると考えます。

タグ：

posted at 09:02:09

勉強不足だからJuliaの本とか読んだことないよ😢

タグ：

posted at 07:31:22

Juliaいいのかな？私もやってみよう！

タグ：

posted at 06:34:39

天才タンパクコンサル美少女3丁目 @Pavane1899

みなさんこれを読んで下さい。 twitter.com/enunununun/sta...

タグ：

posted at 06:05:34

「Twitterやめようかな」
「……」
　
「私なんか必要ないんだ」
「……」
　
「誰か反応してよ」
「……」
　
「Pythonはじめようかな」
「Juliaはいいぞ」「Juliaはいいぞ」「Juliaはいいぞ」「Juliaはいいぞ」

タグ：

posted at 05:16:03

鳥の「胴体・尾羽セクション」が（少なくとも今回計測した低速滑空では）「静安定確保のために負の揚力を発生」してはいないことなどがわかった。尾羽は翼面積を増やし正の揚力を発生するという意味では飛行機のフラップに近いが、失速に遠い迎え角でも抗力低減に役立つという点で機能的には異なる。

タグ：

posted at 03:16:55

少し詳しい解説。鳥の翼幅方向の空気力分布は、誘導抗力を最小化するような「楕円形の揚力分布」ではなく、粘性抗力を最小化するような「揚力係数一定」の分布に近いことがわかった (fig. 5)。鳥は飛行機と違って Reynolds 数が二桁以上低く、粘性抗力が誘導抗力に比べて無視できないためと思われる。

タグ：

posted at 03:16:55

このとき言っていた同僚たちの論文が published.
doi.org/10.1242/jeb.21...
Open accessなので誰でも読めます。
滑空する鳥が作る渦を、大量のヘリウム入りシャボン玉をLEDで光らせることで計測して、尾羽の役割を調べています。
内容がわからなくても movie 1 & 2 はきれいなのでぜひ見てみてほしい。 twitter.com/dynamicsoar/st...

タグ：

posted at 03:16:54

Colaboratory @GoogleColab

imuno@シリコンバレー7年目 @imunolion

Colab integration with Google Drive just got better. Authenticate only once per notebook. No authentication codes are necessary for private notebooks when using the 'Mount Drive' button in the file browser. pic.twitter.com/VyXhZziCVd

タグ：

posted at 03:01:34

@ringo_taka BASICは「コンピュータプログラムは書いてある通りに動くこと」以上の教育効果は微妙. むしろ「悪い習慣」も学んでしまうことを考えると有害な面もある. モダンな言語の中でも,数学との親和性を考慮してHaskell (関数とは何かの本質が学べる) やJulia (直感的に数式を扱える)が良いのではないか.

タグ：

posted at 02:43:23

#統計渡辺澄夫『ベイズ統計の理論と方法』の出版は2012年です。WAICについて知っている人はこの本もしくは渡辺さんの別の解説を読んでいるはず。

WAICについて知っているような人達の中にも、ベイズ統計について広まっている俗説を解説している人達がいる不思議。

タグ：統計

posted at 02:14:04

#統計以下のリンク先の、渡辺澄夫『ベイズ統計の理論と方法』からの引用部分は素晴らしい。

擬似哲学的な議論で分からないことを分かることにしてしまうのは非常にまずいというお話。

まずい統計学教育を何年も続けてやってしまった人はその逆向きを行う責任がある。

twitter.com/not_identified...

タグ：統計

posted at 02:08:19

@389jan @coro_NLP サンプルサイズの大きさはモデルのパラメータの数との相対的な比較で決まるのでその辺はどうなっているのでしょうか？

モデルの詳細まで私は確認していません。

タグ：

posted at 01:57:57

@genkuroki @coro_NLP 件の論文は，サンプルサイズが大きい場合の実験もやっていますね．ただ，漸近論の仮定が満足されているかは論文からはわからないですね．

タグ：

posted at 01:54:57

@389jan @coro_NLP 件の論文では、事前分布の対数部分にも β=1/T をかけているので、少なくとも形式的にはβ→∞でベイズ法→MAP法となります。事前分布が強くならないとMAP法に近付かない。

そして、その比較先はMAP法(罰則項付きの最尤法)です。

MAP法とMAP法に近付きそうな場合の比較になっている。

タグ：

posted at 01:53:29

@genkuroki @coro_NLP 有限のnでも破綻する場合は漸近論の仮定が満たされていないくらい「全事例」が足りないケースです．
偏った6面サイコロの出目をサンプリングして1の出目だけ極端に少ない（か，最悪ない）場合は，他の出目がどんなに多くとも漸近論の仮定は満たされません．nが有限だとしばしばこの状況が起きます

タグ：

posted at 01:52:05

@389jan @coro_NLP n→∞でのオーダーしか見ていないので、有限のnでは実際に計算してみないと分からないです。

タグ：

posted at 01:48:41

@sekibunnteisuu #数楽 2階の線形常微分方程式は、1階微分の項を消す同値な方程式に書き直すことはよくやります。本質的に同じ方程式であっても見かけが異なることがあって、ひとまずその形は計算しておく。

xy''+2xy+xy=0 はそれで解けちゃうので特別なケース。

タグ：数楽

posted at 01:46:26

@sekibunnteisuu #数楽 y = 2xy' + (y')² はめんどくさいです。この手の形はまず両辺をxで微分します。すると t = y' に関する1階の常微分方程式になる。それは x を t の函数とみると、xに関する1階の非斉次線形微分方程式になっているので解けます。

一般化はダランベール方程式とか呼ばれていたはず。色々大変。

タグ：数楽

posted at 01:42:59

非公開

タグ：

posted at xx:xx:xx

@genkuroki @coro_NLP MAP法を考えてるわけではないにもかかわらず，fullyに温度付きをしていることが事前分布の影響が強くなる奇妙な現象の原因なのではないかという考察が2つ目のポチ・でした．

タグ：

posted at 01:40:03

非公開

タグ：

posted at xx:xx:xx

非公開

タグ：

posted at xx:xx:xx

@genkuroki @coro_NLP だからこそ，T=1で負けてT<<1で勝つのが不思議という話から，かの論文は始まっています．
SGDはDLのような非凸最適化では大域最適に行くとは限らないのでバッチ正規化やDropoutの有無以前にそもそも最尤でもMAPでもない推定量がSGDで得られており，その乖離が効くのではというのが最初のポチ・でした

タグ：

posted at 01:38:36

@genkuroki @coro_NLP 特異モデルというより，正則・特異の両方を含む一般の場合で収束の早さが正則な場合「以上」（等号を含む）ということが証明されているのでは？

タグ：

posted at 01:36:18

@genkuroki @coro_NLP 正則モデルでもMAPとベイズは大差がない（経験的にはベイズの方が汎化損失が小さい）ので，MAPが機能するならベイズが負けるということはないはずです．

タグ：

posted at 01:31:55

非公開

タグ：

posted at xx:xx:xx

非公開

タグ：

posted at xx:xx:xx

非公開

タグ：

posted at xx:xx:xx

@sekibunnteisuu #数楽分岐

twitter.com/genkuroki/stat...

タグ：数楽

posted at 01:08:22

@sekibunnteisuu #数楽一般には二階の線形常微分方程式は非常に難しいと思います。

タグ：数楽

posted at 01:04:01

@sekibunnteisuu #数楽一般に a(x)y'' + b(x)y' + c(x)y = 0 に y = f(x)u を代入したとき u' の項が消えるような f(x) を作れます。

これを xy'' + 2y' + xy = 0 の場合に実行すると f(x)=1/x と取れることが分かり、y = (1/x)u すなわち u = xy とおくと、u''+u=0 になることも分かります。

タグ：数楽

posted at 01:02:32

Φ（x,y)＝0とおいて、dy/dx＝-（∂Φ/∂x)/(∂Φ/∂y)を代入して、Φ（x,y)をテイラー展開した形で、と考えようとしたけど、2変数テイラー展開、つまりaij*x^i*y^j　となってしまって、ややこしいことこの上ない。

　で挫折

タグ：

posted at 00:52:46

未だに分からないのがこれ

y＝2xy'+(y')^2

先ほどの2つと違って線型ではない。

答えは、y=xの関数　じゃなくて、xとyの関数＝0という形になるらしいのだが、どうすりゃ良いのかわからない。

タグ：

posted at 00:48:55

(x-1)y''-xy'+y＝(x-1)^2　これも、

yが多項式だと仮定して特殊解を1つ見つけ、
あとは、(x-1)y''-xy'+y＝0の一般解を、テイラー展開で見つけた。

答えがわかった後なら、(x-1)y''-xy'+yをもう一回微分すればいいと気づく。

タグ：

posted at 00:46:23

@coro_NLP @389jan 私はど素人なので注意。

タグ：

posted at 00:42:27

@coro_NLP @389jan MAP法が十分に機能している状況なら、ベイズの側の汎化誤差が大きくても不思議はないと思いました。

むしろ不思議なのは、MAP法にベイズ法が近付くはずのβ=1/Tが大きい場合(T>0が小さい場合)に、ベイズ側の方の汎化誤差が小さくなっているようなグラフがあること。

何がなんだかよくわかりません。

タグ：

posted at 00:42:05

でもこの変形は、答えがわかった上での後付けの変形。

xy’’+2y'+xy＝0

ここから、xy＝zと置いて、z''+z＝0　と変形できるって気づけるものなのだろうか？

一般的に気づく方法があるのだろうか？

タグ：

posted at 00:41:51

この答えがわかった上で、改めて考えてみる。

xyがsinxやcosxになるのだから、xyの形から何かが見えるはず。
(xy)'＝y+xy'
もういっちょ微分して、(xy)''＝y'+y'+xy''＝2y'+xy’’
つまり、(xy)''+xy＝0

ここからxy＝Asinx+Bcosxとなる。

タグ：

posted at 00:39:23

Shuhei Kadowaki @kdwkshh

静的なコード解析で行えるプログラマ支援の機能は普通に便利だしめちゃ使うけど，やっぱりなによりも編集中のコードのランタイムとインタラクティブに関われるっていうのが自分にとって欠かせないスタイルな気がしてきた．
JupyterとかJunoが提供してるスタイル．

タグ：

posted at 00:37:48

そうすると、e^ix/x　と　e^(-ix)/x　が出てくる。
で、これは　sinx/x　と　cosx/x　でもかまわない。

よって一般解は、(Asinx+Bcosx)/x

タグ：

posted at 00:35:39

@coro_NLP @389jan 特異モデルでの近似が不適切なくらいしっかり正則モデルの場合には汎化性能においてベイズ法の明瞭な優位性はないです。

その辺の状況がどうなっているか分かっているなら知りたいです。

タグ：

posted at 00:33:40

xy’’+2y'+xy＝0

この手の問題、幾何学で同補助線を引いたらいいのか思いつかないのと同様、どう変形すればいいのか思いつかない。

ということで、y＝Σak*x^k　とテイラー展開されたと仮定して、akの漸化式を求めて強引に出して見る。

タグ：

posted at 00:33:19

いつものアラートが上がるタイプの解説。 twitter.com/jindongkt/stat...

タグ：

posted at 00:31:30

@coro_NLP @389jan パラメータw=(w_1,… ,w_d)を持つモデルp(x|w)を考え、p(x|w₀)でサンプルを生成するとき、モデルが特異になるw₀全体の集合は測度零になります。特異モデルにぴったりなることは現実にはないと言ってよい。

だから、特異モデルで近似してよい状況が現実にどれだけあるかが重要。私は知らない。

タグ：

posted at 00:31:16

諸般の事情で、微分方程式をやるはめになった。

微分方程式はあまり勉強していない。
参考書見るのもしゃく

ということで、我流でやる。

タグ：

posted at 00:29:52

これね。 twitter.com/not_identified...

タグ：

posted at 00:29:40

渡辺澄夫「ベイズ統計の理論と方法」の7章。これはとても大事なことを言っている pic.twitter.com/6kdyjUOm2Z

タグ：

posted at 00:28:19

@coro_NLP @389jan 常にベイズの側が汎化性能が高くなるわけではないことは、単純なモデルで実際に計算してみれば分かります。

数学的に証明されているのは、特異モデルの場合です。特異モデルでのベイズ推論のサンプルサイズ→大での収束に速さは正則モデルより速くなります。MAP法ではそのことは保証されない。

タグ：

posted at 00:26:52

某先生の本に書かれている「ベイズ統計だと仮説が正しい確率がわかる」というのも誤りであることがわかった

タグ：

posted at 00:25:19