黒木玄 Gen Kuroki(@genkuroki)/2019年08月24日

【大事なお願い】私の名前で検索すると、このアカウントが大量に出てきます。私の実名を使って誹謗中傷をおこない、意味不明のサイトに誘導しようとしています。スパムおよび攻撃として通報し、ブロックしていただけないでしょうか。ぜひよろしくお願いします

twitter.com/kyot1225/with_...

タグ：

posted at 00:05:45

ごまふあざらし(GomahuAzaras @MathSorcerer

#統計 prior=randomizerの選択には主観が入っていてもいなくても良いという立場です。

あと、「事前分布も含めてモデルの設定は全部主観で決めたものである」というような無意味な議論はしないという立場です。

どうして誤りだと分からなかったを知りたいところ。

twitter.com/ohsaworks/stat...

タグ：統計

posted at 00:23:07

みんな正直にいってくれ、統計は実はよくわからんとおもってることを。。。

タグ：

posted at 00:31:30

#統計

ベイズ統計は【主観確率に基づく統計分析】である

という主張が誤りでないと思った理由を述べて頂ければ質問に答えやすくなります。

twitter.com/Ohsaworks/stat...

タグ：統計

posted at 00:31:58

#統計「客観確率」「主観確率」という用語を使用せずに、

* 現実の母集団からの無作為抽出によって生じる確率的揺らぎ
* 数学的モデル内部における確率分布に関する確率

のようなクリアな概念でベイズ統計については説明するべき。

前者の現実と後者の数学的モデルを混同しないことが大事。

タグ：統計

posted at 00:37:16

#統計例えば、事前および事後分布は数学的モデル内部における確率分布であり、現実における対応物を考える必要はありません。

数学的モデルはフィクションであり、基本的に何でもありなのです。しかし、現実の統計分析に役に立たない設定は自然に淘汰される。ベイズ統計は生き残った。

タグ：統計

posted at 00:42:40

#統計数学的モデルの設定は非現実的でも良い、現実の分析に役に立つ数学的仕組みを内包していれば十分である、という数学の応用における基本を忘れて、数学的モデル内部の設定に現実での対応物が無ければいけないはずだと誤解すると地獄が始まる。

タグ：統計

posted at 00:42:44

#統計例えば、事前分布と事後分布の現実での対応物が無くても、予測分布の予測誤差が十分小さかったり、モデル全体の平均自由エネルギーが十分小さかったりすれば、非常に役に立つのに、事前分布と事後分布の現実での対応物を探して「主観」「信念」「確信」が対応物だと言い出す。地獄の始まり。

タグ：統計

posted at 00:46:37

#統計

これは正しい→確率モデルや事前分布に個人の主観を入れてもよい。

ベイズ統計の仕組みは主観と無関係に純粋に数学的に働く。

しかし、こちらは誤り→ 【ベイズ推定は主観確率を用いて行われている】

さらに、これも誤り→ベイズ統計では【主観確率に基づく統計分析】を行う。

タグ：統計

posted at 00:53:06

#統計俺好みの確率モデルと俺好みの事前分布を使って、現実から得たデータからベイズ推定を行なっても良い。

しかし、その結果が何らかの客観的方法でダメであることが分かったならば、そういう俺好みのベイズ推定は却下されるだけの話。

タグ：統計

posted at 00:59:39

#統計さらに、事前分布がデータと確率モデルによって事後分布にベイズ更新されたとき、「俺の主観・信念・確信の度合いがデータによって更新された」という自由もある。

しかし、その結果得られたベイズ推定の結果が客観的にダメダメなら、その人の確信の度合いは信頼できないことになるわけです。

タグ：統計

posted at 01:03:13

浜之化猫 @hamanobakeneko

シウマイ級数:
1+3+6+10+15+21+28+36+45+55+ ...
部分和
n×(n+1)×(n+2)/6

タグ：

posted at 01:05:29

@tsatie #統計

(1) 現実とは異なる数学的世界を設定。

(2) 現実から得たデータと同じデータがその数学的世界でも観測された場合に、その数学的世界の法則を制限。

(3) 制限された数学的世界の法則が現実世界の法則を近似していると期待。

ベイズ統計はこういう仕組みの一種。

twitter.com/genkuroki/stat...

タグ：統計

posted at 01:18:54

#統計しかし、普通は、苦労して行った自分の推定結果をダメだと判定されることを避けるように、確率モデルと事前分布を選ぶものだと思います。

そして実際にそうしようとするとき、「事前分布」=「事前の主観確率の分布」と言われても全然役に立たないことに気付くわけです。その人が合理的なら(笑)

タグ：統計

posted at 01:22:32

@tsatie #統計現実で観測されたデータと全く同じデータが数学的世界でも観測されたならば、自分が設定した数学的世界が現実世界を近似しているだろうと期待したくなるのが、人情だと思います。

実際にそうなることを実現するには細部を色々つめる必要がある。そういう闘いでベイズ統計の仕組みは生き残った。

タグ：統計

posted at 01:25:59

#統計以上の型のベイズ統計の解説は私のオリジナルのつもりなのですが、過去に同じような解説をした人を知っている人がいれば教えて下さい。

補足：ベイズ統計では「数学的世界の法則の制限」は「条件付き確率分布」を取ることで実行されます。この経路ならベイズの定理は必須でない。

タグ：統計

posted at 01:30:40

かざみん / Asako Suzuki @withCRS

統計は実はよくわからん。

タグ：

posted at 01:35:14

スマホをメガネの代わりにしたいときは「明るく大きく」というアプリが便利です。拡大するだけでなく、明るさやコントラストが調整できたり、停止ボタンで止めて拡大することもできます。 pic.twitter.com/4i9GsX6P6u

タグ：

posted at 06:34:16

あと、出典の新井先生のご著書、『AI vs.教科書が読めない子どもたち』のリーディングスキルテストの部分もさっと拝読したんですが、点が低いとされる設問で、数学とか理科の知識の多寡が正答率に影響を与える問題があり、純粋に読解力を評価しているとは言いにくいように思いました。

タグ：

posted at 06:55:00

原点と点Aを通りX軸と接する円を選ぶ設問とかは、数学の語彙をしっかり覚えていないと解けないので、読解力ではなく数学の語彙が中心的に評価されているのではないかと思います。

タグ：

posted at 06:57:27

この「読解力」テストの成績と、学力の偏差値が0.8程度の相関を示すデータを示され、このデータの「解釈は2つに一つです」とし、
「偏差値の高い高校に入ると基礎読解力が上がる」という可能性と、
「基礎読解力が高いと偏差値の高い高校に入れる」
という2つの可能性を出されています。

タグ：

posted at 07:05:31

この２つの可能性は存在しますが、相関を解釈する時の大切な3つ目の可能性が抜けてしまっています。それは
「基礎読解力と偏差値に影響を与える第3の要因が存在する」
です。

タグ：

posted at 07:06:46

実際、心理学や教育学では、general inteligence (g) というものが想定されていて、これが様々な学力の指標と高い相関を示すことが繰り返し報告されてます。en.wikipedia.org/wiki/G_factor_...

タグ：

posted at 07:08:25

おばけ @triwave33

行列操作を含むiterationをpythonとjuliaで比較した。2次元のkernel行列の作成を2重for、list内包、配列で処理(2d)で試した。結果はどのやり方でもjuliaの圧勝。

python,juliaともにリスト内包の方がforより遅い（なぜ？）
あとjuliaは二重forと2Dの差がないので他にボトルネックがあるかも pic.twitter.com/p0yPSIo35s

タグ：

posted at 07:10:23

これまでの研究の流れをふまえ、この「リーディングスキルテスト」の成績が数学・理科・社会などの知識量も反映することも考慮しますと、この第三の可能性が正しいという可能性はより強まると思います。

タグ：

posted at 07:10:51

この解釈の違いは極めて重要です。なぜかというと、新井先生たちは、この僅かな調査結果をもって、読解力が低いことが、すべての教科の成績の低さに影響しているという仮説を出されていて、主にそれによって「論理国語」の重視という政策を実現しようとされているからです。

タグ：

posted at 07:13:53

たいへん興味深く重要と思われる仮説ではあるのですが、その論理に問題があり、国内外の過去の研究成果、エビデンスがその仮説をサポートするのには極めて不十分というのが自分の印象です。

タグ：

posted at 07:16:13

ご著書のこの仮説の部分には、僅かな調査結果が示されているだけで、学術的論文の言及・引用がほぼ皆無です。

タグ：

posted at 07:16:55

この仮説を研究として検証しようとしますと、「リーディングスキル」を重点的に教育した生徒と、そうでない生徒で、各種学力がどう推移するかを調べるような実験的研究がどうしても必要です。実験ではないですがこれに近いデータとして埼玉県戸田市の事例が言及されてました。

タグ：

posted at 07:19:26

埼玉県戸田市の教育委員会では「リーディングスキルテスト」を取り入れ、この観点を教育に反映させているとのことです。そうしたらところ、学力テスト成績が県内でトップになったとのことでした。

タグ：

posted at 07:20:48

おばけ @triwave33

もしかしてenumerateって遅くなるの？（内包の時に使った）

タグ：

posted at 07:21:41

これが事実であるとしますと、結構な説得力を持つエビデンスになるわけです。しかし、そのような明確な事実は自分が調べたところですと、見つかりませんでした。あまり上がっていないですし、指標によってはおちてます（ノイズ程度）。
www.toda-c.ed.jp/uploaded/attac...
bit.ly/33X5jpY

タグ：

posted at 07:26:28

経時的な「同じ児童生徒集団での比較」では国語の成績は低下してしまっているのに、数学の成績はアップしています。
www.toda-c.ed.jp/uploaded/attac...

タグ：

posted at 07:30:10

こういう面白いというだけで、エビデンス、まっとうな研究論文の裏付けがほとんどない仮説で、政策が決まっていってしまうのが日本という国なのかな、と。もっと科学的な研究を振興してもらって、エビデンスベーストの政策を進めていただかないとよろしくないように思います。

タグ：

posted at 07:33:00

分岐スレッド

twitter.com/genkuroki/stat...

タグ：

posted at 07:58:57

#統計訂正。自明な誤りなので訂正に必要はないと思うが。

❌ KL(1, 0.99) = ∞
⭕️ KL(0.99, 1) = ∞

KL(1, p) = log p なので KL(1, 0.99)≒0.01.

twitter.com/genkuroki/stat...

タグ：統計

posted at 08:03:30

#統計なるほど、その通りですね。

本当に言いたかったことは、99%の確率で偶数の目が出るサイコロを1回だけ振ったとき、「偶数の目が出る」という予測が当たる確率は99%だということ。

あと「100%偶数に目」と「99%偶数の目」では100%と99%で値がちょっとしか違わない。

twitter.com/tsatie/status/...

タグ：統計

posted at 08:10:17

この議論のスレッドで、塾講師の方と議論させていただいたわけですが、議論の中で、
「せめてMARCHかセンター国語9割レベルの国語力をつけてくださいませ。我々の言っていることが理解できるようになると思います。」
というようなアドバイス（？！）を何回かいただきました。 twitter.com/tsuyomiyakawa/...

タグ：

posted at 08:14:59

#統計確率分布Pの乱数列X₁,X₂,…,X_nがまるで確率分布Qの乱数列のように見える確率はP≠Qならば指数函数的に減少する。その減少速度がKL情報量KL(Q,P)です。

タグ：統計

posted at 08:15:52

#統計さらに、もしも、確率分布Qの乱数列に出てくるはずの値が、確率分布Pの乱数列の中に決して出て来ないならば、確率分布Pの乱数列X₁,…,X_nはnを大きくしたとき確率分布Qの乱数列に見えることは決してないということになります。その場合にはKL(Q,P)=∞となる。

タグ：統計

posted at 08:17:35

論理的な議論とか科学の議論においては偏差値とか学歴、年齢、職業その他は本来は無関係でしょう。議論以外のトピックは持ち出さないことが慣習として確立されるべきでは。先生が生徒と議論する場合でも権威を使って負かす、とかではなく、フラットな土俵の上で意見を交わすのが好ましいと思います。

タグ：

posted at 08:18:58

#統計

*【ベイズ推定は主観確率を用いて行われている】

や

* ベイズ統計は【主観確率に基づく統計分析】である

が少しでも正しい可能性があると思っていなければ、質問自体が無かったと思います。

どのように正しい可能性があると思ったかについて教えて下さい。

twitter.com/ohsaworks/stat...

タグ：統計

posted at 08:31:18

積分定数 @sekibunnteisuu

小学校算数での台形の面積の公式がどうこう、でもそうだが、教える公式の多寡で、ゆとりだの詰め込みだのと言うのは、非本質的だと思っている。

　多寡の問題じゃない。教え方の問題。公式・解法をさっさと教えて演習問題を何問もやらせて定着させるなんていうのは、くだらないと思う。

タグ：

posted at 08:37:57

自分が分かっていると思っていたら、ツイッターでこんなにつぶやいたりしない。

よく使われている教科書を読んだらよく分からないことが書いてあり、実はひどく間違っているのではないかと思ったことを重点的にツイートしている。

統計学の講義を受け持った経験がある人達はみんな分かっているのか？

タグ：

posted at 08:39:24

積分定数 @sekibunnteisuu

天むす名古屋 Temmus @temmusu_n

台形の公式が算数に入るかどうかなんて、正直どっちでもいい。面積の概念が分かっていたら公式を知らなくても求めることができる。

　2次方程式の解の公式が中学の教科書に載っているのは良くないと思っている。一般的な2次関数のグラフは高校で扱う。そことの関連のなかで解の公式を学んだ方がいい

タグ：

posted at 08:41:47

#超算数メモ。【視覚的工夫】に【教師は言葉で勝負する。こういうものに頼ってはダメだ。逃げるな】とあるベテラン教師だそうだ。この人だけの偏見でないとすると、#掛算の順序における困難も理解できそうだけど、本当にそんな逐語的精神で不都合はないのか。 twitter.com/zubattored/sta...

タグ：掛算超算数

posted at 09:07:25

ʇɥƃıluooɯ ǝıʇɐs @tsatie

@genkuroki 確かに此の手の僕のような誤解を減らすには「賭け事やら予想」という話にしておくのが良いのか。あとは平行宇宙か（笑。ふーむ。この話の前に普通のサイコロで「1の目が出る」に賭けたときに賭けに勝つ確率は1/6なわけだがそれを「「一の目が出る」という予測が当たる確率」と表現すると何が嬉しいのか

タグ：

posted at 09:50:58

ʇɥƃıluooɯ ǝıʇɐs @tsatie

@genkuroki Twitterの良いところは文字数制限なわけで当然無駄な言葉は省こうとするのだけど数学は特に難しい。お互い分かってる事や基本的だと認識している筈だと思うてる言葉はどんどん使うからだ。でもそこが難しい。特にこの統計の話は個々のことばの説明がどうしても長くなりただそこに疑問があるからだろう

タグ：

posted at 09:53:14

ʇɥƃıluooɯ ǝıʇɐs @tsatie

@genkuroki そして何より統計と確率が混ざってる #初学者な脳が抗議してる

タグ：初学者な脳が抗議してる

posted at 09:53:54

佐倉統 @sakura_osamu

@tsuyomiyakawa これ、問題が悪いと思います。論理的な曖昧さ、「名前」と「愛称」の関係、最後の「〜である」がどういう意味なのかなど、文意を一意に定めることができない文章になっています。そうすると、「こういう文章はこういう風に読むんだよ」という暗黙のルールを知っている子に有利になる。

タグ：

posted at 09:55:39

佐倉統 @sakura_osamu

@tsuyomiyakawa 「〜である」は、Alexandraの愛称にAlex「を含む」という意味にも解釈できるかもしれない。また、「この文章で与えられた情報だけから判断すると、「〈Alexandraの愛称＝Alex〉である」とも解釈できる。だけど、文の意味を解釈するというのは、必ずしもそういう作業のことだけではないと思います。

タグ：

posted at 09:59:27

#統計どう分かっていないかをもっと具体的に説明。

統計学の入門的解説では「母分散が既知の場合の平均の信頼区間の求め方」の説明がよく書いてあります。

しかし、母分散が既知なのに、母平均は未知であり、データから平均の信頼区間を求めたいケースで自然なものはあるのでしょうか？

タグ：統計

posted at 11:35:56

#統計例えば、全国の小学1年生の平均身長(単位cm)と標準偏差は

平成平均標準偏差
10年 122.5 5.14
20年 122.5 5.18
30年 122.5 5.15

と非常に安定しており、未知の今年の分散が既知の去年の分散に等しいと仮定して、小サンプルから平均身長の信頼区間を求めることは～続く

タグ：統計

posted at 11:35:58

#統計続き～十分に合理的でしょう。しかし、分散が去年と同じと仮定するくらいなら、平均身長も去年と同じと仮定して問題ないように思えるのです。

というわけで、私は「母分散が既知の場合の平均の信頼区間」の価値を理解していません。

以上が、私が分からなくなる典型的パターンです。

タグ：統計

posted at 11:35:59

#統計私なりに考えた自然かもしれない設定：過去のデータから、毎年の母集団分布は正規分布から少しずれているかもしれないが、そのずれは大きくなく、母分散はある値σ₀²以下と仮定して問題ないこともわかっているとする。このとき、〇〇年前と今年の平均を小サンプルで比較するために～続く

タグ：統計

posted at 11:57:51

#統計続き～、母分散が仮に可能そうな最大の値σ₀²であると仮定して信頼区間を求めてみた。

この設定であれば「母平均は未知だが、母分散は既知」と私には不自然に感じられる仮定をせずに済みます。

信頼区間を求めるために使う分散の値σ₀²は母分散(真の分散)ではなく、数学的モデル内での分散。

タグ：統計

posted at 11:57:53

#統計母集団分布の様子が十分に分かっていないからこそ統計分析をするわけです。

だから、母集団の真の分散が既知であるとする仮定は余りにも都合が良すぎると思う。

せいぜい「母分散の値は～の範囲におさまっているはずだ」程度のことしか言えない状況を想定する方が自然だと思う。

タグ：統計

posted at 12:01:21

かめさん @cogitoergosumkm

たしかに、母分散未知の場合の前置き程度にしかなってないような気もする具体的な応用があれば知りたい twitter.com/genkuroki/stat...

タグ：

posted at 12:13:42

かせがお @Kasega0

渡辺ベイズ普通に読みやすいしやっぱりこれをやってからPRMLを読むべきだったのかもしれない

タグ：

posted at 12:35:12

ごまふあざらし(GomahuAzaras @MathSorcerer

#統計時系列解析は「母集団からの無作為抽出の統計学」は違います。

【「小学校6年生男子の身長」とか、何年か測って、数年たったら母分散は過去の値から求めたものを使う】というのは私が実データを眺めて不自然だと思った設定。教科書にはその例が書いてありますが。

twitter.com/cojjyman/statu...

タグ：統計

posted at 12:46:22

夏も終わるようなので
ヘビで遊ぶ． pic.twitter.com/fg0i5xVj19

タグ：

posted at 12:56:23

ごまふあざらし(GomahuAzaras @MathSorcerer

#統計小寺平治著『ゼロから学ぶ統計解析』2002年のp.112には添付画像のように書いてある。この設定も私には不自然に感じられる。

教科書にはこういうことが書いてあるのですが、色々納得できない例だと思います。

サンプルサイズが900もあるのに、標準偏差は過去の資料の値を使っちゃうの？ pic.twitter.com/84Hd8E3Rfo

タグ：統計

posted at 12:56:48

This object can be iterated to produce values on demand, instead of allocating an array and storing them in advance pic.twitter.com/dxQOsSlM1B

タグ：

posted at 13:01:32

#統計 95%信頼区間は、適当にもっともらしい数学的モデルM(θ)を設定して、「データによってM(θ)が有意水準5%でrejectされないθの範囲」として求めれば良いだけのことなので、定義に戻れば計算もできるし、意味も明瞭です。

問題は教科書に解説用に載っている例に色々納得できない場合が多いこと。

タグ：統計

posted at 13:01:35

#統計まあ、「どんぶり勘定を手抜きの方法で行うために過去の資料から分かる標準偏差の数値を使う」のようにはっきり書いてあれば納得できるような気もするのですが、現実の平均身長の推移を見ると非常に安定しており、手抜きをするなら資料から分かる平均身長の値も使っちゃダメなのかとも思います。

タグ：統計

posted at 13:08:45

梅崎直也 @unaoya

今日はベイズ統計の授業で変分ベイズの話をして、ついでにKL情報量の話をしました。黒木さんのこの多項分布の話を使わせてもらいました。この話を聞くまでKL情報量の意味が今ひとつピンときてなかったけど、これのおかげでだいぶスッキリししました。 twitter.com/genkuroki/stat...

タグ：

posted at 13:11:59

梅崎直也 @unaoya

黒木さんが書いてたKL情報量のpdfを元ネタにして、KL情報量をベースにした統計や機械学習の授業をやってみたいな

タグ：

posted at 13:22:17

@sakura_osamu おっしゃるとおりだと思います。解釈が複数ありえて正答を一意に決めることができない問題はこの種のテストとしては適切ではないですね。リーディングスキルテスト、かなり普及してきて政策にも影響を与えつつあるようですし、設問の妥当性などについて精査＆研究が必要かと思います。

タグ：

posted at 13:24:14

阿部2 @cocotan_2

@genkuroki 大村平の本は「そのような状況はあまりない」とはっきり書いてあったような記憶があります。「そのような状況はあまりない」とはっきり言った上で、練習のために「母分散が既知の場合の平均の信頼区間の求め方」の説明をするのであれば問題ないと思うのですがいかがでしょうか。

タグ：

posted at 13:27:02

#統計「そのような状況はあまりない」のように書いてあるだけだと、どうしてその「あまりない状況」について「練習」しなければいけないのか分からなくなるので、まだ説明が足りないと思う。

私個人は「その場合については練習しなくてもよい」と思っています。続く

twitter.com/abiko_ushi/sta...

タグ：統計

posted at 13:33:32

#統計母集団分布が正規分布から程遠くなければ(←これの確認が必須であることも教科書に書いておくべき)、正規分布モデルのもとで標本平均と不偏分散とt分布を使って求めた信頼区間はそこそこ信頼できるものになります。続く

タグ：統計

posted at 13:37:57

#統計その場合の説明への繋ぎのために、「母分散既知」という非現実的な場合について扱うのであれば、少しは納得できます。

そういうモチベーションで「母分散既知」と仮定された場合を扱うのであればはっきりそう書いてくれないと困る。

タグ：統計

posted at 13:39:57

あなたの友人 @your_friend_bot

@tsuyomiyakawa @sakura_osamu この問いにどのような問題点があり、どのように修正すると良いかを子どもたちと議論すること自体が、子供たちの論理構成能力を高める良い方法である気さえしてきますね…。

タグ：

posted at 13:40:55

#統計すでに他のスレッドに詳しく書きましたが、「母集団分布が正規分布である」という仮定も到底納得できるものではないです。

統計分析に使うデータ以外の情報を使うことによって「このタイプの測定では誤差が正規分布することがよくわかっている」と言えるような特殊な場合以外は要注意。

タグ：統計

posted at 13:43:22

dhirooka @daigo_hirooka

AICとかベイズ周りの深い話に入ろうとするとどうあがいても渡辺ベイズ本に収束する。

タグ：

posted at 13:43:30

高橋かずひと@闇のパワポLT職人 @KzhtTkhs

#統計実際の分析では、分析で使う数学的設定が現実をどこまで近似できているかが大問題になります。

無作為抽出の仮定は真っ先に疑いたくなる。
正規分布の仮定は現実には普通成立していないでしょう。
などなど

目的に使える程度の精度が出れば十分なのですが、それはどのように保証されるのか？

タグ：統計

posted at 13:47:01

非公開

タグ：

posted at xx:xx:xx

@julialangisthe ですよねー🐤

タグ：

posted at 14:14:16

非公開

タグ：

posted at xx:xx:xx

先ほどの発表資料です→ hackmd.io/@antimon2/Sy28... juliatokai.connpass.com/event/136684/ #JuliaTokai

タグ： JuliaTokai

posted at 14:28:36

#数楽中心極限定理の証明の仕組み

A,Hが独立な確率変数で、E[H]=0, E[H²]=1のとき、

f(A+H/√n) = f(A) + f'(A)H/√n + f''(A)H²/(2n) + O(1/(n√n)),

E[f(A+H/√n)] = E[f(A)] + E[f''(A)]/(2n) + O(1/(n√n)).

Hと同じ条件を満たすKについて

|E[f(A+H/√n)] - E[f(A+K/√n)]| =O(1/(n√n)).

タグ：数楽

posted at 14:30:28

#数楽これを、平均0分散1で独立なX_k, Y_kで、X_kは同分布、Y_kも同分布なときの

A=(X_1+…+X_{k-1}+Y_k+…+Y_n)/√n, H=X_k, K=Y_k

に適用して、k=1,…,nについて和を取ると、

|E[f((X_1+…+X_n)/√n)] - E[f((Y_1+…+Y_n)/√n)]| = O(1/√n).

続く

タグ：数楽

posted at 14:30:34

#数楽ゆえに、E[f((X_1+…+X_n)/√n)] と E[f((Y_1+…+Y_n)/√n)] は、収束するならば、同じ値に収束します！

Y_k達が標準正規分布に従うなら、(Y_1+…+Y_n)/√n)も標準正規分布に従うので、E[f((X_1+…+X_n)/√n)] は函数fの標準正規分布による平均に収束する。中心極限定理！

続く

タグ：数楽

posted at 14:30:35

#数楽面倒なのでfに関する条件や K, H, X_k, Y_k の絶対値の3乗の平均が有限の値になるという仮定も説明を略した。そういう細かい所は自分で調節するのが普通。

重要なポイントは本質的にTaylorの定理しか使わずに証明できていること。O(1/(n√n))をn個足したものがO(1/√n)になるだけの話！

タグ：数楽

posted at 14:30:36

#数楽以上で紹介した筋道なら、「中心極限定理は本質的にTaylorの定理からの易しい帰結に過ぎない」と言い切れます。

モーメント母函数や特性函数を経由すると難しい部分が全てFourier解析に丸投げになってしまう。

しかし、中心極限定理はFourier解析よりずっと自明な結果に過ぎないのです。

タグ：数楽

posted at 14:30:36

#数楽以上の筋道については雑に書いたノート

genkuroki.github.io/documents/Intr...

に書いておきました。

学部生向けの「確率・統計」の教科書ではモーメント母函数や特性函数を経由する中心極限定理の「説明」が書いてあることが多いと思う。どうしてわざわざ難しい議論にするのか不思議。

タグ：数楽

posted at 14:30:37

@julialangisthe @KzhtTkhs 自作です、スライドに埋込です。↓
hackmd.io/@antimon2/Sy28...

タグ：

posted at 14:31:16

補足資料（裏で実験してた時の Jupyter Notebooks）も公開します→ nbviewer.jupyter.org/gist/antimon2/...
#JuliaTokai
twitter.com/antimon2/statu...

タグ： JuliaTokai

posted at 14:58:34

おばけ @triwave33

qiitaにガウス過程にJuliaを使ったら圧倒的に早かった話を書きました。

Juliaで反復数値計算をしたらPythonよりも圧倒的に速かった話 qiita.com/triwave33/item... #Qiita

タグ： Qiita

posted at 15:06:01

miso_taku @miso_taku0221

juliaとdocker

#JuliaTokai pic.twitter.com/1JEGpwK5A5

タグ： JuliaTokai

posted at 15:08:34

#統計 randomizerという用語は既出の赤池弘次さんの論説にあった言葉を私がそのまま流用しているだけです。

私の質問に真っ当に返答をするつもりがあるなら、「主観確率」は大まかに何だと思っているかの説明と、その概念を使用する必然性を示す必要があります。

twitter.com/ohsaworks/stat...

タグ：統計

posted at 15:21:13

#統計私の主張は

* 主観確率(=ベイズ確率)の概念は、ベイズ推定について説明するために不要である

です。これを認めれば、【ベイズ推定は主観確率を用いて行われている】は不要なものが必須であるかのように説明していることになり、誤りになります。

twitter.com/Ohsaworks/stat...

タグ：統計

posted at 15:21:16

#統計このスレッドでは、まずrandomizationという言葉が

twitter.com/genkuroki/stat...

で赤池さんの論説を引用した場面で登場していて、添付画像の引用中にrandomizerという言葉が登場。

スレッドを読まずに反応してしまうことは確かによくあることだと思います。私もやってしまうことがある。

タグ：統計

posted at 15:30:30

miso_taku @miso_taku0221

juliaによる混合整数計画法

#juliatokai pic.twitter.com/SojAgG1cXx

タグ： juliatokai

posted at 15:40:05

#統計リンク先の添付画像に引用した部分の終わりの段落付近で語られていることは、以下のようなことだと私は解釈しています。

事前分布として、主観の内容の表現となるような確率分布ではなく、単なるrandomizerを採用する場合には～続く

twitter.com/genkuroki/stat...

タグ：統計

posted at 15:45:09

#統計続き～、主観は、事前分布そのものではなく、そのrandomizerを事前分布として採用するという決定の中に入っている。そして、そのrandomizerを事前分布として採用すると決定したことの妥当性も検討されなければいけない。

だいたいこういう感じ。

タグ：統計

posted at 15:45:13

#統計そのように解釈した私は、現在ではWAICやLOOCVを使えば、どちらの事前分布が(予測誤差の意味で)優れているかを客観的に(高確率で)評価できる場合があることを示すための例を提示したわけです。

これで私が言いたいことはさらに明瞭になったはず。

twitter.com/genkuroki/stat...

タグ：統計

posted at 15:45:14

#統計私の認識は、赤池さんの時代にはすでに、ベイズ統計の説明に主観確率の概念は不要になっていましました。

赤池さんは論説の中で、単なるrandomizerを事前分布として採用することの決定をも“主観確率”と呼んでしまっていますが、そこの部分は「主観」に置き換えても問題ない。

タグ：統計

posted at 15:49:16

miso_taku @miso_taku0221

juliaで音声のデジタル信号処理に再入門したかった

#juliatokai pic.twitter.com/4YwqzIryUp

タグ： juliatokai

posted at 15:51:40

#統計そして、現代においては、渡辺澄夫さんによって、特異モデルの場合も含めて、i.i.d.サンプルのベイズ統計については漸近論の一般論が完成しており、有用な情報量規準も作られている。

こういう時代に【ベイズ推定は主観確率を用いて行われている】などと言うのは明らかに時代錯誤だと思います。

タグ：統計

posted at 15:52:31

残り25件のツイートを見る

高橋かずひと@闇のパワポLT職人 @KzhtTkhs

#統計現代的な事前分布の決め方については

watanabe-www.math.dis.titech.ac.jp/users/swatanab...

を参照。添付画像にも引用。

こういう知識があれば、

【ベイズ推定は主観確率を用いて行われている】

とか

ベイズ統計では【主観確率に基づく統計分析】を行う

が正しいと考えることは無理だと思います。 pic.twitter.com/VHlrCDg6SF

タグ：統計

posted at 15:59:49

MP3.jlはPR状態のものを入れました🐤
qiita.com/Kazuhito/items...
#juliatokai

タグ： juliatokai

posted at 16:30:17

プレタポルコ @PretaPorco

引きこもりの弟の工作・完成版！
(前回のはまだ途中だったらしいです！) pic.twitter.com/PFkshs0ElE

タグ：

posted at 16:40:12

前田敦司 @maeda

"米国環境保護庁（EPA）は、グリホサートが発がん性であると主張する表示をもはや認めない。連邦殺虫剤・殺菌剤・殺鼠剤法（FIFRA）表示規定を満たさない虚偽の主張だと判断したため" / “グリホサート発がん性は虚偽 - FoodWatchJapan” htn.to/R8WZNX6Lx6

タグ：

posted at 16:40:30

前田敦司 @maeda

"カリフォルニア州の批判の多いProposition 65がグリホサートのような製品にこの誤解を招く表示を要求し、人々に自分たちの直面するリスクについての間違った情報を与えてきた…グリホサート製品の登録業者は、90日以内にその警告文を排除した改訂表示案を提出しなければならない"

タグ：

posted at 16:42:18

プレタポルコ @PretaPorco

全体図！美しいかたちになってる…!!!!! pic.twitter.com/ztHBZOXIfR

タグ：

posted at 16:44:04

非公開

タグ：

posted at xx:xx:xx

プレタポルコ @PretaPorco

こちらの角度からもどうぞ！ pic.twitter.com/iXP1xqb4m7

タグ：

posted at 16:47:37

佐倉統 @sakura_osamu

@your_friend_bot @tsuyomiyakawa ぼくは、「この文章で与えられた情報だけに基づいて考える」という前提で「Alex」と解答しますが、「解答不能ではないか」との疑問が出されたら十分な反論はできないと思います。質問を「Alexandraの愛称の中には（　　　）がある。」とすれば良いのかな。

タグ：

posted at 16:59:38

OpenSourcES @opensourcesblog

A new post on geometric modelling.
Explanation of B-splines and visualizations using #julialang opensourc.es/blog/b-spline pic.twitter.com/4yBYwlSlvs

タグ： julialang

posted at 17:43:41

Yasuhiko TAKANASHI @YTAKANASHI4

天むす名古屋 Temmus @temmusu_n

実際には、これまで使っていた機器の設定を変えた場合など（例えば長さ10cmを切り出す設定を8cmに変えるなど）、分散は既知、ということはあり得ますね。
ただこの場合は平均を議論する必要性はないかも。 twitter.com/genkuroki/stat...

タグ：

posted at 18:35:03

高橋かずひと@闇のパワポLT職人 @KzhtTkhs

#超算数逐語的精神が不都合を生じる例はすぐに見つかったtwitter.com/kale_aojiru/st...。#掛算の順序固定指導にはさらに、こっそり交換法則適用を認めている指導項目があり、それを経験しても文章題では非可換wという瞞着がある。

タグ：掛算超算数

posted at 18:48:46

Togetter（トゥギャッター） @togetter_jp

ハッシュタグ付け直してRT🐤
「【JuliaTokai #3】Juliaで音声のデジタル信号処理に再入門したかった」
#JuliaTokai #Julia言語 twitter.com/KzhtTkhs/statu...

タグ： JuliaTokai Julia言語

posted at 18:57:09

「たらればさん、史実ジャンヌを調べたら #FGO ジャンヌの鋼メンタルは意外と忠実再現なのではと気づく。そして「姉ビームくらい撃つでしょ」の錯乱結論へ」togetter.com/li/1394627
が伸びてるみたい。みんな注目してるんだね！作成者:@motoyaKITO

タグ： FGO

posted at 21:03:03

Fermat's Library @fermatslibrary

Viviani's Theorem: in an equilateral △, the sum of the distances from any interior point to the 3 sides is equal to the height of the △ pic.twitter.com/ZM5Cb0GBpf

タグ：

posted at 21:20:02

Jun Fujiki @jun_fujiki

julia やんなきゃいけない流れ。

タグ：

posted at 21:21:34

≡c⌒っﾟωﾟ)っ @Kgm1500

#JuliaTokai で型システム入門のLTを聞いたおかげでソースコードが読めるようになった (読めるとは言ってない)。ありがたやありがたや

タグ： JuliaTokai

posted at 21:34:23

@Kgm1500 | ω・)｡oO （LTとは…むしろHT…）

タグ：

posted at 21:51:14

おうえ @oue50

転職の募集要項見てたらJuliaってあってググッたけどこんな言語あるのね

タグ：

posted at 22:18:37

ねぎとろ @D05E1

@jun_fujiki julia 良さそうですよね．特にベクトルとは何か，行列とは何か，プログラミング言語としてどうあるべきかを深く考えているところが．

www.slideshare.net/acidflask/desi...

タグ：

posted at 22:35:56

#Julia言語 Windows 8.1環境では特別な処置抜きに(GR.inline("png")抜きに)、10000個のpngファイルを生成して、GIF動画を作れました。コードは

nbviewer.jupyter.org/gist/genkuroki...

で公開してあります。OS依存の問題かもしれません。

twitter.com/julialangisthe...

タグ： Julia言語

posted at 23:20:03