Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
並び順 : 新→古 | 古→新

2019年08月18日(日)

東国原英夫 @higashi_kokuba

19年8月18日

「れいわ」代表は2013年当時、まるで福島の野菜が毒物であるかのように「東日本の食材を僕は食べない」と宣い、原子炉施設の安全総合評価の意見聴取会で怒鳴り散らし、賛成派を罵倒し、会の議事運営を妨害しました。あの頃から、私は彼を信用出来ないのです。 twitter.com/ranmaru48/stat...

タグ:

posted at 00:14:40

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 i.i.d.サンプルのベイズ統計の漸近論の本質的部分は

広中の特異点解消 + 一般化されたLaplace近似

genkuroki.github.io/documents/2016... pic.twitter.com/MKioquEo81

タグ: 統計

posted at 00:45:17

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 ただし、一般化するのはLaplace近似の弱いバージョン。

- log ∫_{ℝ^d} e^{-n(x_1^2+…+x_d^2)} dx = (d/2)log n + O(1)

を使い、O(1)の部分には触れない版。

タグ: 統計

posted at 01:00:15

Massimo @Rainmaker1973

19年8月18日

Instead of using pressure, this brilliant nutcraker effectively does the job with elasticity amzn.to/2i7Ub4O pic.twitter.com/gmKYbWB7Jc

タグ:

posted at 01:00:34

mathematica_command @mathematica_bot

19年8月18日

x=. : xに割り当てられている値を消去する

タグ:

posted at 01:05:51

ちくわ @pavlov469

19年8月18日

以前Scipyで書いたGMMのGibbs SamplingをJuliaで書き直した.Juliaは色々直感的に書けて良い. pic.twitter.com/SsE4u60sHQ

タグ:

posted at 01:20:40

ビネクラᐠ( ᐢ ᵕ ᐢ )ᐟ @VignetteClarity

19年8月18日

「17-7. Youngのモデルでお手軽にチューリング・パターン」を公開しました。
#チューリング・パターン #ライフゲーム
vigne-cla.com/17-7/ pic.twitter.com/Kpkt9PAGFt

タグ: チューリング ライフゲーム

posted at 07:21:00

青木俊直:Toshinao Aoki @aoki818

19年8月18日

「全裸監督」が話題でNetflixに加入する方が増えてると聞きますが、加入すると「ひそねとまそたん」というとても面白いアニメも全話見られますのよ。

タグ:

posted at 08:12:22

鯵坂もっちょ @motcho_tw

19年8月18日

ケーキの切れない愚行中年なので縦に切って等分しようとしたらどの辺りを切ればいいのか確かめてみた pic.twitter.com/t9QwonjUYv

タグ:

posted at 09:03:34

mattn @mattn_jp

19年8月18日

全く知らないどこかの国の大学生から「教授にネットワーク物理層を julia で実装しろといわれたが全く分からない。もう間に合わない。君は julia を書いている様だ。助けてくれ。」というメールが来た。すごい。julia ぜんぜん分からない。

タグ:

posted at 09:49:23

mattn @mattn_jp

19年8月18日

尚 bcc なので手当たり次第に送っている模様。

タグ:

posted at 10:00:24

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 その説明の仕方だとKL情報量KL(q,p)がpとqについて非対称である理由が全く見えなくなる。Sanovの定理によれば、KL(q,p)は

* 確率分布pの乱数列が確率分布qの乱数列ではないと確率的にばれる速さ

を意味しています。続く

twitter.com/of_complex/sta...

タグ: 統計

posted at 10:11:32

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 これは、

* 確率分布pで確率分布qのシミュレーションを実行したときの誤差

もしくは、さらに短く

* 確率分布モデルpによる確率分布qの予測誤差

と言い直しても良いと思う。

「pによるqの予測」と「qによるpの予測」は一般に異なるので、KL情報量KL(q,p)はp,qについて非対称になる。

タグ: 統計

posted at 10:11:33

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 Sanovの定理の解説は

genkuroki.github.io/documents/2016...

にある。

Sanovの定理:確率分布pによる確率分布qのシミュレーションの精度がKL情報量で記述される。

モデルpによる真の分布qの予測精度を扱っている。

統計学を学ぶための確率論の三種の神器は

* 大数の法則
* 中心極限定理
* Sanovの定理

タグ: 統計

posted at 10:11:33

天むす名古屋 Temmus @temmusu_n

19年8月18日

#超算数 339頁では、【勿論九九は乗法形式を単純化したものでありますが、それは事実関係を意味するものではなくて計算関係を意味するものであります。だから事実関係を考察せしめ様とする事実問題に於きまして九九を機械的に適用しやうとすることは九九の利用を誤ってゐます。→

タグ: 超算数

posted at 10:22:56

天むす名古屋 Temmus @temmusu_n

19年8月18日

→ のみならず事実関係をその関係的意味から考え様とすることを防害するものであります。】
現代の算数教育では計算を表わす式と場面を表わす式は違うなどという。論者は総九九に否定的な意見の持ち主であることに注目すれば、#掛算 の順序は九九とは分離して考えることが可能とも考えられる。 #超算数

タグ: 掛算 超算数

posted at 10:22:57

寅さん @RHTDz6V44OfJ9uC

19年8月18日

変形労働時間制の教員への導入

全教員に校長が

これまで教員がボランティアで行っていた残業を

校長命令により強制できる道が拓ける

一方で長期休暇中にその代休を取れることはないだろう

現在の教員の ほぼ無賃長期残業が問題視されている事態を

制度的に、国民から見たら問題がないようにする twitter.com/bigface1979/st...

タグ:

posted at 10:25:14

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 例:本当は偶数の目しか出ないイカサマのサイコロqについて、偶数が出る確率はwであると予測してしまったとする。

確率wで偶数の目が出るサイコロpでイカサマのサイコロqのシミュレーションを実行するとき、ボロが出るのは奇数の目が出た瞬間である。続く

タグ: 統計

posted at 10:28:36

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 続き

偶数の目が確率wで出るサイコロpを振り続けたときにボロが出ずにすむ確率が小さくなる「速さ」(予測精度)を求めてみよう。

サイコロpをn回ふったときボロが出ずにすむ確率
=すべてが偶数の目になる確率
=wⁿ
=exp(-n(-log w))

-log wに比例して指数函数的にボロが出ない確率が減少する。

タグ: 統計

posted at 10:28:37

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 この -log w が確率wで偶数の目が出るサイコロpによる常に偶数の目が出るイカサマのサイコロqの予測誤差を表すKL情報量になっている。

一般には

長さnのpの乱数列によるqのシミュレーションでボロが出ない確率
= exp(-n KL(q,p) + o(n))

となり、KL(q,p)をpによるqの予測誤差とみなせます。

タグ: 統計

posted at 10:28:38

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 微小訂正版言い直し

KL(q,p)
= 確率分布pによる乱数列で確率分布qのシミュレーションを実行するときに、qの乱数列でないことがばれずに済む確率が減少する速さ

p=qならば永久にばれずに済むので、KL(q,q)=0 となる。

タグ: 統計

posted at 10:32:03

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 確率分布のモデルのパラメータをデータを使って調節して、データを生成した未知の確率分布の振る舞いシミュレートする確率分布(予測分布)を作るときには、その予測誤差が当然問題になります。

KL情報量は「予測誤差」の数学的に素性の良い定義の1つになっており、非常に基本的です。

タグ: 統計

posted at 10:36:53

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 実用的には常に予測の失敗による損失を気にし続ける必要があります。そのとき、KL情報量が「予測誤差」の素性の良い数学的定式化であるという事実はベースライン的な重要性を持っています。

「予測を少々外しても損失は小さいので目を瞑る」というような考え方をするときにも予測誤差は基本的。

タグ: 統計

posted at 10:41:04

黒木玄 Gen Kuroki @genkuroki

19年8月18日

関連:過去の大学入試問題に関連の問題があるとみなせる。

twitter.com/genkuroki/stat...

タグ:

posted at 11:20:21

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#数楽

(nに依存して決まる確率) = exp(-n I + o(n))

すなわち

-(1/n) log(nに依存して決まる確率) = I + o(1)

を満たすnによらない量 I が存在する場合が確率論にはよく出て来る(大偏差原理)。I は「nに依存して決まる確率」が指数函数的に減少する速さ。続く

タグ: 数楽

posted at 11:49:09

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#数楽 KL情報量が出て来る仕組み(Sanovの定理)は、多項分布における確率

n!/(k_1!…k_n!) p_1^{k_1}…p_r^{k_r} (Σ k_i=n, k_i=nq_i)

の階乗部分にスターリングの公式

k! ~ k^k e^{-k} √(2πk)

の右辺を代入して -log を施せば

n Σ q_i log(q_i/p_i) + O(log n)

が得られることから分かる。

タグ: 数楽

posted at 11:49:10

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計

KL(q,p) = Σ q_i log(q_i/p_i)

の部分が、モデルの確率分布p_iで確率分布q_iをシミュレートしたときの予測誤差=KL情報量です。

スターリングの公式の右辺を代入すれば瞬殺できて、しかもその計算の仕組みが、KL情報量の導出とほぼ同じ問題が過去の大学入試で出されていたわけです。

タグ: 統計

posted at 11:52:50

apu @apu_yokai

19年8月18日

長男氏のPCにさっそく何かインストールされてるが私の知ってるマイクラとなんか違うな pic.twitter.com/TIeWWbcguJ

タグ:

posted at 11:54:51

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 KL情報量導出と本質的に同じ仕組みの計算の問題を東工大が入試で出したのが1968年であり、赤池弘次さんのAIC論文が1974年なので、「そういう雰囲気があった時代」だったのかもしれません。

タグ: 統計

posted at 11:57:05

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#数楽 以下のリンク先の計算は是非ともやっておくべき。スターリングの公式を認めれば多項分布の確率から自然にKL情報量が出て来ること(本質的にSanovの定理)が容易に分かります。

中心極限定理よりもずっと易しいと思います。

twitter.com/genkuroki/stat...

タグ: 数楽

posted at 11:59:51

ちくわ @pavlov469

19年8月18日

Jupyter Notebookをアップロードした gist.github.com/eqs/9b8d2fbc92...

タグ:

posted at 12:03:36

あ〜る菊池誠(反緊縮)公式 @kikumaco

19年8月18日

#おしどりマコ擁立問題 も有耶無耶に終わらせるわけにはいきません。立憲民主党はおしどりマコの数々の放射能発言を党として支持しているのかどうなのか、早く有権者に明らかにするべきです。「黙って、無かったことにする」など、野党第一党としてあまりに無責任です
@CDP2017 @edanoyukio0531

タグ: おしどりマコ擁立問題

posted at 12:04:39

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 スターリングの近似公式は、

n! = ∫_0^∞ e^{-x} x^n dx

で x = n + √n y と置換すると

n! = nⁿ e⁻ⁿ √n ∫_{-√n}^∞ exp(n log(1+y/√n) - √n y) dy

となり、n→∞で右辺の積分が

∫_ℝ exp(-y²/2)dy = √(2π)

に収束することから示されます。ラプラス近似の簡単な応用。

タグ: 統計

posted at 12:06:07

あ〜る菊池誠(反緊縮)公式 @kikumaco

19年8月18日

福島で避難指示が出されていない地域に暮らすことは、他の県に暮らすこととなんら変わりありません。被曝量は充分に低く、食品は安全です。事実を繰り返し伝えましょう。今日もこれを。よろしければRTお願いします twitter.com/kikumaco/statu...

タグ:

posted at 12:07:21

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#数楽 n! = ∫_0^∞ e^{-x} x^n dx はガンマ函数の特殊値なので由緒正しい公式だと思ってよい。x = n + √n y という置換積分を自力で思い付くためには、被積分函数 e^{-x} x^n のグラフを描いたり、より精密にその対数 n log x - x の最大値周辺でのテイラー展開を見ればよい。やってみれば分かる。

タグ: 数楽

posted at 12:14:21

あ〜る菊池誠(反緊縮)公式 @kikumaco

19年8月18日

スト破りを好意的に取り上げるニュースメディアってどうなんや

タグ:

posted at 12:24:43

あ〜る菊池誠(反緊縮)公式 @kikumaco

19年8月18日

ここまでノーコメントってことは、立憲民主党はおしどりマコの放射能関連発言を党として認めていると判断せざるをえませんよね。立憲民主は放射能デマの党だってことですよ

タグ:

posted at 12:30:46

mattn @mattn_jp

19年8月18日

これ良く読み返したら教授はあくまで「別の言語で」と言っただけらしく、本人が julia を選んだっぽい。(たぶん)

終了では。 twitter.com/mattn_jp/statu...

タグ:

posted at 12:49:01

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 未知の真の分布qが生成したサンプルから予測分布p*を作ったときに、予測分布p*による未知の分布qの予測誤差については当然気になる。

そのとき問題になるのは予測誤差の定義。

Sanovの定理を使えば、予測誤差を

KL(q,p*) = ∫ q(x) log(q(x)/p*(x))dx

と定義可能。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 13:03:14

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 ただし、予測誤差KL(q,p*)は未知の分布qを使わなければ計算不可能な量である。

KL(q,p*) = G(q,p*) - G(q,q), G(q,p)=-∫q(x) log p(x) dx

と書くときの、G(q,q)の部分(シャノン情報量)をサンプルだけから推定することは困難だが、G(q,p*)の部分(汎化誤差)はサンプルだけから推定地を~続く

タグ: 統計

posted at 13:03:18

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 続き~作ることができる場合がある。

未知の確率分布qのサンプルX_1,…,X_nについて、大数の法則より、

lim_{n→∞} (-1/n)Σ_{i=1}^n log p*(X_i)
= -∫ q(x) log p*(x) dx
= G(q,p*).

予測分布p*の対数尤度の-1/n倍

(-1/n)Σ_{i=1}^n log p*(X_i)

は汎化誤差の推定量になっている。

タグ: 統計

posted at 13:03:18

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 予測分布p*について p*(X_1)…p*(X_n) を予測分布p*のサンプルX_1,…,X_nに関する尤度(ゆうど、もっともらしさ度)と呼ぶのですが、「どうしてもっともらしい度とみなされるか」についてまじめに説明してある統計学入門書は非常にまれ。

だから「尤度」概念を理解できないことは正常。

タグ: 統計

posted at 13:03:19

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 しかし、尤度の対数の-1/n倍が汎化誤差の推定量になっていることは、予測分布の誤差の大小は尤度の大小で推測可能であるということを意味しています。

この事実を知れば、尤度と予測誤差のあいだに関係がついて、尤度がまさしく「もっともらしさ度」であることがわかります。続く

タグ: 統計

posted at 13:03:19

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 しかし、予測分布p*がサンプルX_1,…,X_nだけではなく、何らかの確率モデルを使って作られ、確率モデルが含むパラメータの数を増やした方が予測分布の尤度を無駄に大きくしやすい(過学習しやすい)ので、尤度だけで予測分布の予測誤差の大小を推測すると誤りが増えます。

タグ: 統計

posted at 13:33:53

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 その問題の解決の突破口を開いたのが、赤池弘次さんによる最尤法の場合に関するAICの仕事です。

p*が最尤法で作られた予測分布のとき、

G(q,p*)=-(1/n)Σ_{i=1}^n p*(X_i) + (nによらない確率変数)/n + o(1/n)

となっており、

(nによらない確率変数)の期待値=モデルのパラメータ数

続く

タグ: 統計

posted at 13:33:57

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 続き~となることが、ある条件(単純なモデルでは実用になる程度に近似的に成り立つことが多い条件)のもとで示せます。これは、

aic = -(対数尤度)/n + (パラメータ数)/n

が -(対数尤度)/n よりも精密な汎化誤差の推定量になっていることを示唆しています。

タグ: 統計

posted at 13:33:57

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 注意:対数尤度比のカイ二乗検定との相性を優先して、1つ前のツイートにおける汎化誤差の推定量aicの2n倍の

-2(対数尤度) + 2(パラメータ数)

をAICの定義とする習慣を採用していることが多いので注意。

統計パッケージが出力するAICは普通こちら側になっています。

タグ: 統計

posted at 13:33:58

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 未知の汎化誤差やサンプルから計算できる予測分布の対数尤度の-1/n倍のn→∞での漸近挙動を O(1/n) のオーダーまで調べることによって、対数尤度の-1/n倍よりも精密な汎化誤差の推定量を得ることができるという筋道になっています。

これはベイズ統計でも同様です(渡辺澄夫さんのWAIC)。

タグ: 統計

posted at 13:33:58

omion @16331633

19年8月18日

震災後何年かのツイッターでは放射能デマを批判したり嘘だと指摘するとクズだのウジだのゴキブリだの言われたもんだ。エア御用とかいう今ではわけわかんない罵倒もあった。脅迫されてる人もいた。でも「もの言えない世の中」「真実を言ったら攻撃される」って言ってたのは罵倒してる方だったねえ。

タグ:

posted at 13:45:32

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 ベイズ統計の場合には、数学的モデルとして「最初にパラメータwをサイコロをふって、その後は確率分布p(x|w)に従う独立試行でサンプルX_1,…,X_nが生成」という非現実的な設定を採用しています。

現実の母集団のサンプルは「真の確率分布q(x)に従う独立試行でサンプルが生成」と~続く

タグ: 統計

posted at 13:50:42

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 ~数学的に定式化されるので、ベイズ統計で使う数学的モデルが現実とは異なる仕組みでサンプルを生成する設定になっています。

しかし、そういう数学的モデルにおけるサンプル生成によって、未知の真の分布のサンプル生成の確率分布をシミュレートしたときの予測誤差は定義できる。続く

タグ: 統計

posted at 13:50:45

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 その意味での予測誤差に付随する汎化誤差は、

確率分布qのサンプルX_1,…,X_nでのベイズ自由エネルギー

のサンプルを動かす平均に等しいことを、超絶易しい計算ですぐに示せます。だから、この意味での予測誤差の推定量として、ベイズ自由エネルギーを採用することが考えられます。

タグ: 統計

posted at 13:50:45

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 しかし、ベイズ自由エネルギーF_nの定義は

F_n = - log Z_n, Z_n = ∫p(X_1|w)…p(X_n|w)φ(w) dw

で定義通り数値計算するのは非常に大変です。うまい近似計算法が色々開発されています。

まとめ:F_n はベイズ統計で採用したサンプル生成の数学的モデルの汎化誤差の推定量になっている。

タグ: 統計

posted at 13:50:46

omion @16331633

19年8月18日

震災後何年くらいだっけ。私くらいのアカウントだと2~3年くらいで「怖いリプ来るんじゃないか」とビクビクすることが減った気がするんだけど、たぶんデマ界隈がブロック推奨リストとか始めたからかな。

タグ:

posted at 13:53:01

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 このように

(a) 予測分布の汎化誤差
(b) ベイズ統計におけるサンプル生成の数学的モデルの汎化誤差

の本質的に異なる2つの量の推定量が考案されていて、どちらも

Sanovの定理:KL情報量=予測誤差

が基礎になっているので「情報量規準」と呼ばれています。

タグ: 統計

posted at 13:54:25

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 個人的な意見:「情報量」と「エントロピー」という用語に使い分け方を

* エントロピー ~ 確率の対数の1/n倍

* 情報量 ~ 確率の対数の-1/n倍 ~ エントロピーの-1倍

としておくと、すっきりする。

* エントロピーが大きい(情報量が小さな)状態の方が実現し易い

と言えるようになる。

タグ: 統計

posted at 14:02:02

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 汎化誤差

G(q,p*) = -∫ q(x) log p*(x) dx

の理解のためには、予測分布 p* をよく知っているものにしたときにどうなるかを調べる「計算練習」必須。

数学がからむ事柄で「計算練習」抜きに理解できることは全くないと思っていた方がよい。これは算数の段階ですでにわかっていることのはず。

タグ: 統計

posted at 14:18:01

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 しかし、目的が不明の単に複雑に見えるだけのモチベーションが湧きにくい計算問題を解くのはつらいし、そういう練習をしても理解度が上がる可能性は低いと思う。苦労しても報われる可能性は小さい。

多分、数学が苦手な人はそういう練習ばかりさせられたせいで苦手にされてしまったのだと思う。

タグ: 統計

posted at 14:21:43

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 例:q(x)の平均と分散がそれぞれμ₀, σ₀²であり、p(x)が正規分布

p(x) = (1/√(2πσ²))exp(-(x-μ)²/(2σ²))

のとき

G(q,p)
=(1/2)∫_ℝ q(x)(log(2π)+log σ²+(x-μ)²/σ²) dx
=(1/2)(log(2π)+log σ²+(σ₀² + (μ₀-μ)²)/σ²).

μ,σの函数としてのこれが最小になることと(μ,σ)=(μ₀,σ₀)は同値。

タグ: 統計

posted at 14:36:13

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 すなわち、正規分布モデルp(x)によるシミュレーションで分布q(x)のシミュレーションを行うとき、その予測誤差が最小になることと、正規分布モデルp(x)の平均と分散がq(x)と一致することは同値。

未知の分布q(x)の平均と分散の推定は実質的に正規分布モデルによる推定と同じ!

タグ: 統計

posted at 14:36:15

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 未知の分布のサンプルの平均と分散を計算することはよくありますが、特に平均と分散だけに注目することは、そうしている人は気付いていないかもしれませんが、実質的に正規分布モデルで考えているのと同じことになっているのです。

こういうことがちょっとした「計算練習」で判明する。

タグ: 統計

posted at 14:39:44

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 サンプルの様子から母集団分布が正規分布に全然近くないと推測されるケースでは、記述統計量として平均と分散だけに特に注目する態度をとることは適切ではないということも、これで分かったとして良いと思います。

タグ: 統計

posted at 14:43:20

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 こんな感じで

KL情報量=予測誤差=汎化誤差+定数

から出発して、ちょっとした計算練習をするだけで

平均と分散に注目することの意味

のような超絶基本的な事柄についてより深い洞察が得られるわけです。

こういう類の計算練習を繰り返し続ければ数学的認識力がどんどん高まる。

タグ: 統計

posted at 14:47:16

ʇɥƃıluooɯ ǝıʇɐs @tsatie

19年8月18日

つまるところ平均や分散は正規分布の_ような_分布を持つデータでないと大して意味がないということですか。まぁそんな感じはしてたけど。というかこの「意味がある/ない」の意味がアレですが。物凄く特殊なケースを統計学では学ぶのだという事か... twitter.com/genkuroki/stat...

タグ:

posted at 14:48:38

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#超算数 小学校での算数を始めたときから、計算練習を沢山やらされてしまうのですが、個人的には小学校の段階から、

より深い理解に達するための計算練習

をやってもらえるようにできたら、素晴らしいと思う。

敵は「苦手な子には意味もわからず機械的に解けるやり方を教えるべきだ」と言う奴ら。

タグ: 超算数

posted at 14:53:23

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#超算数 「苦手な子には意味もわからず機械的に解けるやり方を教えるべきだ」という扱いで算数を教わった子は、そのような扱いをされていることに気付いているだろうし、そもそも理解抜きに機械的に処理することは楽な頭の使い方ではないので、精神面と技術面の両方で虐待されることになる。ひどい。

タグ: 超算数

posted at 14:53:26

黒木玄 Gen Kuroki @genkuroki

19年8月18日

今までできなかったことができるようになったり、今まで見えていなかったことが鮮明に見えるようになることには、強い快感が伴います。そういう人生の楽しみを奪っちゃダメ。

タグ:

posted at 14:55:48

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 例えば、試験で、よくできる人達の総得点が飛び抜けて高くなってしまって、分布が1つ山ではなく、2つ山になってしまう場合には、平均と分散に特に注目することに大して価値はないと思います。

分布に2つ山ができる数学的モデルを使って色々推測した方がよい。

twitter.com/tsatie/status/...

タグ: 統計

posted at 15:12:25

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 サンプル中に明らかな外れ値があって、しかも外れ値が生じる理由にある程度心当たりがあるならば、「外れ値を除く」のではなく、外れ値が生じる仕組みもモデル化してしまった方がよい結果が得られる可能性がある。

関連↓
twitter.com/genkuroki/stat...

タグ: 統計

posted at 15:22:15

ちくわ @pavlov469

19年8月18日

ほんとはサンプリングに使った式も載せればよかったのだけどノートが手元になかったので…

タグ:

posted at 15:24:25

トッチ @Totti95U

19年8月18日

f(x)=x^3 - a xをn回合成した関数f^n(x)について、a->∞のときに絶対値が無限大にならない点はCantor 集合になるという問題を出されてグラフを書いてみたけど、確かにフラクタルみがある pic.twitter.com/FwguIiHPNH

タグ:

posted at 15:29:31

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 例:添付画像中の説明は、現実世界での男女の平均身長の差とベイズ統計で使う非現実的な数学的モデル内での確率の関係を何も理解できていない。

たぶん、数学的モデルと現実の区別も曖昧。

healthpolicyhealthecon.com/2015/12/18/bay...
頻度論 vs. ベイズ統計(前半)
投稿者: 津川友介
投稿日: 2015/12/18 pic.twitter.com/C6F5r4vlF5

タグ: 統計

posted at 18:06:46

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 例:以下の添付画像も同様に単なるデタラメ。

添付画像には引用しませんが、サンプルが確率変数であることに由来する確率を「確率」という用語を使わずにもってまわった言い方で説明している点も、この手のデタラメを書いている人達に共通しています。

to-kei.net/bayes/bayes_in... pic.twitter.com/Z40wPNJq8q

タグ: 統計

posted at 18:14:46

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 例:添付画像にもいつものデタラメが書いてある。「母集団の値」は「現実の母集団における真の値」と解釈されるが、ベイズ統計の仕組みは、数学的モデルに大きく依存する95%確信区間(信用区間)に95%の確率で真の値が入っていることを保証しない。

tomsekiguchi.hatenablog.com/entry/20180317... pic.twitter.com/82mwi7B7Tj

タグ: 統計

posted at 18:23:39

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 ググるとすぐに分かることですが、私が「数学的モデルと現実の区別が曖昧」という明らかな理由でデタラメ判定を下している型の解説が圧倒的に多数派。

サンプルが確率変数であることに由来する確率を「確率」と呼ばずにもってまわった言い方で説明していることもかなり共通している。

タグ: 統計

posted at 18:26:06

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 このような事実から、信頼区間や信用区間の解説を書いている人達の多くは、科学における基本的な考え方(数学的モデルと現実の明瞭な区別)をしっかりできていない状態で統計学の解説を書いていると判定せざるを得ない。

私は大問題だと思うのですが、どうですかね?

タグ: 統計

posted at 18:29:26

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 確率変数としてのサンプルを動かす平均の式を普通に書いているような人達は、以上で指摘しているような誤りを犯さないと思う。

数学的モデルと現実の区別が曖昧になってしまう理由は、その人が非科学的だからではなく、数学的複雑さに頭がついて行かなくて、こんらんしているのだと思う。

タグ: 統計

posted at 18:33:03

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 しかし、さすがに「ベイズ統計の95%信用区間には真の値が95%で含まれる」というような主張はあまりにもデタラメすぎて、あきれてしまいます。

「ベイズ統計では真の値も確率変数になる」などと思っている可能性さえある。

タグ: 統計

posted at 18:36:29

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 現実の母集団でのパラメータの真の値(例えば宮城県仙台市の小学6年生全体の男女比)が確定した定数になっていることは、統計学と無関係の当たり前の話だと思うし、現実の母集団からの無作為抽出されたサンプル(データ)は乱数の出目によって確率的に変化する確率変数になるのも当たり前の話。

タグ: 統計

posted at 20:53:16

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月18日

息抜きにTetris.jl (0.6じゃないと動かない)を試してみようと思ったんですけれどブロックが見えない(苦笑い) pic.twitter.com/EOZeOhi702

タグ:

posted at 20:58:40

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 サンプルが確率変数であることに由来する確率である「真の値が信頼区間に含まれる確率」について、「確率」という用語を使わずに「100回中95回」とか「割合」というような用語を使って説明することがまるで「常識」のようになっている様子は、確率概念を理解していない疑いを強める。

タグ: 統計

posted at 20:59:10

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 確率概念をよく理解していないのであれば、現実世界とは異なる設定で数学的モデル内部でのみ通用する確率を考えることができる様子をイメージすることは不可能だと思う。

そのことが原因で、ベイズ統計では数学的モデル内部でのみパラメータが確率変数になることを理解できなくなるのだと思う。

タグ: 統計

posted at 21:04:42

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月18日

iterm2 で実行するとブロック見えた(ポジションがおかしいれけれど) pic.twitter.com/OojkS9O5AW

タグ:

posted at 21:04:45

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 数学的能力に秀でていても、まるで常識のように語られている解説の権威に負けてしまって、世界的に広まってしまっている俗説に従ってしまうということはあると思う。

世界的に「認められている」俗説なのでそれに従っていても論文がリジェクトされることはない。一生、誤解は訂正されない。

タグ: 統計

posted at 21:08:49

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 「Fisherの正確確率検定は周辺度数がすべて固定されている特殊な場合しか全然正確ではないし、Fisherの正確確率検定に近付けるためにYates連続性補正をしたカイ二乗検定を周辺度数が固定されていない場合以外に使うのは誤り」という話がずばり書いてある論文

twitter.com/genkuroki/stat...

タグ: 統計

posted at 21:30:59

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 間違ったことが書いてある教科書の例
twitter.com/genkuroki/stat...

タグ: 統計

posted at 21:32:22

黒木玄 Gen Kuroki @genkuroki

19年8月18日

#統計 「2×2の分割表の独立性検定においてFisher検定は正確である」という誤解は、帰無仮説を数学的にどのように定式化して良いかに関する理解不足によって生じているように見える。

タグ: 統計

posted at 21:34:32

黒木玄 Gen Kuroki @genkuroki

19年8月18日

ちなみに純粋数学の教科書にも本質的に間違っている議論が書いてあることはよくある。

大学で数学を教えている側はそういうことをよく知っているし、「教科書に書いてあるから正しい」と思ってはいけないという教育を受けているし、学生にもそう教えてもいる。

タグ:

posted at 21:37:54

神原楓|公立中教諭 @wakateowl

19年8月18日

国語でもないのに,定期考査ですべての問題を『漢字指定』にする教師は非常に多い。

その理由を聞くと
『入試で漢字指定の問題が出るから,定期考査であらかじめすべての問題を漢字指定にしておくほうがよい』
とのこと。

漢字が苦手な生徒を,いたずらに躓かせる必要はないと思うのだけれどね。 twitter.com/kyokun_edu/sta...

タグ:

posted at 22:19:15

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月18日

遊ぶ方法
- Dockerを導入
- 次の内容を書いたDockerfileを作る.(テキストエディタを開いて Dockerfile という名前で保存する)

```
FROM julia:0.6.1
RUN julia -e 'Pkg.add("Tetris"); using Tetris'
```

続く

タグ:

posted at 22:39:12

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月18日

作成したDockerfileと同じ場所でターミナルを開いて次を実行する(tetris の後の . も必要)

```
$ docker build -t tetris .
```

続く

タグ:

posted at 22:39:12

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月18日

そのまま続いて次のコマンドを実行する.
これでコンテナ内にあるJuliaを実行することができる

```
$ docker run --rm -it tetris julia
```

タグ:

posted at 22:39:12

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月18日

以下JuliaのREPLのなかで

```
julia> using Tetris
julia> Tetris.setup()
```

を実行.しばらくしたらプレイ画面が出てくる.

- 上矢印キーでゲーム開始
- スペースでブロックを落とす
- 矢印キーでブロックを移動

以上

タグ:

posted at 22:39:13

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月18日

補足
iterm2 と Hyperターミナルで動作確認

タグ:

posted at 22:39:13

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月18日

Julia で 式を作ってそれを評価するのお手軽ね pic.twitter.com/KNzw0muiT5

タグ:

posted at 22:57:43

ごまふあざらし(GomahuAzaras @MathSorcerer

19年8月18日

公式doc そのままだけれど

新しい構造体に対するメソッドを随時定義するのは
いいね pic.twitter.com/f2nlxnxN78

タグ:

posted at 23:31:44

さとしん @satoshin_23

19年8月18日

この東国原氏のツイートがバズるのは当然として、このツイートに対するリプが凄いよなぁ。
言い方は悪いかもしれないけど、本当に「人としてどうなの?」って思うようなものばかり。ホント悲しくなるよ。 twitter.com/higashi_kokuba...

タグ:

posted at 23:41:51

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました