黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2020年11月02日(月)
#統計 以下のリンク先の引用は、以下のリンク先のリンク先における
www.stat.columbia.edu/~gelman/resear...
Philosophy and the practice of Bayesian statistics Andrew Gelman and Shalizi
2012
の紹介からの孫引きです。この論文は『統計学を哲学する』でも引用されています(pp.84-87)。続く twitter.com/genkuroki/stat...
タグ: 統計
posted at 00:12:38
#統計 しかし、
ameblo.jp/yusaku-ohkubo/...
【事前分布は~主観的な事前の信念を反映させるものではない】
という実践データサイエンス的には普通の考え方を受け入れておらず、「信念」という解釈を捨てていない。
「主観確率」「信念」という解釈が無用であることを理解できないようだ。
タグ: 統計
posted at 00:19:39
#統計 8割おじさん達が公開しているリポジトリは
github.com/contactmodel/C...
にあり、
github.com/contactmodel/C...
には最尤法とベイズ統計(Stan)を使っているJupyter notebooksが置いてあります。どちらのノートブックでも R_t を推定している。
タグ: 統計
posted at 00:55:50
非公開
タグ:
posted at xx:xx:xx
ふと、練習がてらこのVMをJuliaに移植して、LuaJITやC++との比較でその速さを体感してみるのは面白そうかなと。あとRubyのOptCarrotをSmalltalkに移植して遊ぼうかと思っていたけど、このVMをRubyとPharoとかで書いて比べる方が腑に落ちそう。よほど暇でないとやれないけど…→twitter.com/sumim/status/1...
タグ:
posted at 01:44:08
#統計 p.31への書き込みを増やした。さすがに
【確率変数が持つ分布を特徴付ける値を、その期待値~という】
という説明はさすがにアウト。
あと、確率変数が従う分布はデータを取得した母集団分布とは限らないので、その平均(=期待値)と分散を【母平均】【母分散】と呼ぶのもダメです。 pic.twitter.com/xdy0DJg6qv
タグ: 統計
posted at 05:42:16
#統計 カギカッコ付きの「中心」を使った説明もまずいです。カギカッコに「厳密にはは中心ではないのだが」というニュアンスを込めたと忖度して欲しいのかもしれませんが、そういうことはやめた方がよかった。
このページの態度は多くの読者を落胆させることでしょう。 pic.twitter.com/aSYRH2mew3
タグ: 統計
posted at 05:42:18
#統計 この本では概念的に重要な事柄について驚くほど杜撰な言葉遣いで説明されています。
既出の例の他にも、最尤法について【データを最も良く予測するようなモデルのパラメータを求める】と「予測」という言葉を使って説明していることにはあきれた。続く pic.twitter.com/yrMM8Tlh0Y
タグ: 統計
posted at 06:07:45
#統計 「そのデータと同じ数値がモデル内で発生する確率が最大になるようなパラメータを求める」とか、「そのデータにモデルが最も適合するようなパラメータを求める」のようにより正確に書くべき。
「予測」という言葉は重要なので使うべきではなかった。 pic.twitter.com/UaLIU55goE
タグ: 統計
posted at 06:11:34
#統計 あと、最尤法の他にも最小二乗法があるかのように述べているが、最小二乗法は最尤法の特別な場合(残差を期待値ゼロの正規分布でモデル化した場合の最尤法)である。 pic.twitter.com/YbsYAtdMHk
タグ: 統計
posted at 06:13:35
#統計 添付画像の青線の部分は非常によくない。
ベイズ統計では、分析用のモデル内(モデルは事前分布も含む)での仮説の正しい確率は定義できるが、そのモデル自身の正しさや適切さは別に扱う必要がある。
この点は最尤法とベイズ統計のあいだで違いはない。続く pic.twitter.com/p46lIemJoW
タグ: 統計
posted at 06:17:32
#統計 最も簡単な統計モデルであるベルヌーイ分布モデルの場合の
* 最尤法のAIC
* ベイズ統計のWAICとLOOCV(一個抜き出し交差検証)
* BICと自由エネルギー
などに関するまとめが
nbviewer.jupyter.org/gist/genkuroki...
にある。最尤法とベイズ統計の違いはこの場合には小さい。
タグ: 統計
posted at 06:34:47
RT言及>
(1/3)BDAなどを読んだ私の拙い理解では,Gelman先生は,主観ベイズ(SavageらのNeo-Bayesian)や,客観ベイズ(みんなが合意できるような事前確率を目指す)の両者を強く批判していて,モデルチェックを伴うベイズ(「反証主義的ベイズ」とでも呼ぶべきもの?)を推奨しているのだと思います.
タグ:
posted at 08:57:00
(2/3) ”Keeping things unridiculous is what regularization’s all about, ….“とか,”I think weakly informative priors are, or can be, as objective as many other statistical choices, such as assumptions of additivity, linearity, and symmetry, choices of functional forms such as
タグ:
posted at 08:57:01
(3/3) in logistic regression, and so forth.”と述べているので,弱情報事前分布を,(古典的な意味で「客観的」なのではなく)上記引用の意味において正則化を行うモデル構成要素として「客観的」な側面を持つと考えているのかな,と思いました.
タグ:
posted at 08:57:01
MATLAB'zのLIVE Editor @nonlinopt
なんだいこりゃ?
julia> Pkg.add("Plots")
Resolving package versions...
ERROR: IOError: mkdir: invalid argument (EINVAL)
タグ:
posted at 10:28:50
MATLAB'zのLIVE Editor @nonlinopt
#vscodeビギナーのおっさんが通る
macでは問題なくvcodeで使えたjuliaだが、Windowsではエラーが出てプロットすらできない。_| ̄|○
julia> Pkg.add("Plots")
Resolving package versions...
ERROR: IOError: mkdir: invalid argument (EINVAL)
posted at 11:08:51
#統計 関連情報
なるほど。「客観ベイズ」も否定しておくのは良いことですね。
あと、最初に試す事前分布は適切な意味で「おとなしめの事前分布」がよいと私も思っています。それでダメなら「狭い事前分布」も試してみる。 twitter.com/bluesnono/stat...
タグ: 統計
posted at 12:11:39
#統計 少なくとも、Jeffreys priorを特異モデルの場合に使うと予測誤差(汎化誤差)が悪化するというようなことは知っておくべきことだと思う。
幾何的に定義される座標不変なJeffreys事前分布がダメな場合もある。
watanabe-www.math.dis.titech.ac.jp/users/swatanab...
タグ: 統計
posted at 12:27:35
#統計 私的なオーバーフィッティングの大雑把な定義:モデルのデータへの適合度の上昇と予測精度の劣化が同時に進行すること。
添付動画の右側の青線が予測誤差で赤線がデータへの適合度です。赤線下降と青線上昇が同時に起こっているときに過学習が起こっている。
nbviewer.jupyter.org/gist/genkuroki... pic.twitter.com/0Nee7trx1V
タグ: 統計
posted at 13:01:16
#統計 渡辺澄夫さんが解説しているその例で起こっていることは、数学的に非常に一般的に起こっています。数学的に、最尤法、ベイズ統計、仮説検定は互いに密接に関係している。
ベルヌーイ分布モデルの場合については私のノート(既出)
nbviewer.jupyter.org/gist/genkuroki...
を参照。WAICやWBICも扱われている。
タグ: 統計
posted at 14:06:18
#統計 最小二乗法は単なる直交射影の線形代数にしか見えないのだが(実際にはそのように見えるほど数学を理解していない人の方が多数派)、正規分布モデルの最尤法の一種になっているという認識は実践的な統計モデリングを行う場合には必須の教養のうちの1つ。
こういう点にも雑であってはいけない。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 14:12:47
#統計 繰り返しになるが、【確率変数が持つ分布を特徴付ける値を、その期待値~という】(p.31)という説明の仕方はひどすぎる。
統計学の文脈では「確率分布を特徴づけるパラメータ」という言い方が頻出なのでめちゃくちゃまずい。
確率分布を特徴づけるパラメータを検索↓
www.google.com/search?sxsrf=A... pic.twitter.com/DVFnRr69UY
タグ: 統計
posted at 14:31:00
#統計 添付画像はすでに引用済みのp.36の脚注部分。そこでは
【母数=期待値】
という書き方がされていた‼️
確率分布の平均や分散は期待値で表せるが、中央値はそうではない(一意に決まらない場合もある)。
集団の様子を要約するための数値は必ずしも期待値の形になっているとは限らない。 pic.twitter.com/z3BHWKNo02
タグ: 統計
posted at 19:29:42
ラズパイ一体型キーボード「Raspberry Pi 400」登場 国内では2021年以降に発売
www.itmedia.co.jp/news/articles/... pic.twitter.com/yDnq4NADgm
タグ:
posted at 19:45:05
ごまふあざらし(GomahuAzaras @MathSorcerer
JSXGraph というグラフ描画をする JavaScript ライブラリを例に
Juliaのコードを JSExpr.jl で JavaScript に変換し Jupyter Notebook 上で表示する例を作りました.
#Julia言語
gist.github.com/terasakisatosh... pic.twitter.com/aKKzq0oHSh
タグ: Julia言語
posted at 19:46:37
ごまふあざらし(GomahuAzaras @MathSorcerer
補助関数を定義すれば JSXGraph.jl から直接作ることも可能です.JSXGraph.jlはWIPなのでPRは大歓迎とのことです.
gist.github.com/terasakisatosh...
#Julia言語 pic.twitter.com/yYkNg7ifMm
タグ: Julia言語
posted at 19:48:14
#統計 その辺を誤解し難いように整理するためには
* 母集団分布の平均や分散を決してパラメータとは呼ばない。
* 「母数」という言い方も使わない。
* 確率分布族をパラメトライズしている変数はパラメータと呼ぶ。
とするとよいと思う。
あと、「母数=期待値」などと決して書かない(笑) pic.twitter.com/COOMSZENWU
タグ: 統計
posted at 19:50:03
非公開
タグ:
posted at xx:xx:xx
julia,PyCall,NetworkX,GraphVizとJupyter Notebookで「実行できるシステム図」が作れるんじゃないか
ノード間のデータのやり取りがリアルタイムで見れたり、PCにつないだデバイスを制御できたりしたら面白そう
タグ:
posted at 20:24:26
OokuboTact 大久保中二病中年 @OokuboTact
@temmusu_n 「日本の小学校の長方形の面積の公式」の歴史については
こちらの論文が参考になりますね
gair.media.gunma-u.ac.jp/dspace/bitstre...
タグ:
posted at 20:36:22
OokuboTact 大久保中二病中年 @OokuboTact
@temmusu_n #超算数
今回、私がツイートしようと思った理由は、岡崎市の小学校が出している分厚い算数教育研究本を読んだからです pic.twitter.com/zqIbwFmNBh
タグ: 超算数
posted at 20:52:11
@OokuboTact @temmusu_n #超算数 恐ろしいことに21世紀になっても、算数や中等教育の数学が「19世紀を引きずっている」ということは私もかなりあると思っています。
以前、方程式と恒等式に等式を分類する悪しき慣習について調べたら、19世紀のconditional equationとidentityの区別に対応していることに気付いた。続く twitter.com/temmusu_n/stat...
タグ: 超算数
posted at 21:57:30
@OokuboTact @temmusu_n #超算数 conditional equationとidentityについて引きずっているのは日本語圏に限らない感じがしました。
タグ: 超算数
posted at 21:58:45
#統計 『統計学を哲学する』は間違い探しで楽しむ本になることを覚悟して購入した方がよい。
この本の著者は「色々わかっていない」という印象がどんどん強くなって来る。
【「Major axes」と表示されているのが回帰直線。】(p.17, 図1.1)
見逃していたので追加。色々ずさん。 pic.twitter.com/tHPqlVoslg
タグ: 統計
posted at 22:44:56
個人的には次世代の学生に被害が及ばないか心配。
金銭および知識の両面で。
『統計学を哲学する』を他人に勧めた人達が本当にこの本の内容を理解して読んだとはとても思えない。
目を通してキーワードを拾っただけの印象で他人に勧めたんじゃないか?
タグ:
posted at 22:49:16
@OokuboTact #超算数 類似の内容をもつ資料がネットで公開されていました。
今崎浩『新小学校学習指導要領の授業: 算数科指導法』広島、広島文教女子大学、2017年。harp.lib.hiroshima-u.ac.jp/h-bunkyo/metad...
面積とはちょっと違うのですが、114頁に【その後,次第に属性間の論理的なつながりが把握されるようになるが, pic.twitter.com/oPuNTwnNrM
タグ: 超算数
posted at 22:55:18
OokuboTact 大久保中二病中年 @OokuboTact
@temmusu_n 岡崎市の算数教育を見ると、「算数教育の正しい方法が1つしかない」と信じているように思えるのです。
「暗記教育の弊害で生徒が算数(数学)の本質がわかっていない」という雰囲気が強い。
#超算数
タグ: 超算数
posted at 23:00:37
@OokuboTact 算数科においては論理には立ち入らず,直観的認識に基づいて図形の考察を進めていくようにする。】とかいって、算数と数学のちがいに重要性を認めています。
脱線ついでに89頁で【これらの除法の違いを意識させるために】と、包含除等分除の区別を子供に矯正すべきだと意見を述べていました。#超算数 pic.twitter.com/pmFE8AykP3
タグ: 超算数
posted at 23:01:17
OokuboTact 大久保中二病中年 @OokuboTact
@temmusu_n > 算数と数学の違いを強調するほど、算数の内容を貧弱な者にするという効果がある気がします。
発達心理学の「段階」と同じで、チョー算数独自ルールの根拠に使われそうですね。
タグ:
posted at 23:08:32
@OokuboTact @temmusu_n #超算数
「○○と考えなければいけない」
「小学生は論理的に考えられる筈がない」→マニュアル化すると「考えてはいけない」になる
のコンボ技ですよね。
タグ: 超算数
posted at 23:12:30
OokuboTact 大久保中二病中年 @OokuboTact
#超算数 #図形 #心理学
算数教育の偉い人達が書いた本には驚くべきことが書いてある。 pic.twitter.com/kDxf7Jc2q1
posted at 23:29:56
OokuboTact 大久保中二病中年 @OokuboTact
(続き)
#超算数 #図形 #心理学
その前の頁。
算数教育をよく知らない数学教師が見たら卒倒するんじゃないの? pic.twitter.com/W8ShuRJkMT
posted at 23:34:14
@genkuroki @temmusu_n @OokuboTact え、大学の教員養成に使われている教科書を読めば「日本の教育学は19世紀の内容から基本的に進歩していない」というのは誰でも気づくことだと思いますよ。だから1980年代以降学校がどんどん批判されるようになって収拾のつかない現在があるわけです。
タグ:
posted at 23:48:18
Starting with Julia lab
data-science-with-julia.gitlab.io/2020/11/02/sta...
#DataScience #MachineLearning #ArtificialIntelligence #programming #software #computers #Julia #julialang
タグ: ArtificialIntelligence computers DataScience Julia julialang MachineLearning programming software
posted at 23:52:03
#Julia言語 非常に丁寧に易しく説明する方針↓
Data Science With Julia | My attempt to explain data science to myself. data-science-with-julia.gitlab.io
タグ: Julia言語
posted at 23:56:14