黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2021年12月08日(水)
非公開
タグ:
posted at xx:xx:xx
#統計 添付画像では標準偏差の不偏推定量を求めています。ただし、標準偏差のその不偏推定量は正規分布モデル内での不偏推定量にすぎません。
不偏分散が正規分布モデル以外でも普遍的に分散の不偏推定量になるのは非常に特殊な話になります。 twitter.com/genkuroki/stat... pic.twitter.com/szrhOsfstT
タグ: 統計
posted at 00:44:04
#統計 σのその不偏推定量は正規分布モデル内部でのみ不偏になる推定量なので、正規分布モデル外でも普遍的に母分散の不偏推定量になる不偏分散とは頑健性が大幅に違うことに注意。
「モデル内のみ不偏推定量」の不偏性は現実の統計分析では大して意味がないと個人的には思う。 twitter.com/kota222studyin...
タグ: 統計
posted at 01:20:06
Welchのt検定をするためには、非整数自由度のt分布の累積分布関数が必要。
統計ソフトでサポートされてない場合は自前で用意する必要がある。
excelの標準関数には無かったかな(分析ツールにはあるかも?)。 twitter.com/genkuroki/stat...
タグ:
posted at 01:30:22
#統計 #Excel
えっ!びっくりしたのでググってみた。
ExcelのT.DIST関数の解説に、確かに
【分布の自由度を整数で指定します。】
と書いてありました!
統計がらみではJulua, R, Pythonしか使わないので知りませんでした。
普通はt分布の自由度は正の実数全体。
support.microsoft.com/ja-jp/office/t... twitter.com/tchaikovsky102... pic.twitter.com/P1ReUvA26d
posted at 02:11:17
某大きな大学の某学部の統計学も専門らしい先生が「データサイエンスの教育でRは使わない方がよくてExcelを使うべきだ」と言ったという話を聞いたことがある。
めちゃくちゃまずすぎると思いました。
タグ:
posted at 02:13:37
算数教育界の100年を超えるおかしな教え方の伝統の側を子供の将来よりも優先しているという意識は、算数教育界のまずい人達にもないと思う。
おそらく、算数教育界が育てた素晴らしい教え方を広めていると思っている。
ただし、その根拠は「算数教育界の伝統に一致していること」だと思われる。
タグ:
posted at 02:22:58
かけ順擁護する人ってなんでみんな10個×3パックと3パック×10個じゃなくて数字と単位変え始めるんやろ。 twitter.com/mahiru_nyan/st...
タグ:
posted at 02:26:48
LLVM14ではループ不変量の解析が賢くなって、storeのないloadをループから(ループの外に)持ち上げる最適化ができるようになって、それでポスグレが12%速くなったりとか、結構でかく高速化されたみたいっすね(´・_・`)
タグ:
posted at 03:02:04
まっち@教員の転職力アップブログ @yurupoke_Match
教育実習後に教員を諦める人が多いのは
熱心な指導が受けられなかったからではなく、
毎日20時でも職員室の半数が残って、休日も部活や教材準備で多くの先生が学校にいるから。
それを目の当たりにしたから。
それが当然の状態だから。
#教師のバトン
タグ: 教師のバトン
posted at 06:01:00
統計量の分布をぼーっと眺める 〜中心極限定理観察〜 qiita.com/gilbert_yumu/i... #Qiita @gilbert_yumuより
【中心極限定理の可視化、また母集団によっては成り立たないことの可視化】
#統計 中心極限定理が成立しない場合や成立していても収束が遅い場合も扱っている点が非常に良い。
posted at 06:49:00
中心極限定理が特別に非常にうまく行く場合(ベルヌイ分布、一様分布、左右対称な分布の多く)の可視化だけを見て終わりにすると、中心極限定理による近似が小さなnで常に良くなるように誤解してしまうリスクがあると思う。
中心極限定理が成立してかつ収束が遅い場合の可視化は特に重要だと思う。
タグ:
posted at 06:53:42
#統計 和に関する再生性と条件付き分布 qiita.com/gilbert_yumu/i... #Qiita @gilbert_yumuより
これも教育的。条件付き確率分布の計算は基本の1つ。簡単だが、非自明さのある面白い例を紹介している。匙加減が非常によい。
posted at 06:57:55
#統計 ポアソン分布を和で条件付けすると二項分布となる qiita.com/gilbert_yumu/i... #Qiita @gilbert_yumuより
やばい。これも極めて教育的だった!
①条件付き確率分布の構成は本質的に重要。
②ポアソン分布は多くの離散分布のビルディングブロックになっている。
posted at 07:00:37
新しい記事がQiitaにアップされました!#Julia言語 #Julia日本語記事
qiita.com/picric_acid/it...👈
タグ: Julia日本語記事 Julia言語
posted at 07:11:21
学習指導要領小2算数の全文です。
順番が違うとバツとか書いてあるという人はどこにあるか指摘してください。お願いします。私はアホだから見つけられません。
#超算数 twitter.com/Rider000got/st... pic.twitter.com/I6hS4WfzEO
タグ: 超算数
posted at 07:22:15
@shoyugi @Aaron_Salieri19 land.toss-online.com/lesson/aan6nnl...
こんなにたくさん「説明」があるということは、後付けですね。
タグ:
posted at 07:26:55
#統計 Poisson分布をビルディングブロックにして、条件付き確率分布として、二項分布や多項分布を作り、Kullback-Leibler情報量のSanovの定理を得て、中心極限定理に至る計算の筋道については以下のスレッドを参照。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 07:33:28
#統計 もしくは、Poisson分布の条件付き確率分布で多項分布やKL情報量や多項分布の中心極限定理をとらえる話については、
genkuroki.github.io/documents/2016...
Kullback-Leibler 情報量と Sanov の定理 黒木玄
2016年6月16日作成
のpp.15-19を参照。
pp.15-18 pic.twitter.com/CZ3Qete4Ye
タグ: 統計
posted at 07:40:01
#超算数 かけ算の順序にこだわる必要はない、こだわるよう指導するのは悪であるという主張はよいのですが、【超算数教員と理系人たち】を対立させる点だけは厳しく批判します。理系の知る数学が我々をして掛順こだわりに反対させるのではないからです。普通の常識からして、掛順こだわりはおかしい。 twitter.com/nananao2236/st...
タグ: 超算数
posted at 07:46:31
#統計 中心極限定理の収束が遅くなるせいで、平均の95%信頼区間に真の値が含まれる確率(警告!確率的に揺らぐには信頼区間の側、確率だと言ってよい、割合だと言っている人達は分かっていない)が80%を切る例
nbviewer.org/github/genkuro...
の[5]にある。 twitter.com/genkuroki/stat... pic.twitter.com/fKXYXfY6Sh
タグ: 統計
posted at 07:51:12
#統計 n=20で平均の95%信頼区間に真の値が含まれる確率が80%を切ってしまうモデルの確率分布の確率密度函数pdfと累積分布函数cdfのプロット。
青線がそれ。橙破線はそれの二種類の正規分布近似。
[9]の近似では見た目的に青線はほとんど正規分布だと感じてしまうが、それは誤解である。 pic.twitter.com/JBxzTRFWPX
タグ: 統計
posted at 07:55:20
@shdy0417 @genkuroki 「最初の単位(と彼らが思っているもの)がこたえの単位(と彼らが思っているもの)になる」という信仰が優先されているのです。
タグ:
posted at 07:56:37
#統計
nbviewer.org/github/genkuro...
の終わりに中心極限定理の視覚化を追加
添付画像は大きな山の右に小さな山が追加された分布の中心極限定理の収束の様子。小さなnで標本平均の分布の形が多峰型になっていてちょっと面白いです。
中心極限定理の収束の途中の様子は色々あります。 pic.twitter.com/Eo6iskpfZZ
タグ: 統計
posted at 08:28:53
@OokuboTact #超算数 昨日はおちゃらけたことをいってかなり失敗してしまいました。ファッショナブル・ナンセンスの表面を剝すと19世紀数学のごちゃごちゃした理論体系が露わになるわけですtwitter.com/temmusu_n/stat...。
タグ: 超算数
posted at 08:31:44
#統計
nbviewer.org/github/genkuro...
よく見るのは添付画像のような一様分布の中心極限定理の視覚化。n=5の段階で標本平均の分布がほぼ正規分布になってしまっています。この場合の収束は例外的に非常に速い。
これが普通だと思うのは危ないと思います。 pic.twitter.com/uPobghTzLq
タグ: 統計
posted at 08:31:52
@genkuroki さらに、困ったことに、
ExcelのT.DIST関数は自由度の引数に非整数を「指定できない」のではなく、非整数を与えると勝手に整数に切り捨てられて計算されます。
なので、きちんと結果の数値を見ないと、切り捨てられたことにすら気付きません。
勝手な憶測ですが、気づいていないユーザも多いかと。
タグ:
posted at 08:55:50
数学がめちゃくちゃ苦手であっても「3×2だとウサギが3本耳になる」と本当に教えていることに呆れざるを得ないのですが、事情を知らない人の中には、「場面を式に表す」を「場面から数値・数量に関する式を作る」の意味だと誤解して、おかしな教え方を擁護し出すというようなことがあるように思えます。 twitter.com/nananao2236/st...
タグ:
posted at 10:17:27
あと、これは10年前から言っていることですが、「3×2だとウサギが3本耳になる」(算数でもならないし、理科でも国語でもならない(笑))という教え方が論外なことは、数学が苦手でも当たり前に理解できることです。
理系大学教授を持ち出すのはミスリーディング。
タグ:
posted at 10:17:28
通常の批判では「非常識」という言葉は使い難いのですが、算数教育界の伝統が育てたおかしな教え方については例外的に「非常識」という批判は非常に適切であり、社会全体できちんと悪い意味で非常識扱いして行くべきだと思う。
数学がどんなに苦手でもダメだとすぐに分かる非常識な教え方をしている。
タグ:
posted at 10:21:30
理系大学教授については、例えば、数学者が算数数学教育の科研費を申請するための研究グループを組織する過程で、うすうす気付いた算数のおかしな教え方を情け容赦なく潰しにかかる議論を控えめにしかしなくなったり、批判することを避けたり、擁護するようになったりすることを批判するべき。
タグ:
posted at 10:26:38
理系大学教授の中には、昔のインターネット上の掲示板で算数教育におけるおかしな教え方を擁護する書き込みをした人もいます。
理系高学歴者達がおかしなことを言っている場合があることも認めて、その害について語ることは大事なことだと思います。
タグ:
posted at 10:26:39
非常識な教え方が堂々と行えてしまっていることの背後には、それを支える伝統とその後を継ぐ人を育てる社会の仕組み(それに合わせた予算執行と人事)があります。
不適切な算数の教え方の維持者達にお金とポストが回らないようにするにはどうするべきかについて考えないと永久ループ。
タグ:
posted at 10:33:53
非公開
タグ:
posted at xx:xx:xx
若い先生達が常識に基いて「子供を傷つけるような非常識な算数の教え方はダメ!」という意見に絶対的な自信を持つようになってもらいたい。
しかし、おかしなことを言っている側が、自分よりも相対的に社会的に上の地位に就き続けているのを見ると、そういう先生が自信を持ち続けるのは困難。
タグ:
posted at 10:45:17
相変わらず狂っている。
#超算数 #掛算 twitter.com/metameta007/st...
posted at 11:21:33
非公開
タグ:
posted at xx:xx:xx
OokuboTact 大久保中二病中年 @OokuboTact
@temmusu_n 現代フランス思想は数学や自然科学をコラージュの如く使う人がいるので、玉石混交になるのでしょう。
しかし百科全書的な雰囲気も伝統として持っているので、理解するのは難しいです
タグ:
posted at 12:03:21
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
OokuboTact 大久保中二病中年 @OokuboTact
@sunchanuiguru トンデモ算数を研究し過ぎておかしくなってしまったのでしょう。
タグ:
posted at 12:05:41
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
条件付確率とかベイズのなんだかとかの名称、最近まで知らなかった。
知ったときは、当たり前のことにまで名称がついているんだな、と思った。
積の法則、和の法則も同様。掛け算使うのを「積の法則」って、小泉進次郎かよw twitter.com/kale_aojiru/st...
タグ:
posted at 13:07:47
@sekibunnteisuu @Aaron_Salieri19 一生懸命やってるんです、みたいな方にいくやつもあるあるですよね
関係ねーよとしか😌💨(笑)
タグ:
posted at 13:14:16
@shoyugi @Aaron_Salieri19 #超算数
twitter.com/tritri32/statu...
間違った指導による間違った採点の画像をアップすると、先生のやる気が落ちるそうです。
間違った指導をするやる気が落ちることはいいことなので、どんどんアップしましょう😀
タグ: 超算数
posted at 13:20:38
David Neuzerling @mdneuzerling
Having fun with UnicodePlots.jl and Julia. I worked out how to animate plots in the terminal. pic.twitter.com/dZqTFRKL7u
タグ:
posted at 13:46:37
非公開
タグ:
posted at xx:xx:xx
新しい記事がZennにアップされました!#Julia言語 #Julia日本語記事
zenn.dev/picric_acid/ar...👈
タグ: Julia日本語記事 Julia言語
posted at 14:24:36
確かに、お金ないと使えない言語だとどうなんだろね、と思って、PythonとかJulia とかやり始めたんだけど、もう脳が年寄りなので、なかなか億劫でいろんなめんどくさいことをする気力がなくなって書けなくなってる。
タグ:
posted at 15:58:04
富谷(助教);監修 シン仮面ライダー @TomiyaAkio
Gauge field strings はいい本
(全文は読んでないけど) twitter.com/junyagi/status...
タグ:
posted at 16:12:32
写像の説明が「あるものを入れたら自動的にひとつのものが決まるルールのこと」とあるのはよろしくありません。かつてはそのように素朴に考えてられていましたが、19世紀あたりにそれではうまくいかない実例が次々と見つかって、七転八倒の末に現代的な写像概念にたどり着いたのですから。→ twitter.com/m_2sei/status/...
タグ:
posted at 16:25:16
times.abema.tv/articles/-/100...
監督の渡辺です。カレーのまとめ、ありがとうございます。チーム加藤の控室カットインは食べることにほぼ、持っていかれましたw
野原さんはABEMAに出ること自体が初めてで、収録の度に富山から上京、大変なことも多かったと思います。
(続く)
タグ:
posted at 16:49:51
被験者たちに48枚のカードを規則に従って並べる作業を行わせた結果、言葉を発さずに作業を行った場合に比べて、声に出して作業をしてもらった方がミスが大きく減少していたとのこと。このような有益ライフハックを日々発信してるので、いいなと思ったらフォローして下さい。journals.ntu.ac.uk/index.php/rugs...
タグ:
posted at 16:56:39
教員と学生の懇談会みたいなのに出た時に"今はこんなに金銭支援もあるのに学生が博士に進まない理由はなんだと思うか"っていうアンケートに書いてある金銭支援の例が学費相当分(学費免除無し)だったので大学院生も実は人間なので生活するためには学費以外の金銭も必要なためって書いて出した
タグ:
posted at 17:23:33
日本研究の現在および将来の専門家をこうして日本から遠ざけてしまった損失は、容易には見当が付かないくらい大きく、この2年ほどの大失態の影響は数十年続くだろうと思う。留学生一般に対する対応も含め、日本政府はとんでもない過ちを犯し続けている。
タグ:
posted at 19:00:25
客観的にみると、今は固体物理みたいな話が圧倒的に王道すぎなんで、こういう心配は杞憂もいいところだと思う。 twitter.com/cometscome_phy...
タグ:
posted at 19:31:53
噂の線虫癌検査 N-NOSE, 文春砲が炸裂していてあまりの内容の酷さにもはや笑えてきた。社長が線虫検査結果を決めていてそれで精度86%と宣伝って、完全に第二のセラノス事件じゃないですか。こんなんで来春上場予定って冗談でしょ🤭これはスポンサーの責任も問われるのでは…。bunshun.jp/articles/-/50574 twitter.com/sekkai/status/...
タグ:
posted at 19:35:13
minimal working examples抜きには曖昧過ぎて微妙に危険な感じ。よい推定、よい予測、よい意思決定の中身が不明過ぎる。
特に「意思決定」という言葉が「推定」や「予測」など任意の行動を決める意味が広い用語になっているせいで、「本当はよい意思決定を目指すべきだ」と誤解する危険性がある。続く twitter.com/yujitach/statu...
タグ:
posted at 19:41:39
教科書によく書いてある意思決定論では、パラメータ付きのモデル(推定推測推論用のモデル、以下単にモデルという)の内部で「最悪の場合の最善手」(ミニマックス)や「期待リスク最小化」(事前分布を主観確率と解釈すれば主観内で計算した期待リスク最小化)を考えます。
タグ:
posted at 19:41:41
続く。リスクの定義を決める損失函数として「推定の悪さ」「予測の悪さ」の指標にすれば「モデル内でのよい推定」「モデル内でのよい予測」が得られ、仮に「金銭的な損失」の指標にできれば「モデル内での金銭的に最適な意思決定」が得られます。
そういう話は確かに結構面白いです。続く
タグ:
posted at 19:41:43
用語の使い方について補足:統計学の文脈で「推定」(estimation)は「モデルのパラメータ値の決定」を意味することが多いです。「予測の悪さ」は予測分布と未知の真の分布の違いの大きさ(KL情報量がよく使われる)を意味することが多い。
タグ:
posted at 19:41:46
補足続き。だから【現象を記述しているモデルを推定】という言い方で「推定」という言葉を使うと、「与えられたモデルのパラメータの決定」という意味での統計学的な文脈での「推定」とは全然違う意味になります。 twitter.com/yujitach/statu...
タグ:
posted at 19:41:47
しかし、そのようにして得られた「よい推定」「よい予測」「よい意思決定」はモデル内で得られたものに過ぎません。
モデルそのものを丸ごと入れ替えた方がよい場合のことは一切考慮に入っていない。
「よい意思決定」全般がそういうものであることには、教科書レベルで注意が必要だと思います。続く
タグ:
posted at 19:41:48
曖昧な点をこちらが勝手に推測してこのスレッドを書いています。
「よい予測」はモデル選択の文脈でも意思決定論とは異なるスタイルで扱われています。
例えば、AICによる予測の良さ重視のモデル選択をそのような扱いの例として想定することもできます。続く
タグ:
posted at 19:41:49
ただし、AIC(および類似の指標)はどれも、予測のよさそのものではありません。
以下、予測誤差はKL情報量で定義されているとします。
推測先の未知の分布のAICを原点に取るとAICと予測誤差の確率的揺らぎの向きは漸近的に正反対で同じ大きさになります。特に、相関係数が-1になる.続く
タグ:
posted at 19:41:50
だから、AICが小さくなり過ぎることによってモデル選択に失敗した場合に選択されたモデルによる予測の誤差は非常に大きくなります。
これは、データが運悪く偏り過ぎていると、そのデータによる予測が大外しになることの、AICバージョンに過ぎない。
以上で紹介したリスクは交差検証でも完全に同様。
タグ:
posted at 19:41:51
さらに、仮にモデル選択に失敗していなくても、選択肢として採用したモデルの中に十分に妥当なものが含まれているとは限らない。
ひどい失敗の可能性を原理的に排除できない。いわゆる不良設定問題になっています。
しかし、以上で述べたリスクを承知でAICや交差検証を利用すれば十分に役に立つ。
タグ:
posted at 19:41:51
「よい意思決定」「よいモデル選択」などについて、「予測の良さは良い意思決定を意味しない」のようなことを私は言うべきではないと思っています。
各々の統計学的道具の限界が分かるように説明して、統計学がお墨付きが得られるような道具ではないことをいつでも強調するべきだと思います。続く
タグ:
posted at 19:41:52
教科書的な統計的意思決定論入門については、以下のリンク先で紹介した渡辺澄夫さんが説明用に提示した例を自分で計算してみるとよいと思います。
それらの例(および渡辺さんの解説)を理解すれば統計学の文脈での「〇〇はよい意思決定であるとは限らない」型の言説の危険性も分かると思います。 twitter.com/genkuroki/stat...
タグ:
posted at 19:41:53
「15種類の癌のうちどれかである可能性がある」なんて御託宣が下る検査はスクリーニングの役にも立たないと思いますが、「上手い検査員」にしか判定できないというのは波動測定器を思い出させてくれますね。 twitter.com/sekkai/status/...
タグ:
posted at 19:42:32
OokuboTact 大久保中二病中年 @OokuboTact
@sunchanuiguru スウキョウキョウの理論に惹かれる人達は、そういう素質の持ち主だとは言えそうですね
タグ:
posted at 19:49:22
@OokuboTact #超算数 遅くまでやっているある図書館で発見
古賀昇一「ヨーロッパにおける数学教育の新傾向」『算数と数学』第10巻第2号 (1959年2月)、6-9ページ。
【
§4 心理学の成果
ピアジェは、現代数学、特にブールバキの指摘した基礎的な数学的構造−−代数的構造、順序的構造及び位相的構造−−に注目し、
タグ: 超算数
posted at 19:50:52
@OokuboTact それらを知能の作用の解明に役立てている。
2-7才のこどもは、感覚を原動とした活動が中心であるため、否定及び相殺によって、例えば量がいくつかの部分に分割されても、それらの和は不変であることに気付かない。
#超算数
タグ: 超算数
posted at 19:51:07
@OokuboTact しかし、7-8才から11-12才になると、このような例は、見受けられない。 (……) 数学的構造と精神的構造との関連を一層究明すれば、これは数学教育の科学的基礎として役立つにちがいない。
】(9)#超算数 pic.twitter.com/3WYidXwmZr
タグ:
posted at 19:52:01
算数教育については、数教協の人脈での数学者および理論物理学者がたし算やかけ算の順序固定強制指導を擁護したり、推進したりしていたという歴史がある。
かけ算順序固定強制指導を氷山の一角とする算数教育の問題では数学者達にも歴史的に責任があると私は思っています。
twitter.com/kazerindou/sta...
タグ:
posted at 19:52:14
若いときにはこんなに酷いことになっているとは全く気付けませんでした。
責任の重さでは、算数教育関係者達の責任が最大で、その次がそれを支援した数学者達(銀林浩氏や森毅氏はその筆頭格)だと思うのですが、目が節穴で問題の存在に気付けなかった私のような人達にも責任があると思います。
タグ:
posted at 19:52:15
@OokuboTact #超算数 古賀昇一氏は当時、広島大学の助教授。欧州諸国の教育事情を紹介する記事を何本も書いています。かなり有望な情報源を発見したと思います。いずれにせよ、主流派にも数学=心理学直結傾向があったことの証拠を見つけたわけです。
タグ: 超算数
posted at 19:54:37
歴史をある程度知っていれば、「数学が得意ならこんなひどい教え方を擁護するはずがない」と信じてそれを前提に発言や行動するのは、負け戦が確定しているように思えます。
実際には、数学がどんなに苦手でも非常識すぎてやめた方が良いことがすぐに分かる教え方が堂々と行われている。
タグ:
posted at 19:55:20
私が本心から統計的意思決定論を面白がっていることについては以下のリンク先から、対戦型推定ゲームに関するスレッド群を見てください。
どんなに面白いものであっても、実践的に使う場合には要注意。 twitter.com/genkuroki/stat...
タグ:
posted at 20:05:57
宮原篤 6th「小児科医ママとパパのやさ @atsushimiyahara
これは…やはりセラノス事件を彷彿させるよね。
「尿一滴でがんがわかる」で話題 線虫がん検査「精度86%」は問題だらけ #スクープ速報 #週刊文春 #文春オンライン bunshun.jp/articles/-/505...
posted at 20:07:45
うおおおおすごい!
スピン模型をGPUを使って解く (副題:monolishを使って固有値を計算してみる) qiita.com/fockl/items/f6... #Qiita @D_A_worksより
タグ: Qiita
posted at 20:10:06
ねっ、医師たちみんな言ってたでしょ、『こんなのデタラメで意味がない』って。
しかし、この記事の内容を見たら、想像以上にめちゃくちゃですね。
ほぼ(というか完全に?)詐欺ですね。
「尿一滴でがんがわかる」で話題 線虫がん検査「精度86%」は問題だらけ bunshun.jp/articles/-/50574
タグ:
posted at 20:13:39
AICなどと真の予測誤差が正反対の向きに同じ大きさで揺らぐことの最も易しい場合の確認
↓
nbviewer.org/gist/genkuroki...
Bernoulli分布モデル
Bernoulli分布モデル(二項分布モデル)という最も易しいモデルで色々計算し尽くすのは非常に教育的だと思う。上記の対戦型推定ゲームもそういう主旨。 twitter.com/genkuroki/stat...
タグ:
posted at 20:13:49
EM菌の記事を6本書きました。失われた◯◯年と言われて久しいですが、その間に急成長したEM菌について多くの人に知っていただきたいと思います。 / “観る・知る・遊ぶ 理科の楽しさを実感!! - RikaTan 理科の探検” htn.to/BeCBGS
タグ:
posted at 20:44:55
@OokuboTact @sunchanuiguru twitter.com/metameta007/st...
メタメタさんは③は駄目だと言っているようです。それって、順序派と五十歩百歩なんだけど、分かっていないようですね。
タグ:
posted at 20:46:30
@OokuboTact @sunchanuiguru twitter.com/metameta007/st...
4人に3個ずつで、4×3も、順序派からしたら「論外」だろうね。
順序派とメタメタさんの違いは、許容する式の範囲の違いであって、本質的には同じですね。
メタメタさんが順序強制を批判するのは、五十歩百歩、目糞鼻糞を笑う、の典型例。
タグ:
posted at 20:49:31
ここ1ヶ月くらい?ガンプラ熱から何故か折り紙熱にシフトした上の子(6歳)の現在の作品。
よくわからんレベルになってた🙄 pic.twitter.com/2l0h8He4Xt
タグ:
posted at 20:51:28
すでに、対象者の87%以上が接種を受けているんだから当然でしょ。
強制もされずに9割近い方々が自主的に接種を受け、さらにまだ少しずつ接種率が伸びているなんて、まさに驚異的ですよ。 twitter.com/47news/status/...
タグ:
posted at 20:57:27
マンデルブロ集合の細部を拡大
細かく計算すればするほど、もちろんだけど計算時間が莫大にかかる
けど結構きれいに描けたなー
#julialang #luxor #creativecoding #generativeart pic.twitter.com/JBqCDrnno1
タグ: creativecoding generativeart julialang luxor
posted at 20:58:19
@OokuboTact @sunchanuiguru この人もmixiでやり取りしたときは、掛け算順序でバツには反対、と言っていたけど、本質的には同じですね。
selfyoji.blog28.fc2.com/blog-entry-477...
タグ:
posted at 21:00:44
@OokuboTact @sunchanuiguru それを批判できないメタメタさんはつくづく駄目だな、と思いました。
twitter.com/metameta007/st...
タグ:
posted at 21:01:59
ベイズの定理と名付けられた自明で詰まらない結果があたかも特別な重要さや哲学を持つかのように聞こえる解説の仕方を広めた20世紀の統計学の黒歴史の悪影響。
ベイズの定理のウィキペディアでの説明はそういう伝統に忠実なせいでトンデモ化している。 twitter.com/sekibunnteisuu...
タグ:
posted at 21:05:42
#統計 グラフに読み方
nはサンプルサイズで、wはサンプルを生成するベルヌイ試行のパラメータ。w=0.4(成功確率0.4)にしている。
横軸のkはn回中の成功回数。横軸は確率でスケールしてあるので、出やすいkの値の周辺の目盛りの幅は大きくなっている。n=100, w=0.4なので、k=400で幅は最大。続く twitter.com/genkuroki/stat... pic.twitter.com/vBkJwTioll
タグ: 統計
posted at 21:43:13
#統計 青線は、各データkごとにモデルから決まる予測分布の予測誤差。青線の値の正確な定義は,予測分布とw=0.4の真の分布のKL情報量の2n倍である。
予測誤差が最小になるのはデータがk=400の場合で、そこからずれるほどデータとモデルによる予測誤差は大きくなる。(これは当然そうなるべき結果)続く pic.twitter.com/liMDBYPZ0x
タグ: 統計
posted at 21:47:37
#統計 橙破線は、上段の最尤法の場合はAICで、下段のベイズ法の場合はWAICの値。ベイズ法ではLOOCVの値もプロットしているが、この場合にWAICとほぼぴったり一致している。
ただし、それらの原点をw=0.4の真の分布のAICやWAIC, LOOCVに設定してプロット。値は予測誤差にスケールを合わせてある。 pic.twitter.com/izzSZD9rAO
タグ: 統計
posted at 21:52:11
#超算数 大久保さんの指摘で【宮城教育大の田端先生】とは故田端輝彦氏だと気づいたtwitter.com/OokuboTact/sta...。
田端輝彦「同種の量の割合の導入に関する一考察」『日本数学教育学会誌』第85巻第12号 (2003年月)、3-13ページ。doi.org/10.32296/jjsme...
等分除的発想とかいうのはやや不安だが。画像(8) pic.twitter.com/iAgJJuzGtS
タグ: 超算数
posted at 21:52:49
#統計 AICやWAICやLOOCVは「それらの値が小さなモデルを選択する」という形式で使われる。それさえ知っていればひとまずそれらの定義を知っている必要はない。
橙破線は真の分布のそれらの値を原点にとってプロットしているので、
橙破線の値 > 0 ⇔ w=0.4に対応する真の分布モデルの側が選択される pic.twitter.com/EiiLmIlxrE
タグ: 統計
posted at 21:55:51
#統計
橙破線の値 > 0 ⇔ w=0.4に対応する真の分布モデルの側が選択される
でかつ、パラメータwが固定されていないモデルよりも、真の分布モデルを選択することは正しいモデル選択なので
モデル選択に失敗 ⇔ 橙破線の値 < 0
です。左右の端でモデル選択に失敗する。 pic.twitter.com/duU3dUd6Gw
タグ: 統計
posted at 21:58:34
#統計 データからパラメータを推定すると、データが運悪く偏り過ぎている場合に何が真に正しいかの判断を間違ってしまう、という当たり前のことが、AICなどの情報量基準を使っても起こることが以下のグラフの橙破線によって示されています。 pic.twitter.com/tFRMX90Zql
タグ: 統計
posted at 22:01:40
#統計 あと、ベルヌイ試行のようなシンプルなモデルを使った推定推測推論では、最尤法を使ってもベイズ法を使っても十分nが大きければ違いがないことも、グラフの上段と下段を比較すれば分かります。 pic.twitter.com/LpXTa1tAmW
タグ: 統計
posted at 22:03:33
#統計 さらに未知である真の予測誤差の青線とAICなどの情報量基準の確率的揺らぎの向きが正反対になっていることもグラフからひと目でわかります。
それにも関わらず、84%程度の確率で真のモデルの選択に成功する理由は青線と橙破線の期待値(1になる)が一致しているからである。 pic.twitter.com/KxwOYh7zIh
タグ: 統計
posted at 22:07:39
#統計 真のモデルの選択に失敗する両端の「橙破線 < 0」の部分では、そのとき選択されるモデルの予測誤差(青線)は非常に大きくなります。
モデル選択に失敗した場合の選択されたモデルの予測分布の予測誤差は一般似大きな値になります。 pic.twitter.com/8qhGIJbfRz
タグ: 統計
posted at 22:10:30
@sekibunnteisuu @OokuboTact セルフ塾の人は、結局、どういう主張なのか、よく分かりません。
1あたりの量を求める問題だから1/3で割ると言ってるのか、問題文に出てくる数値だけで式を書けなのか、問題文に出てくる数値で式を書けと指示すれば解き方考え方を制限して良いという主張なのか?
タグ:
posted at 22:11:32
#統計 以上の説明ではAICなどの定義の説明を略しましたが、適当な教科書で定義を確認すれば、ベルヌイ分布モデルは易しいモデルなので自力で以上と同じ結果を得ることはそう難しくないと思います。
#Julia言語 でのソースコード↓
nbviewer.org/gist/genkuroki...
posted at 22:14:12
私は例によって #Julia言語 で計算したのですが、ベルヌイ分布モデルの場合には各種の量に公式を作れるので、計算自体は非常に易しく、添付画像のように横軸を確率でスケールすることなどに大部分の時間を取られました。
視覚化の作業は多くの場合に重くなることが多い。
nbviewer.org/gist/genkuroki... pic.twitter.com/XIFICZLdDm
タグ: Julia言語
posted at 22:17:09
A Cesar o que é de C @cesarmarinhorj
Julia 1.7 Highlights
julialang.org/blog/2021/11/j...
#Julialang
タグ: Julialang
posted at 22:20:53
#統計 私がAICなどの情報量規準に関する解説を見つけた場合には、まずこのグラフに矛盾しているようなことを言っていないかどうかを確認しています。
AICがそのまま予測の良さを表しているかのごとくの解説は厳しくトンデモ扱いされるべきです。不良設定問題をなめるな。
nbviewer.org/gist/genkuroki... pic.twitter.com/BvanZM9IS3
タグ: 統計
posted at 22:20:55
#統計 繰り返し:AICがそのまま予測の良さを表しているかのごとくの解説は厳しくトンデモ扱いされるべき。
グラフを見れば分かるように、データが偏るとAICは小さくなり、予測誤差は大きくなります。
それにも関わらず役に立つ道具である、のように考えないとまずい。 pic.twitter.com/sQoi0IeTs8
タグ: 統計
posted at 22:25:21
Juliaで作って学ぶベイズ統計学 (KS情報科学専門書)
amzn.to/3pBLK2m
丁寧に各テーマのコードが記載されているので、あの計算、Juliaで実装するとこうするのか~というのがよくわかって良さ。
タグ:
posted at 22:27:49
富谷(助教);監修 シン仮面ライダー @TomiyaAkio
arxiv.org/abs/1510.07698
Witten のレクチャーノート
Three Lectures On Topological Phases Of Matter
トポロジカル絶縁体の文脈でニールセン二宮の定理に触れてた
タグ:
posted at 22:37:30
#統計 AICなどの情報量規準の値が、データが偏ると(真の分布のAICを原点に取ったとき)小さくなる理由も説明しておきましょう。
AICは予測分布の尤度が大きくなると小さくなるように定義されています。
実はそのことからほぼ自明にデータが偏るとAICは小さくなることが出ます。続く pic.twitter.com/UX0f5rdYLp
タグ: 統計
posted at 22:38:52
#統計
予測分布の尤度は「予測分布のデータへの適合度」です。
だから、データが偏っていると、データを生成した真の分布の尤度は小さくなり(真の分布のデータへの適合度は下がり)、データに合わせてパラメータを決めた予測分布の尤度は上がります。 pic.twitter.com/NVWFp8c6SP
タグ: 統計
posted at 22:38:55
#統計 だから、パラメータを固定していないモデルのAICからパラメータの値が固定されている真の分布のモデルのAICを引いて得られる値は、データが偏ると小さくなります。
尤度が分布のデータへの適合度だと知っていれば自明にそうなることがわかります。 pic.twitter.com/FQPhk9d3k5
タグ: 統計
posted at 22:38:56
@sekibunnteisuu @OokuboTact やはり、何を言ってるのか分からない…
メタメタ氏のコメントを受けて、こうなって、 pic.twitter.com/Xtch4giiwo
タグ:
posted at 22:44:52
@sekibunnteisuu @OokuboTact 最終的にこれ。
何を言ってるのか、わけが分からない… pic.twitter.com/J6kkFJICgy
タグ:
posted at 22:46:42
#統計 横軸を確率でスケールせずにプロットすると全く異なる印象のグラフが出来上がってしまいます。
確率が集中しているkの値は300~500程度で全体の0~1000の中では少数派。確率的に多数派の部分が多数派に見えるようにグラフをプロットすることを思い付いて実装するのがかなり面倒だった。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 22:55:10
Sato Shuntaro|佐藤俊太朗 @Shuntarooo3
Juliaの勉強を始めて、Rを使い始めた15年前ぐらいを思い出した。言語として新し目だから情報少なかったなー。
R tipsしかなかった。これにとても助けられた。
タグ:
posted at 23:02:44
プログラミング言語に馴染みがないので、比較的馴染みのある統計に強いRを触っていますが、コマンダーばかり使っているのでなんだかExcelが便利になったやつを使っている感じしかしません。
大人しくPythonやJuliaで統計分析をやる系の教本をめくった方が良いのかもしれません。
タグ:
posted at 23:10:42
現金5万円だと使い手がないからかなりの割合が貯蓄される。すると財務省は「現金給付しても貯蓄されるから給付は無意味」と言い張れる。クーポンは使い勝手が悪いから使われない可能性が非常に高い。全てケチケチ財務省の思惑通り。 twitter.com/kikumaco/statu...
タグ:
posted at 23:27:30
PseuDoctor@フォロワーさん以外 @_pseudoctor
【週間PseuDoctor】【社会】【教育】「もはや季節の風物詩と化した感のある『掛け算順序派の悪あがき』が今年も観測される」:などと書いたものの、実際には深刻な由々しき事態。何故なら「掛け算に順序が無いのは明らかなのに、屁理屈未満の言い訳を振り回す人が後を絶たない」から。
(1/9)
タグ:
posted at 23:37:32
PseuDoctor@フォロワーさん以外 @_pseudoctor
この話は古く、既に1970年代には論争になっていたらしい。私もかつてブログ記事に書いた…と思って引っ張り出してみたら、何とそれも11年前(そして季節はやっぱり今頃)だった pseudoctor-science-and-hobby.blogspot.com/2010/11/blog-p... 。
ではここで改めて、順序派の言い分(の一部)をまとめてみよう。曰く
(2/9)
タグ:
posted at 23:37:33
PseuDoctor@フォロワーさん以外 @_pseudoctor
・学習指導要領に書いてある(←書いてません)
・ピアジェの発達段階に応じた指導(←時代遅れの学説)
・教わった通りにできるか試されている(←でも嘘は正当化されない)
の如き。こうやって次々に異なる理由(しかも悉く間違い)が繰り出される事が、確固たる理由の不存在を示している。
(3/9)
タグ:
posted at 23:37:33
PseuDoctor@フォロワーさん以外 @_pseudoctor
そしてこれらの中で私が最も注目しているのは最後の「教わった通りにできるか」なる部分。何故なら、まさしく教える側が「自分が教わった内容を無批判に繰り返す事しかできない」からこそ、何十年にも渡って明確な誤りが再生産され続けてきたと推測しているからだ。
だってそうでしょう。
(4/9)
タグ:
posted at 23:37:33
PseuDoctor@フォロワーさん以外 @_pseudoctor
指導要領そのものも読まずに「指導要領に書いてある」と無邪気に言い切る。発達心理学を学ぼうともせずに時代遅れの「ピアジェの発達段階」を無批判に振りかざす。自分が「盲目的な教条主義」に陥るだけでも大概酷いのに、他人にそれを押し付けるに至っては言語道断。
ではここで改めて
(5/9)
タグ:
posted at 23:37:33
PseuDoctor@フォロワーさん以外 @_pseudoctor
「掛け算順序強制の害」を列挙してみよう。
1)そもそも嘘である。言うまでもなく教育現場では嘘は必要最小限にすべき。即ち危険防止や安全確保などのやむを得ない事情がある場合に限ってギリギリ許容される。勿論掛け算順序はこれにあたらない。
(6/9)
タグ:
posted at 23:37:34
PseuDoctor@フォロワーさん以外 @_pseudoctor
2)効率が悪い。「導入時の方便として有効」なる意見もあるが、それを支持する客観的データは無い。むしろ「一旦教え込んだ事を後から取り消す」方が非効率なのは明白に思える。教える側も(教わる側も!)リソースは有限なのだから、こういう効率の悪いやりかたは避けるべき。
(7/9)
タグ:
posted at 23:37:34
PseuDoctor@フォロワーさん以外 @_pseudoctor
3)社会全体に対する背信行為。こうした誤った指導により才能の芽を潰される子供がどれだけ居たか。大袈裟に言えば、社会の発展を妨げる行為だ。
4)最も重要な点。教育の大きな目的は「人生の可能性を広げる」事にある。即ち、学ぶ事により将来の選択肢が広がる。しかし順序強制は逆に
(8/9)
タグ:
posted at 23:37:34
PseuDoctor@フォロワーさん以外 @_pseudoctor
その選択肢を狭める。順序強制の呪縛から逃れない限り、数学者や物理学者、エンジニアやプログラマーなどいわゆる理系の職業はもとより、一般企業でも経理や分析など数字を扱う分野への進路は著しく困難になる。その意味でもこれは、本来的な「教育」とは相容れないものである。
(9/9)
タグ:
posted at 23:37:35
@OokuboTact #超算数 青木勇三さんは1898年生まれ、1950年から香川大学学芸学部教授でした。1951年指導要領算数の一般目標はブルクナーとグロスニケル (1947)の引き写しだと見破った人でもあります。
タグ: 超算数
posted at 23:40:41
こんなところにもピアジェ登場。
沖縄の左派の方から日本人のモラル云々と言われると、なんだか違和感を感じてしまう。
私などは「日本人のモラル」とか言われると「余計なお世話だ」と思ってしまうのだが…
宗教はなくても、日本人は共感の力でモラルを selfyoji.blog28.fc2.com/blog-entry-671...
タグ:
posted at 23:42:06
OokuboTact 大久保中二病中年 @OokuboTact
@temmusu_n > 1951年指導要領算数の一般目標はブルクナーとグロスニケル (1947)の引き写し
遠山啓の本にも同じことが書いてありますね
タグ:
posted at 23:42:37
家に帰ってきたら冷凍庫がこんなことになっていて普通に恐怖から「ヒッ!!」と声を上げてしまいました😭 twitter.com/toaruhimo/stat...
タグ:
posted at 23:44:52
@OokuboTact #超算数 遠山啓もリアルタイムで気づいたのかどうか? 青木の発見を塩野直道が喧伝して51年指導要領反対キャンペーンをしたからではないでしょうか。
タグ: 超算数
posted at 23:48:42
OokuboTact 大久保中二病中年 @OokuboTact
@temmusu_n 啓林館の教科書で有名な船越俊介氏もピアジェ研究をしています
www.lib.kobe-u.ac.jp/repository/810...
タグ:
posted at 23:49:33
OokuboTact 大久保中二病中年 @OokuboTact
@temmusu_n 遠山啓はいろんな本に書いてますが、青木氏より先なのか私にはわからないです
タグ:
posted at 23:51:16
@OokuboTact #超算数 青木が塩野に告げたのが1951年の夏だそうです(塩野の回想による)。前年の10月にもう中間発表があり、一般目標は公表済み。
タグ: 超算数
posted at 23:56:22