黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2021年07月21日(水)
#超算数 ちらっとデジタルドリルの話題がTLを横切ったので、古い内容だが、横浜市のそれを紹介する。これは、「はまっ子がくしゅうドリル」算数小学2年生の解答の一部。2014年に投稿したものを再掲した。 pic.twitter.com/Kgg4iY3buz
タグ: 超算数
posted at 23:34:47
#Julia言語
答えは「いいえ」です。
ガンマ函数が欲しければ using SpecialFunctions する。
methods(factorial)
とか
@ which factorial(21)
↓
github.com/JuliaLang/juli...
が神。
添付画像2はJuliaで factorial(1) = 666 にする方法。😜 twitter.com/iitenki_morute... pic.twitter.com/uwD0iBKnCc
タグ: Julia言語
posted at 23:22:28
Workshop on statistics is Live now youtu.be/IlPoU5Yr2QI #julialang #JuliaCon2021 @JuliaComputing @JuliaLanguage
posted at 23:09:29
reading: > julia 〇〇.jl してはいけないよ[実行方法] qiita.com/Authns/items/9... #Qiita @authns_kyoproから
タグ: Qiita
posted at 23:00:47
reading: Pluto.jl という対話操作が得意な Julia のためのノートブックの紹介 qiita.com/SatoshiTerasak... #Qiita
タグ: Qiita
posted at 22:54:34
ごまふあざらし(GomahuAzaras @MathSorcerer
資料は順次公開予定でしょうか? twitter.com/ichikawaosamu1...
タグ:
posted at 21:57:06
現在では「このまま行くと○○週間後に△△が原因で死ぬ人は1日あたりa人〜b人程度になるだろう」のような予測が出易くなっているし、他にも「潜伏期間がa日~b日程度」のような例もある。
幅を持たせた予測がモデル依存であることを忘れない人の割合が多い方が我々の社会は安全になると思います。
タグ:
posted at 21:46:56
100%の標準正規分布
と
95%が標準正規分布に従い、例外的な5%がかけ離れた値を取る混合分布
の密度函数の違いは見た目的には小さく感じられるのですが、上で紹介した計算例での後者では真の値を含む95%信頼区間達の割合(=確率)は80%を切ってしまいます。(添付画像の[5]) pic.twitter.com/ZMiG5XFCnB
タグ:
posted at 21:40:15
t分布を使う平均の信頼区間の計算結果の誤差の大きさ意味での「正規分布からかけ離れている」の解釈は一応非自明であることがわかると思います。
95%が標準正規分布に従い、例外的な5%がかけ離れた値を取る混合分布は上の意味で正規分布から程遠い分布になります。5%の例外の効果が大きい。
タグ:
posted at 21:36:17
上で紹介した計算例から、t分布を使う平均の信頼区間の計算結果の誤差の大きさ意味で、一様分布は正規分布に非常に近い分布だとみなせます。
一様分布乱数は数個足しただけで正規分布に非常に近い分布に従うようになる。
逆に言えばそういう場合だけを中心極限定理の例として採用するのは危険です。
タグ:
posted at 21:32:45
t分布を使う平均の信頼区間の公式は正規分布モデルの産物なので、サンプルを生成している確率分布が正規分布からかけ離れていると誤差が非常に大きくなる場合があります。
何も考えずにコンピュータにデータの数値を入力して答えを得るのではなく、サンプル内の数値の分布を直接見ることが大事。
タグ:
posted at 21:29:51
教科書に書いてある公式通りに平均の信頼区間実装のコード(たったの十数行)を書いて、ランダムに生成したサンプルから求めた95%信頼区間にサンプルを生成した確率分布の平均値が含まれる割合(=確率)をモンテカルロシミュレーションで計算するのは、コードを書くスキルがあれば以上のように易しいです。
タグ:
posted at 21:25:23
#超算数 #書き順
でも現場ではこうなってしまう。予想通りだねw
www.meijitosho.co.jp/edudb/detail.a... pic.twitter.com/5liSp0WBf2
posted at 21:21:32
#Julia言語 #統計
[1] t分布による平均の信頼区間の実装
[2] サイズn=20(以下同様)のサンプルが正規分布で生成されているなら、95%信頼区間にサンプルを生成した正規分布の平均値が含まれる確率は95%
[3] 一様分布では95%弱
[4] 指数分布では92%弱
[5] 80%を切る場合
github.com/genkuroki/publ... pic.twitter.com/4zNwD0aalO
posted at 21:21:17
#超算数 #書き順
www.tokyo-shoseki.co.jp/question/e/san...
教科書会社の言い分。
「現場からの要請で例を書いておくが、これじゃないと駄目と言うことじゃない。」 pic.twitter.com/IoCWMF79kc
posted at 21:19:50
非公開
タグ:
posted at xx:xx:xx
I just noticed this impressive #julialang growth statistic. The first #juliacon was 7 years ago. Yesterday's #JuliaCon2021 tutorials got the same number of YouTube views in 1 day that the first #juliacon videos got in 7 years! pic.twitter.com/gJ5zMkAIzF
タグ: juliacon JuliaCon2021 julialang
posted at 21:13:52
OokuboTact 大久保中二病中年 @OokuboTact
#超算数
平成13年(2001年)発行
「量について」
内包量とか外延量とか(遠山啓の作った奇妙な概念)
時代遅れのピアジェの心理学理論 pic.twitter.com/stBWMpZLo7
タグ: 超算数
posted at 21:06:25
OokuboTact 大久保中二病中年 @OokuboTact
#超算数
昨日の本の紹介を続けます。
twitter.com/OokuboTact/sta...
タグ: 超算数
posted at 21:03:15
Useful Algorithms That Are Not Optimized By Jax, PyTorch, or Tensorflow www.juliabloggers.com/useful-algorit... #juliabloggers
タグ: juliabloggers
posted at 20:44:08
【重版速報🎉】
ビッグニュースです。皆様のご愛読のお蔭で、あの「堀田量子」に本日再び“緊急重版”がかかりました!!
堀田昌寛・著
『入門 現代の量子力学 量子情報・量子測定を中心として』【3刷】
bookclub.kodansha.co.jp/buy?item=00003...
異例ずくめの大好評書です! ぜひ、皆様お手にとりくださいm(__)m pic.twitter.com/hPIV1pGkdq
タグ:
posted at 20:38:54
ごまふあざらし(GomahuAzaras @MathSorcerer
ベースが julia:1.6.2 かと思ったらjupyter ready なイメージの使用方だった。たしかに初めての場合はこっちの方が良いかも。 twitter.com/yoichi_t/statu...
タグ:
posted at 20:09:51
ごまふあざらし(GomahuAzaras @MathSorcerer
私がやりたかったことを実現してくれてる。偉い。 twitter.com/cortictechnolo...
タグ:
posted at 20:01:31
非公開
タグ:
posted at xx:xx:xx
Apparently my change to get BIG TENSORS working with CUDA.jl had some happy side effects discourse.julialang.org/t/version-1-7-...
タグ:
posted at 19:07:34
新しい記事がQiitaにアップされました!#Julia言語 #Julia日本語記事
qiita.com/yoichi_t/items...👈
タグ: Julia日本語記事 Julia言語
posted at 18:56:39
Genie v2.0.3 release !
#JuliaLang #GenieFrameWork
🔴🟢🔵
github.com/GenieFramework...
posted at 18:52:11
Re: RTs #Julia言語 のPyCall.jl + PyPlot.jl パッケージとRCall.jlパッケージは非常に良くできていて、Juliaからmatplotlibやggplot2をかなり自然な感じで利用できる。
Juliaからのggplot2の使用例
↓
nbviewer.jupyter.org/gist/genkuroki... pic.twitter.com/jE7mrocbMw
タグ: Julia言語
posted at 18:44:30
その質問先の人物から私はブロックされていますね。 twitter.com/alo3677/status... pic.twitter.com/RHPUXdD2eX
タグ:
posted at 18:01:09
#統計 さらに最下段部分に
【信用区間はベイズ統計学における区間推定で使われるもので、例えば母平均の区間推定を行ったときの95%信用区間とは「母平均が95%の確率で推定された信頼区間に含まれる」ということを意味します。】
とある。非科学的な信頼区間警察の典型例!
bellcurve.jp/statistics/cou... pic.twitter.com/FIGvVl5EuX
タグ: 統計
posted at 17:58:42
非公開
タグ:
posted at xx:xx:xx
#統計 添付画像に引用した説明はひどく間違っています。
現実の母集団から抽出したサンプルから計算した信頼区間と、信頼区間を計算するためのモデル内部で生成された仮想的なサンプルから計算された信頼区間を明瞭に区別していません。続く
bellcurve.jp/statistics/cou... twitter.com/alo3677/status... pic.twitter.com/GpJQq1kiX9
タグ: 統計
posted at 17:53:24
チョー算数問題とこのスレッドで述べた問題の共通点は、普及している教科書に問題があることです。
(実際には理系とは限らない)高学歴者達による非科学的な信頼区間警察行為などの原因も普及している教科書の側の問題であると考えられます。
これは教科書を書ける社会的に立派な人達の問題。
タグ:
posted at 17:13:08
Yet another #julialang installation video: Julia+IJulia+command line link.
This video created in view of the @JuliaConOrg workshops this week. Specifically my "Statistics with Julia from the Ground Up" workshop is entry level - so this video can help.
www.youtube.com/watch?v=KJleqS...
タグ: julialang
posted at 16:28:21
Oh, this is such a nice post about Julia's multiple dispatch www.moll.dev/projects/effec...
#julialang
タグ: julialang
posted at 16:25:50
この辺の話は、高等教育版のチョー算数問題だとみなせます。
社会の中で立派な地位をしめている人達がデタラメを述べまくっているせいで、改善の経路がまったく見えない。
算数教育専門家達は算数についてデタラメを述べる。
ある種の理系高学歴者達は非科学的な信頼区間警察を行う。
タグ:
posted at 16:23:00
このようにクリアに非科学的な信頼区間警察行為にはさらに続きがあって、「頻度主義の95%信頼区間ではなく、ベイズ主義の95%信用区間(確信区間)ならば、その区間に真の値が含まれる確率は95%だと考えてよい」と言い出すことが典型的なパターンです。
よくもまあデタラメなことを言えるものです。
タグ:
posted at 16:12:53
信頼区間警察の人達は
❌(*)「無作為抽出を繰り返し行って95%信頼区間を計算したとき、100回に95回ぐらいは真の平均値μを含んでいる範囲である」
のようなことをよく言うのですが、この言い方だとモデルと現実の区別が曖昧になります。
信頼区間警察の人達自身がひどく非科学的!かなりひどい。
タグ:
posted at 16:12:53
モデルと現実の混同は非科学的誤りの典型例なので、現実世界で得たサンプルから信頼区間を計算する実践的な場面と、現実ではなく数学的モデル内で生成されたサンプルから信頼区間を計算する場面を明瞭に区別する必要があります。
これができていない人達はクリアに非科学的です。
タグ:
posted at 16:12:52
これを、「数学的モデル内の正規分布で繰り返しサンプルを生成して95%信頼区間を何度も計算するとき、100回中95回の割合で95%信頼区間はサンプルを生成した正規分布の平均を含む」と言い直すことは問題ないです。
科学的であるためには、モデルと現実を絶対に混同しない言い方をすることが大事。
タグ:
posted at 16:12:51
学部向け教科書によく書いてある正規分布モデルを使った信頼区間の場合には、(現実ではなく数学的モデル内において)平均μ₀の正規分布のi.i.d.として生成されたサンプル(←確率変数になる)から計算した95%信頼区間にμ₀が含まれる確率は95%になります。
これが95%という数値の正しい解釈です。
タグ:
posted at 16:12:50
実践的な場面で平均値の区間推定を行うときには、現実世界で得たサンプルを用いて信頼区間を計算します。
一方、95%信頼区間の95%という数値は、現実ではなく、モデル内でのサンプルの分布で測った確率(=割合)もしくはその近似値になります。続く
タグ:
posted at 16:12:49
(*)「無作為抽出を繰り返し行って95%信頼区間を計算したとき、100回に95回ぐらいは真の平均値μを含んでいる範囲である」
が正しいことを認めた上で、確率と呼んでもよいことにこだわってしまった人達は騙されています。
(*)のような解説の仕方自体がモデルと現実を混同する非科学的な態度です。
タグ:
posted at 16:12:48
Diego Javier Zea @diegojavierzea
#JuliaLang multiple dispatch explained using #Pokemon types 👇 twitter.com/tmoll_/status/... pic.twitter.com/kVGGrgla99
posted at 15:19:28
単なる数学的無知の問題であれば(相対的に)大したことはない。
実践的な場面で計算される信頼区間の計算では現実世界で得た標本を使いますが、標本の無作為抽出を繰り返して信頼区間を何度も計算するときの標本はモデル内標本です。
この違いに触れない説明はモデルと現実を混同していて非科学的。 twitter.com/genkuroki/stat...
タグ:
posted at 15:00:34
@genkuroki ありがとうございます.突然失礼しました.2年前からとは.確かに教科書で全てモデルで計算方法を説明して,例として現実を出すので,そこの違いを説明するのは必要ですね.練習問題等の「睡眠時間が正規分布しているとして」のような記述がどれだけおもちゃなのかは初見の人はわからないですし.
タグ:
posted at 14:39:34
@Nanaki_tw 私がずっと言っていることは、学部生向けの統計学入門の教科書では、モデル内での計算に過ぎないことを実際に「モデル内での計算に過ぎない」と言い切らずに誤魔化しの説明をしているものが多いのではないか、ということです。
正規母集団の仮定をあっさりしている教科書は全部アウトだと思います。
タグ:
posted at 14:37:58
コンピュータで信頼区間を求める函数のプログラムを書く場合には上の定義を知っていると楽にコードを書ける場合がある。
そして、上の定義に従って信頼区間函数を構成しておけば、常にP値と整合性のある信頼区間が得られます。統計ソフトの中には整合性のない結果を表示するものがあるので要注意。
タグ:
posted at 14:33:13
P値函数と信頼区間の関係
パラメータθとサンプルyのP値函数pvalue(θ, y)が与えられているとき、信頼度1-αの信頼区間CI(y, α)は
CI(y, α) = { θ | pvalue(θ, y) ≥ α }
で定義可能です。 twitter.com/genkuroki/stat...
タグ:
posted at 14:29:18
OokuboTact 大久保中二病中年 @OokuboTact
「指導要領 算数」でググって、クリックすると「指導要領・解説」が出てくる pic.twitter.com/49QeNknKES
タグ:
posted at 14:27:30
@Nanaki_tw 確率測度による確率の定義にはランダム性の概念が含まれず、確率測度は全体のサイズを1に規格化したときの部分の割合の抽象化に過ぎないという話は、数学に詳しくなければわからないことなので、そこで間違っていても責め過ぎるのは良くないです。
しかし、モデルと現実の混同は常識的にアウトです。
タグ:
posted at 14:20:21
OokuboTact 大久保中二病中年 @OokuboTact
@a_saitoh それは「指導要領」ではなく、「指導要領・解説」ですね
#超算数 #0は倍数に入れるのか pic.twitter.com/4WHb7NAnvf
タグ: 超算数 0は倍数に入れるのか
posted at 14:18:32
@Nanaki_tw 2年前と同じように「確率ではなく割合だ」と述べているだけです。
正しくは、95%信頼区間の95%はモデル内標本分布で測った確率もしくはその近似値。
モデル内確率に過ぎないのに、現実の母集団からの標本の無作為抽出を繰り返す話に聞こえる説明をすることは、非科学的な響きを持ち、有害です。 twitter.com/genkuroki/stat... pic.twitter.com/UFneLFXlQp
タグ:
posted at 14:14:49
OokuboTact 大久保中二病中年 @OokuboTact
「0を倍数に入れない」というのは算数教育の習慣なんだろうけど、是正しようと雰囲気が微塵もない。
#超算数 twitter.com/OokuboTact/sta...
タグ: 超算数
posted at 14:06:02
@genkuroki これ「確率の頻度的な解釈を用いた初学者向けの説明」をわざと頻度的な解釈を使わない立場で用いて一見おかしな結論を導き炎上させて次のエントリでそれらに拠らない信頼区間の構成法の研究を紹介する釣り記事なのかなと思いました.測度論的には同じなのは同意です.釣りだとすると私は釣られました.
タグ:
posted at 12:40:35
What is dispatch? What is multiple-dispatch?
Julia's multiple-dispatch explained via Pokemons!
#julialang twitter.com/tmoll_/status/...
タグ: julialang
posted at 10:30:33
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
Hyperbolic soccer “ball” made from hexagons and heptagons. pic.twitter.com/7uUS1XsRSN
タグ:
posted at 08:32:54
Nathanael Wong (黄智信) @natgeo_wong
2. ITCZ equatorial heating (heating band along the equator) pic.twitter.com/j4jdaW39eN
タグ:
posted at 08:18:02
Nathanael Wong (黄智信) @natgeo_wong
So I did some tests with Oceananigans.jl (github.com/CliMA/Oceanani...) today, coded up in #JuliaLang
1. Source heating/cooling at the equator! pic.twitter.com/JW3AKR99tj
タグ: JuliaLang
posted at 08:17:38
「現場で教えている人が、子供のためを思って工夫して、その結果順序指導が望ましいと考えて教えてる。部外者はとやかく言うな」
「指導要領に書いてあるから、順序指導をせざるを得ない。教員じゃなく文科省に言え」
でも、闘ってほしい。 twitter.com/kale_aojiru/st...
タグ:
posted at 07:32:51
数学的に明瞭な話題になった途端に、数学的に正確な議論をできないと何をやっても何が正しいかは分からなくなります。
どのような文献の権威もそこでは無効になる。昔の偉い人が何を言っていても、現在の立派な人達が何を言っていても、正しいかどうかの判断では使えなくなる。
タグ:
posted at 07:31:05
数学がらみの話題では、文献を引用して文献の権威に頼る議論が無効になる場面が少なくないことは、特に統計学のような分野を学ぶときには気を付ける必要があります。
* 95%信頼区間の95%という数値の数学的出所は明確。
* ランダムウォークにトレンドなるものはない(笑、以前の和田)。 twitter.com/genkuroki/stat...
タグ:
posted at 07:31:05
Cristóvão D. Sousa @CristovaoDSousa
This is an amazing and elegant explanation of @JuliaLanguage Multiple Dispatch! It highlights the difference to operator overloading. Very nice post! #julialang twitter.com/tmoll_/status/...
タグ: julialang
posted at 06:19:20
(1 + h)^(1/h) は「右肩」に 1/h が乗っかっているのに、h = 0 まで解析的に延長可能であり、h = 0 を中心とするTaylor展開が可能です。
高校の数学の教科書でTaylorの定理が載っているものもあるので、高校生がこのTaylor展開に挑戦することもできる。
答えばWolframAlphaに聞けば教えてくれます。
タグ:
posted at 05:35:33
h = 1/n とおく。
(1 + 1/n)ⁿ/e = (1 + h)^(1/h)/e は h → 0 で 1 に収束するが、|h| が小さいとき 1 - h/2 でよく近似される。
こんな感じでコンピュータで計算&プロットして確認できるだけでも相当に有用だと思います。
www.wolframalpha.com/input/?i=plot%... pic.twitter.com/VulH8oyKgi
タグ:
posted at 05:31:37
例えば、(1 + 1/n)ⁿ のn→∞での極限を高校で扱いますが、それの一般化である (1 + x/n)ⁿ → exp(x) は二項分布の極限でポアソン分布を出すときなどにも使われるので、実用的にも重要です。
それらの収束の速さはどの程度であるか?
は大学1年生レベルの良い演習問題だと思います。
タグ:
posted at 05:25:00
ケースバイケースで特殊なやり方を覚えるのではなく、数学的に普遍的な事柄に自然に注意が向く人が増えた方がいいに決まっています。
高校生相手の数学教育の段階から、例えば「極限値だけではなく、収束の途中の様子を見ることも大事」と繰り返し教えることには十分な価値があると思います。
タグ:
posted at 05:03:30
n→∞での結果がn=10くらいで十分な近似になっている場合もあるが、nを1億とかにしてもn→∞の結果に全然近付かない場合もある。
極限値だけではなく、収束の途中の様子にも触れることには、数学ユーザーになりそうな人達にとって大きな価値があると思います。
タグ:
posted at 05:02:10
以上の話は、統計学教育に限らない高等数学教育にも重要な示唆を与えていると私は考えています。
それは非常に単純な話で、n→∞での極限を扱うときには、その収束の速さにも触れるようにした方がよいということです。
タグ:
posted at 04:56:37
中心極限定理について紹介するときにも、その定理が統計学の実践では有限のサンプルサイズで使用されることに注意を払い、中心極限定理による近似が非常に悪くなる場合も紹介しておくべきだと思います。
そういう例を知っていれば、ユーザーは致命的な単純ミスに気付き易くなるはず。
タグ:
posted at 04:49:15
正規分布モデルを使ったP値や信頼区間の計算結果のダメな場合の具体例を知っていることが大事。
うまく行く場合だけを紹介する行為は、統計学ユーザーにとっては禁忌とされているチェリー・ピッキングであり、そのような行為を学部生向けの統計学の教科書で行うことは強く非難されて当然だと思う。
タグ:
posted at 04:44:15
P値や信頼区間を求めるために使われるモデルに含まれている確率分布でサンプルが生成されている場合のみを扱うだけだと、まるで現実世界における母集団分布が正規分布だと仮定して分析を進めるかのようにみんな誤解してしまう。
現実には学部生向けの教科書の執筆者自身が誤解しているかも。
タグ:
posted at 04:39:50
教育的には、
P値や信頼区間を求めるために使っているモデル
(例えば学部生向けの教科書では単純な正規分布モデルp(y|μ,σ)とか)
に含まれない確率分布でサンプルが生成されていて、
実際に不都合が生じる具体的な計算例
を知っておいてもらうことには価値があると思います。 twitter.com/genkuroki/stat...
タグ:
posted at 04:38:15
Buitengebieden @buitengebieden
Watch until the end.. ❤️ pic.twitter.com/rGKwBDG54L
タグ:
posted at 04:19:14
非公開
タグ:
posted at xx:xx:xx
Registration is free! (juliacon.org/2021/tickets/) Workshops started today and go all week! Talks and keynotes are next week! (pretalx.com/juliacon2021/s...)
タグ:
posted at 03:21:06
Non-Julia users tuning into JuliaCon to see what all the fuss is about….
#julialang pic.twitter.com/jQ1qL2O6K4
タグ: julialang
posted at 03:21:05
#JuliaCon workshops start today! To participate in the #workshops, please register for the conference. Joining instructions will be emailed to participants. juliacon.org/2021/
#julialang pic.twitter.com/jMF23HzdNg
タグ: JuliaCon julialang workshops
posted at 02:34:18
Great News. Looking forward to the future of #julialang twitter.com/Viral_B_Shah/s...
タグ: julialang
posted at 02:20:11
OokuboTact 大久保中二病中年 @OokuboTact
#超算数 (続き)
同じ本から
> 0は、倍数に入れないことにします。
根拠は? pic.twitter.com/mldjR4GopE
タグ: 超算数
posted at 00:17:26
OokuboTact 大久保中二病中年 @OokuboTact
#超算数 (続き)
素晴らしいことが書いてある!
> 「0は偶数です」と教師が伝えるのではなく、子どもが「0は偶数なのか奇数なのか」について確かな根拠のもとに演繹的に考え説明し合う場を設定する」 pic.twitter.com/GEOuO9nqnH
タグ: 超算数
posted at 00:08:53
ワイドショーは世田谷モデルを絶賛しました。真似したモデルNY州の死者数も悲惨だったが、PCR検査がすべてと主張した世田谷区の今はどうだろう?↓
ワクチンが進んでいない。
検査数を批判される方がいるが、国の総死者数が、コロナ前の年よりコロナ禍の年の総死者数が少なかったという結果がすべて twitter.com/mstk_horiguchi... pic.twitter.com/hHdBgm8Ua4
タグ:
posted at 00:04:38