Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
Favolog ホーム » @genkuroki » 2022年02月09日
並び順 : 新→古 | 古→新

2022年02月09日(水)

積分定数 @sekibunnteisuu

22年2月9日

批判する自由はある。政治権力を持っているところが「対処する」のが問題。 twitter.com/hear_synth/sta...

タグ:

posted at 00:09:13

sako @SSako86

22年2月9日

なんで順序を強制する人って相手の主張を理解する能力がないんだろう?
順序強制に反対する人で、
「12個入りの卵のパックが4つあるのと、4個入りのパックが12個あるのは別だから」
この2つの状況が同じことだなんて主張する人なんて皆無なのに。 twitter.com/soysauce4976/s...

タグ:

posted at 00:13:45

積分定数 @sekibunnteisuu

22年2月9日

@soysauce4976 文字のやり取りなんだから勝手に寝ればいいでしょうが。別に、返信は何時でもいいわけだし、返信の義務もないし、面倒ならミュートやブロックだってあるんだから。

タグ:

posted at 00:41:12

積分定数 @sekibunnteisuu

22年2月9日

@soysauce4976 返信は頂きたいですが、強要しているわけじゃない、ということです。

タグ:

posted at 00:47:56

sako @SSako86

22年2月9日

こういう幼稚な煽りをする人が、
「数学や語学以前のコミュニケーション能力やモラル、ネットリテラシーの教養が足りてないのかもしれないな」
なんていうのは滑稽。 twitter.com/soysauce4976/s...

タグ:

posted at 00:54:00

@yujitach

22年2月9日

趣旨はわかるのですが、講義ノートに関しては、講義という仕事に対して既に大学から給与が出ていて、その副産物として手元にあるわけで、それを公開するのが無償公開かというとちょっと違う気がします。いや、まあ、自分がずっと講義ノートを公開してきたから自己弁護したいだけですけど。個人的には、 twitter.com/hottaqu/status...

タグ:

posted at 00:57:42

@yujitach

22年2月9日

むしろ、大学教員の方で素敵な講義をしているのに、公開していないものだから、退職や亡くなった際に全て失われてしまう、というケースが多数あって、非常に勿体ないと思っています。

タグ:

posted at 00:57:43

積分定数 @sekibunnteisuu

22年2月9日

「掛け算の順序に文句言う奴はお前が教員になって教えろ」

で、教員になったら「✖にしろ」と言われるんだね。

「教員になれ」と言っていた人は「文句があるなら教員やめろ」とか言いそう。 twitter.com/chicke_chee/st...

タグ:

posted at 01:28:14

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 #Julia言語 改善版

nbviewer.org/github/genkuro...
標本平均と不偏分散の分布

より正確にはそれらを規格化した

Z = (\bar{X} - μ)/(σ/√n)
R² = S²/σ²

の分布のプロット。T=Z/Rがt検定で使うT統計量。

(Z, R²)の分布はn→∞で

標準正規分布 × 1に台を持つデルタ分布

に収束します。 pic.twitter.com/ymHOwvRBHe

タグ: Julia言語 統計

posted at 04:09:47

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 添付画像はその収束が極めて遅い母集団分布が対数正規分布の場合の「収束結果」です。

4つのプロットのうち右上の(Z, R²)の散布図における橙色の2本の破線は楕円の軸で本当は直交しています。 pic.twitter.com/jj8xc3eCRg

タグ: 統計

posted at 04:12:50

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 #Julia言語

Z と R²=S²/σ² の分布はnが大きいときに、2変量正規分布で近似されます。(正規分布モデルの最尤法が正則モデルであることより)

それらの分散共分散行列は添付画像のようになっています。

Z²とR²の分散共分散行列も計算してあります。

T²=Z²/R²に注意。

nbviewer.org/github/genkuro... pic.twitter.com/5G14YMhGq9

タグ: Julia言語 統計

posted at 04:20:26

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計

nbviewer.org/github/genkuro...

のプロットを眺めると、母集団分布が対称なときには(歪度κ₃=0となる)、色々良いことが起こっていることがわかります。

①中心極限定理によるZの分布の収束が速い。

②自由度n-1のχ²分布のσ²/(n-1)倍からの不偏分散の分布のずれから来る悪影響は大したことがない。

タグ: 統計

posted at 04:24:58

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 母集団分布が対称な場合には(これは多くの場合に非現実的な想定)、1標本t検定は母集団分布が正規分布から外れていてもn=10のような小さな標本でも十分に機能する。

タグ: 統計

posted at 04:27:48

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 母集団分布が対称ではない場合にはどうか?

その場合にはt検定の基礎とみなせる中心極限定理によるZ統計量の分布の標準正規分布への収束の速さ自体が問題になります。

その部分がうまく行く程度にnを増やせば結果的に不偏分散の分布のずれから来る問題は大して気にする必要がなくなっている。

タグ: 統計

posted at 04:30:13

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 1標本t検定は通常、正規母集団の想定で説明されることが多いのですが、小標本でうまく行くのは正規母集団ではなく対称な母集団の場合で、それ以外の場合には中心極限定理の効き具合の問題になるという感じになっているように見えました。

タグ: 統計

posted at 04:32:26

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 母集団分布が対称な場合には、t分布による標準正規分布の補正は非常にうまく行っています。

その辺も色々計算してみて、納得できることも色々ありました。

タグ: 統計

posted at 04:35:11

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 添付画像は、対称な分布で両極端な場合です。尖度κ₄が最小の-2に近い場合と非常に大きな値の場合。どちらもn=10でt検定がうまく行く!

2×2のプロットの右下がP値函数の比較で、青線と橙破線の一致がt検定での名目有意水準と第一種の過誤の確率の一致を意味しています。どちらもよく一致。 pic.twitter.com/QzhrGEaH1D

タグ: 統計

posted at 04:45:51

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 母集団分布が一様分布の場合。これもn=10で2×2の右下のプロットで青線と橙破線がよく一致しています。

左下のプロットはT統計量の分布(青線)とt分布(橙破線)の比較です。一様分布だと一致し過ぎていて詳細が見難いくらいです。 pic.twitter.com/sNKfO6pcRa

タグ: 統計

posted at 04:49:54

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 母集団分布がBeta(0.2, 0.2)の場合。ほとんどベルヌーイ分布です。

左下のプロットでT統計量の分布(青線)とt分布(橙破線)の裾がよく一致しており、右下の対応するP値函数のプロットでそのことはよく確認できます。 pic.twitter.com/PoP8Mg9nwq

タグ: 統計

posted at 04:52:12

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 左下と右下の緑のdashdot線のpseudo-tは何か?

その分布は私が適当な仮定のもとででっちあげた母集団分布に合わせて作った擬似t分布です。 pic.twitter.com/giM60PK6aJ

タグ: 統計

posted at 05:12:28

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 母集団分布の尖度が小さい場合には、不偏分散の値で条件付けられたZの条件付き分布(2×2のプロットのうち右上のプロット)の広がり方は不偏分散が小さくなるほど広がることになります。(これは尖度の小さな分布が平均値から離れ難いことから直観的にそうなるべきであることがわかる。) pic.twitter.com/ryYPuVnzuR

タグ: 統計

posted at 05:12:29

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 Zの分布が規格化された不偏分散R²=S²/σ²の分布と独立にならない。

一方、尖度が小さいと、R²の分布の分散は小さくなります。

この2つの影響がどうなるかを、どんぶり勘定で見積もるために作った分布が擬似t分布pseudo-tです。 pic.twitter.com/mt1wQplaLq

タグ: 統計

posted at 05:12:30

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 ただし、そのとき、Z統計量の分布は正確に標準正規分布になっていることなどを仮定しています。

しかし、尖度が小さな分布では平均から大きく離れた値は非常に出にくいので、その場合には、Z統計量が正確に標準正規分布になっているという仮定は過剰の保守的過ぎます。緑dotdash線。 pic.twitter.com/ShJQfNkZz7

タグ: 統計

posted at 05:12:31

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 右上の赤の点線が、擬似t分布を作るときの想定下でのZ統計量の条件付き確率分布のが2.5%および97.5%ラインです。

ピンクと橙の線が本物のZ統計量の条件付き確率分布の2.5%および97.5%ラインです。

前者は非常に保守的(安全のため分布の広がりかたを大きめに想定すること)になっている。 pic.twitter.com/7NuMRsPnfk

タグ: 統計

posted at 05:12:32

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 本物のZ統計量の分布はある一定の値を超えることがないので、図のようになる。

結果的に本物のZ統計量から作ったT統計量の分布は、私による保守的な見積もりよりもt分布にずっと近付くことになります。 pic.twitter.com/CdR6AgxCx5

タグ: 統計

posted at 05:14:35

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 nを増やして行くと、私の大雑把な見積もり(pseudo-t)が本物のZ統計量の条件付き分布に近付いて行きます。

それに従って、私のpseudo-tと本門のT統計量の分布も近付くことになる。 pic.twitter.com/ulDs8FfW1r

タグ: 統計

posted at 05:19:06

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 統計学の解説では、標本平均と標本不偏分散の話を必ずするし、中心極限定理のデモンストレーションのために標本平均の分布のグラフを見せる人も多いでしょう。

今回気付いたことは、標本平均単体ではなく、標本平均と不偏分散を同時にプロットした方がずっと面白いことです! pic.twitter.com/YKFsunj3un

タグ: 統計

posted at 05:30:43

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 #Julia言語 新バージョンの

nbviewer.org/github/genkuro...

では、2次元のサンプルから、kernel density estimation で条件付き確率分布の定数倍を推定する工夫をしています。条件付けを重み付けで与えているだけの手抜き。しかし、コードが非常にシンプルになりました。様子見のプロットに便利。 pic.twitter.com/s8XQzobPhp

タグ: Julia言語 統計

posted at 05:37:20

黒木玄 Gen Kuroki @genkuroki

22年2月9日

あ、0.999としたかったところが一ヶ所0.9999になっている!
GitHubに置いてあるものは直しておこう。

タグ:

posted at 05:41:39

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 #Julia言語

nbviewer.org/github/genkuro...
標本平均と不偏分散の分布

にあるプロット群は最後の方の

まとめてプロット

の節にあるプロットだけを見れば十分です。

わざと試行錯誤途中のコードも残してあります。

タグ: Julia言語 統計

posted at 05:44:41

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 #Julia言語 母集団分布がGamma(2,1)程度の非対称性を持っていても、1標本t検定(平均の信頼区間の計算法を含む)は十分実用的に使えそうです。

nを大きくすれば実質的に単なる中心極限定理による検定になる。t分布は関係なくなる。

nbviewer.org/github/genkuro... pic.twitter.com/XdRrn5QFbk

タグ: Julia言語 統計

posted at 05:50:46

黒木玄 Gen Kuroki @genkuroki

22年2月9日

この手の計算をするとコンピュータは速ければ速いほど便利で、どれだけ速くなってももっと速くなって欲しいということがよく分かります。

CPUのコアを全部使うのは普通。 #Julia言語

タグ: Julia言語

posted at 05:53:44

黒木玄 Gen Kuroki @genkuroki

22年2月9日

あと、

 標本平均の分布のプロットによる
 中心極限定理のデモンストレーションよりも
 標本平均と不偏分散の同時分布のプロット

の方が圧倒的に面白いことの一般化として、

 1次元のヒストグラムよりも
 2次元の散布図

の方がずっと面白いことが多いのではないかと思いました。#統計

タグ: 統計

posted at 05:57:58

黒木玄 Gen Kuroki @genkuroki

22年2月9日

さらに、この手の「理解のための試行錯誤の一環としてのプロットの仕方」について他人に教えようと考えると、使っている数学的小道具が非常に多いことにも気付きます。

今回のケースでは線形代数の特に実対称行列の周辺は非常に重要。それ抜きに、2次元の正規分布および中心極限定理は理解不可能。

タグ:

posted at 06:04:04

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 大きな山と小さな外れ値の山の混合正規分布が母集団分布の場合

グラフは
Z=√n(X̅-μ)/σ, R²=S²/σ²の同時分布と
R²で条件付けられたZの条件付き確率分布

n = 10, 20, 40

nbviewer.org/github/genkuro... pic.twitter.com/dLhUO8Kc6r

タグ: 統計

posted at 07:21:16

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 大きな山と小さな外れ値の山の混合正規分布が母集団分布の場合

グラフは
Z=√n(X̅-μ)/σ, R²=S²/σ²の同時分布と
R²で条件付けられたZの条件付き確率分布

n = 80, 160, 320, 640

nbviewer.org/github/genkuro... pic.twitter.com/dVbQeDNAQM

タグ: 統計

posted at 07:21:59

やねうら王 @yaneuraou

22年2月9日

先日のやねうら王公式ちゃんねるにアップした動画の補足記事書きました。

> 将棋の平均手数、プロ棋士の対局の平均は110手強らしいです。しかしこれは、棋力に依存するものであることがわかってきました。

yaneuraou.yaneu.com/2022/02/09/the...

タグ:

posted at 07:24:08

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 Z=√n(X̅-μ)/σ, R²=S²/σ²の同時分布は、n = 10, 20 の段階ではよくわからないのだが、n = 320, 640 では綺麗に楕円状の2次元正規分布にほぼなっている。

nの大きさで見えている世界が全然違う。 pic.twitter.com/Scnj3DUtE5

タグ: 統計

posted at 07:25:51

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 最近、私が繰り返している話題の目標は、2標本のStudentのt検定ではなく、Welchのt検定なので、以下のリンク先の話題は私がしている話とは余り関係ない。

現代では等分散でないと誤差が大き過ぎる2標本のStudentのt検定を等分散の検定との組み合わせで使うのはよくないとされていると思う。 twitter.com/bluesnono/stat...

タグ: 統計

posted at 07:32:13

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計

❌正規分布の検定
❌↓
❌等分散の検定
❌↓
❌2標本のStudentのt検定

は止めるべきで、

⭕️最初からWelchのt検定を使う

方が安全だと多くの人が言っていると思う。

理屈的には当たり前にそうなのだが。

そして適切な統計モデルが見つかるならそうした方がお得なはず。

タグ: 統計

posted at 07:37:15

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 「等分散の検定を途中で入れて、2群のStudentのt検定とWelchのt検定を使い分ける」というのはやめた方が良いという非常にもっともな意見を述べている人たちの情報は

biolab.sakura.ne.jp/welch-test.html

にある。

タグ: 統計

posted at 07:39:14

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計

正規分布から1標本を抽出→1標本のt検定

という発想で

同一の正規分布から2標本を抽出→2標本のStudentのt検定

に一般化するのは、個人的に良くない一般化だと思います。

「同一の正規分布から2標本を抽出」のような非現実的な設定を考えるのはよくない。

続く

タグ: 統計

posted at 07:43:53

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計

中心極限定理の利用とその補正→1標本のt検定

という発想で、これを

中心極限定理の利用とその補正→2標本のWelchのt検定

に一般化するのは悪くない考え方だと思います。

使用可能条件に正規分布やら等分散のような非現実的な仮定が入っていない。(もちろん別の制限が入る。)

タグ: 統計

posted at 07:47:11

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 1標本版t検定については以下のリンク先スレッドを参照 twitter.com/genkuroki/stat...

タグ: 統計

posted at 07:48:52

yuri @syoyuri

22年2月9日

長島光一先生よりご恵贈いただきました「〜裁判例にみる〜自転車事故の損害賠償」!なぜ高木さんと一緒の写真かというと。長島先生はマンガアニメを取り入れた法学教育を実践されてる、高木さんファンだからです💖#高木さんめ #長島法律学
また聖地に遊びに来てくださいね❣️
twitter.com/keio_news/stat... pic.twitter.com/5Jo2eetSCA

タグ: 長島法律学

posted at 07:50:27

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 2標本に関するStudentのt検定を使うべきではないのと同じ理由で、Wilcoxon-Mann-Whitney検定も使うべきではないと思うのですが、その辺はどうなっているんですかね?

最初からWelchのt検定を使うべきなのと同様に、Brunner-Munzel検定の方を使うべきだという議論はどこかにないのか?

タグ: 統計

posted at 07:55:15

yuri @syoyuri

22年2月9日

こんなに自動車事故による損害賠償紛争が増えてるとは。勉強になります!消費生活相談現場としては保険契約等の消費者啓発講座で活用せねば。とにかく自動車事故裁判のデータみっちりなので、法律実務家の方々だけでなく、交通安全指導に携わる方々にも手にとって欲しい。 pic.twitter.com/3xnTeU7NiU

タグ:

posted at 07:55:49

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 Welchのt検定とBrunner-Munzel検定の原論文

scholar.google.co.jp/scholar?cluste...
Welch (1938)

scholar.google.com/scholar?cluste...
Brunner-Munzel (2000)

タグ: 統計

posted at 08:33:37

坂口@ヒプノセラピスト @Archtandc

22年2月9日

@wakachan02 @terry10x12th 旦那さんに「日本の文化に興味を持ってくださってありがとうございます。さらに実践までしてくださり感無量です。あなたは文化を盗んだのでは無く、むしろ私に感動を与えてくれました」とお伝えいただければ嬉しいです。

タグ:

posted at 08:52:18

黒木玄 Gen Kuroki @genkuroki

22年2月9日

これ、非常に大事な問題だと思います。
公開されていてもサイトが消える場合がある。
twitter.com/yujitach/statu...

タグ:

posted at 08:53:26

RochejacMonmo @RochejacMonmo

22年2月9日

「見たこともない熟語、どうやって読む?」
「意外に、社会科で指導しない箇所」
との宣伝文句の記事だが、
・いくつかの単語を並列した熟語(ex:工業地帯、伝統工芸、金利上昇圧力)
・接頭辞
が述べられているだけで、宣伝と具体例がかけ離れているような。
news.line.me/detail/oa-asah... pic.twitter.com/K99BvCPs6Q

タグ:

posted at 08:57:04

RochejacMonmo @RochejacMonmo

22年2月9日

そしていつものように「国語」がやり玉にあがり

>きっと国語の題材だけでは気づかなかった「え、君たち、これ、わかってなかったの?」と驚く場面があると思います

には具体例が付属していない。こういうやり方はフェアとは言えないのでは。 pic.twitter.com/gzAXcKbQaR

タグ:

posted at 08:58:31

名取宏(なとろむ) @NATROM

22年2月9日

@tmhk0 @higuma_saikyou こんにちは。言及してくださってありがとうございます。「過剰診断」は造語でもなんでもなく、福島県の原発事故のずっと前より使用されていた用語です。詳しくは[「過剰診断」とは何か natrom.hatenablog.com/entry/20150324... ]で解説しています

タグ:

posted at 08:59:34

名取宏(なとろむ) @NATROM

22年2月9日

@tmhk0 @higuma_saikyou 「転移があるから過剰診断ではない」というのはよくある誤解です。死亡や自覚症状の原因にならなければ、転移の有無に関わらず、定義上、過剰診断です。とくに甲状腺がんでは転移を伴っても過剰診断である事例はよくあります。

タグ:

posted at 08:59:53

名取宏(なとろむ) @NATROM

22年2月9日

@tmhk0 @higuma_saikyou 個々のケースでは治療をせずに放置して自覚症状が生じるかどうかを観察するしか過剰診断かどうかを判断する方法はありません。症状がないうちに治療介入すればその時点で過剰診断かどうかわからなくなります。

タグ:

posted at 09:00:08

名取宏(なとろむ) @NATROM

22年2月9日

@tmhk0 @higuma_saikyou ただし、集団でみると一定割合で過剰診断が生じていることがわかります。わかりやすいのが、がん検診を受けた群と受けなかった群を比較したランダム化比較試験です。検診を受けるとがんと診断される人の数が増えますが、その増加分は過剰診断です。

タグ:

posted at 09:00:22

名取宏(なとろむ) @NATROM

22年2月9日

@tmhk0 @higuma_saikyou 甲状腺がんだと、現在の基準では手術されず積極的監視される微小がん(ほとんどが過剰診断)であっても、詳しく調べるとそこそこの割合でリンパ節転移を伴うことが知られています。それ以外にも、他病死例の剖検でリンパ節転移を伴う甲状腺がんも観察されています。

タグ:

posted at 09:00:35

名取宏(なとろむ) @NATROM

22年2月9日

@tmhk0 @higuma_saikyou 被ばくのない集団でも、甲状腺がん検診を行うと、自覚症状で見つかる甲状腺がんよりも異常に多くの甲状腺がんが見つかります(大雑把に100倍ぐらい)。それらの多くは過剰診断です。そして、けっこうリンパ節転移を伴います(大雑把に数十%)。

タグ:

posted at 09:02:55

名取宏(なとろむ) @NATROM

22年2月9日

@tmhk0 @higuma_saikyou 以上、過剰診断の定義、転移があっても必ずしも過剰診断ではないと言えない点、甲状腺がんは転移を伴っても過剰診断が多いといえる複数の根拠(積極的監視症例、剖検例、検診発見例)についてご説明いたしました。ご質問は歓迎いたします。

タグ:

posted at 09:05:33

さのたけと @taketo1024

22年2月9日

「やはり筋トレは楽しくない」

数学研究のための体力向上を目的として始めた全然楽しくない筋トレを一年間継続して得た「楽しくないけどやった方がいいことを継続するためのマインドセット」について書きました💪

よかったら読んでください🤲
note.com/taketo1024/n/n...

タグ:

posted at 09:57:23

さのたけと @taketo1024

22年2月9日

以下、忙しい人のための結論です📄

← 楽しくないことを続けるためのマインドセット

→ 挫折しがちなマインドセット pic.twitter.com/RNtYyVZNkW

タグ:

posted at 09:57:24

さのたけと @taketo1024

22年2月9日

色んな人の考えが知りたいので、記事へのコメントや引用 RT などで感想を頂けたら嬉しいです🙂

タグ:

posted at 11:14:56

Jacob Quinn @quinn_jacobd

22年2月9日

Some really questioned why Pkg.jl needed to be a #JuliaLang stdlib, why we needed to wait for it to mature for a JuliaLang 1.0 release, and even why @StefanKarpinski, a core language creator, would spend a sh*t-ton of time working thru all the architectural details to get it twitter.com/nletcher/statu...

タグ: JuliaLang

posted at 11:28:02

Jacob Quinn @quinn_jacobd

22年2月9日

Right (along with many other wonderful contributors!). THIS IS WHY!! Making the package manager a core part of the language may end up being one of the best decisions ever by #JuliaLang. And to have nailed the design, and the Yggdrasil artifact ecosystem, ease of testing, 👨‍🍳💋

タグ: JuliaLang

posted at 11:28:02

Hiroyasu Kamo @kamo_hiroyasu

22年2月9日

@wakachan02 「文化盗用」はマイナー文化のグローバル展開へのメジャー文化からの妨害でしかないことが多いですが、これはその典型ですね。

タグ:

posted at 12:11:38

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 2標本の場合のStudentのt検定とWelchのt検定の大きな違いは、後者で使うt分布の自由度の設定の部分にあるのではなく、2つの標本平均の差の分散の推定の仕方の違いにあります。

2つの独立な標本のサイズをn₁,n₂と書き、 2つの標本の母集団分布の分散をσ₁², σ₂²と書いたとき~続く

タグ: 統計

posted at 14:20:54

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 m,nが(m-1)/m≈1≈(n-1)/nという近似を使えるくらい大きいとき、

E[Welchのt検定で採用する分散の推定量]
= σ₁²/n₁ + σ₂²/n₂
= (2つの標本平均の差の真の分散)

E[Studentのt検定で採用する分散の推定量]
≈ σ₁²/n₂ + σ₂²/n₁

となっており、一般に後者は正しくない推定値を与えます。

タグ: 統計

posted at 14:20:55

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 σ₁²/n₁ + σ₂²/n₂=(2つの標本平均の差の真の分散)とσ₁²/n₂ + σ₂²/n₁の違い。分母が違う。後者のStudentのt検定版では分子と分母でインデックスが揃っていない。後者については「分母が間違っている!」と言いたくなるくらいです!

タグ: 統計

posted at 14:20:57

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計

(Studentの側の後者) - (真の値の前者)
= (n₁ - n₂)(σ₁² - σ₂²)/(n₁n₂)

なので、標本サイズn₁,n₂と母分散σ₁²,σ₂²の大小が逆向きだと、2標本のStudentのt検定では2つの標本平均の差の分散を過小評価してしまいます。(大小の向きが揃っていれば過大に評価してしまう。)

タグ: 統計

posted at 14:20:58

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 だから、標本サイズが異なっていて、母分散も異なっている場合には、中心極限定理が使えるほど標本サイズが大きな状況であっても、2標本のStudentのt検定は間違います。

Welchのt検定の側は中心極限定理を基礎とする検定のt分布による補正に過ぎないのでそういう危険性はありません。

タグ: 統計

posted at 14:20:59

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 その記事の存在は知っていたのですが、

❌Welchのt検定は「要正規性」な検定である

❌Mann-Whitney検定やBrunner-Munzel検定が中央値の違いの検定である

のような誤解がさらに強化されそうで紹介し難い。

以前は無知無教養なせいで気付かなかったのですが、その記事の解説は結構危ないです。 twitter.com/1kn29cgqjzrwtg...

タグ: 統計

posted at 14:29:12

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 Brunner-Munzel検定は中央値の違いの検定ではないです。

結構読み易い原論文(2000) scholar.google.com/scholar?cluste... を見ればわかるようにBM検定は

p := P(X < Y) + P(X = Y)/2 = 1/2

という帰無仮説の両側検定です。pの推定量の分散の近似値を中心極限定理を使って得ること基礎になっています。

タグ: 統計

posted at 14:40:00

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 Brunner-Munzel検定が扱う

p := P(X < Y) + P(X = Y)/2

は、各戦闘員の戦闘力値の大小で勝敗が決まるという設定での、

XチームとYチームから無作為に戦闘員を選んで戦わせたときのYチーム側の勝率

を意味しています。

仮説p=1/2はその勝率が1/2であることを意味しています。

タグ: 統計

posted at 14:44:37

木野浩一 @dorasuky

22年2月9日

日本文化に関心を持って頂いて、積極的にチャレンジして頂いたんだから、非難されるような点は何もなくて、むしろ日本人としては喜ぶべき事だと思いますけどねえ。何だろ、「文化盗用」って。わけ分からん。 twitter.com/wakachan02/sta...

タグ:

posted at 14:50:27

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 XチームとYチームの戦闘員の戦闘力が添付画像のように分布している場合には(右側が強い)、XとYの中央値は等しいのですが、Yチームの勝率は66%で50%を超えます。

Brunner-Munzel検定はこのような場合に十分に標本サイズを大きくすると帰無仮説「勝率=1/2」を棄却できるように設計されています。 pic.twitter.com/KKVTC1JkEe

タグ: 統計

posted at 14:50:54

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 この場合には、中央値はYの方がXより小さいのに、Yの側の勝率が64%で50%を超えています。

これらの例を見れば、Brunner-Munzel検定が中央値の違いを見る検定ではないことがすぐに分かると思います。

BM検定に付随する信頼区間も勝率の信頼区間になっています。 pic.twitter.com/LRnhHxRaix

タグ: 統計

posted at 14:59:22

吉田弘幸 @y__hiroyuki

22年2月9日

問題があるのは受験生の読解力ではなく,出題者の表現力です。 twitter.com/noricoco/statu...

タグ:

posted at 15:02:12

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計

* Welchのt検定では、戦闘力の平均値の差を扱う。帰無仮説は「差は0である」になり、信頼区間は検定で棄却されない差の範囲になる。

* Brunner-Munzel検定では、戦闘力の大小のみで決まる勝率を扱う。帰無仮説は「勝率は1/2である」になり、信頼区間は検定で棄却されない勝率の範囲になる。

タグ: 統計

posted at 15:03:29

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 Welchのt検定もBrunner-Munzel検定もその第一の基礎は中心極限定理なので、中心極限定理による近似が有効な場合にのみ使える検定になります。

それらは、「値の期待値の差」と「値の大小のみで決まる勝率」のどちらが真に必要な情報であるかによって使い分けるべきです。

タグ: 統計

posted at 15:06:36

非公開

タグ:

posted at xx:xx:xx

生きる @paradoxlife20

22年2月9日

自分のフィールド(利権?)に、何でも引き込みすぎ。自らの読解不足を曝露していると言えよう。 twitter.com/noricoco/statu...

タグ:

posted at 15:13:02

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 Brunner-Munzel検定での帰無仮説「Yの勝率=50%」は添付画像のようにYチームの戦闘力の期待値がXチームよりも圧倒的に高い場合にも成立しています。

このような場合の違いをBM検定は見落とすことになります。 pic.twitter.com/YkqGRVCi4W

タグ: 統計

posted at 15:17:10

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 値の情報を捨てて順位の情報だけを残す操作を施せば、確かに外れ値には強くなりますが、元のデータが持っていた値の情報を全て捨て去るという相当に大胆な情報の切り捨てを利用しているので、それに応じただけのデメリットもあることへの注意が必要。

あらゆることに都合の良い方法はない。

タグ: 統計

posted at 15:20:56

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 件のほくそ笑むさんの記事は【正規性も等分散性も仮定しない最強の検定、Brunner-Munzel 検定を紹介】という煽り方をしており、色々不適切な説明を含んでいます。(BM検定は最強でも何でもない)

計算例の紹介としては非常に面白いのですが、面白いがゆえに読むときには注意が必要だと思います。

タグ: 統計

posted at 15:27:32

SwordOne @twinklepoker

22年2月9日

その主張は聞き飽きるほど知ってる。その上で無意味だと言ってる。 twitter.com/soysauce4976/s... pic.twitter.com/uVkMSxCkBM

タグ:

posted at 15:28:07

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 例えば、薬を投与すると半分には実生活的に問題ない程度の微小な害が出るが、残りの半分には大きな治療効果があるというような場合には、Brunner-Munzel検定の帰無仮説が成立していることになります。

そういう場合を見逃しても大丈夫な場合にのみBM検定を使うべきだと思います。

タグ: 統計

posted at 15:40:08

黒木玄 Gen Kuroki @genkuroki

22年2月9日

hc.nikkan-gendai.com/articles/277247
引用【それらの有害事象は、HPVワクチンとの因果関係が不明とされているにもかかわらず、多くのメディアがニュースとして取り上げ、広く報道しました。中には恐怖をあおるような報道も多く見受けられました。】 pic.twitter.com/gAoT3Kw3dj

タグ:

posted at 15:55:50

黒木玄 Gen Kuroki @genkuroki

22年2月9日

hc.nikkan-gendai.com/articles/277247
引用【勧奨を中止した予防接種は、個別に接種時期などを知らせて強く促したり、予診票を送ったりすることができません。保護者らへの情報は途絶え、同ワクチンの接種率は1%未満に落ち込み、現在でもその低迷状態は続いています。】

タグ:

posted at 15:56:45

河合祐介 @tkawai18_tkawai

22年2月9日

そりゃ,でたらめなんだから伝わるわけがないwww

どこでそういうでたらめな考えを身につけたのか twitter.com/soysauce4976/s...

タグ:

posted at 15:56:59

skboyj3 @skboyj3

22年2月9日

大ブーメラン。 twitter.com/soysauce4976/s...

タグ:

posted at 16:17:21

大澤裕一 @HirokazuOHSAWA

22年2月9日

「問題文を読解できず」が低得点の原因、ではありません。読むべきもの・処理すべきものが多かったことが原因です。「数学が得意にもかかわらず共通テストで点を伸ばせなかった受験生」が多いことが、その証左です。
新井先生、70分で今年の数学IA(本試験)の問題を解かれてみてはいかがでしょうか。 twitter.com/noricoco/statu...

タグ:

posted at 16:29:12

積分定数 @sekibunnteisuu

22年2月9日

こういうのって程度問題だよね。

「連鎖関係代名詞」なんて言葉覚えたって仕方ないし、概念すら不要。単なる普通の関係代名詞。従属節に入り込んでいるからややこしく感じる人もいるだろうけど。

数学で言うと「条件付確率」や「ベイズのナントカ」みたいなものだね。 twitter.com/TNK_KNCH/statu...

タグ:

posted at 16:56:10

積分定数 @sekibunnteisuu

22年2月9日

文法用語をやたらと覚えることは英語学習において重要じゃない

文法を学ぶことは大切

両者は両立可能だけど、「文法など不要。文法用語をやたらと覚えても英語が出来るようにならないではないか」と雑なこと言う人がいるんだよね。

これも、掛け算順序や共通テストの議論に似ているよね。

タグ:

posted at 16:59:24

積分定数 @sekibunnteisuu

22年2月9日

「掛け算の順序は大切です。問題文の意味を理解することが大切だからです。答えさえ出せれば何でもいいというなら、模範解答を丸写しにすればいいではないかw」と言うようなこと言う人いるよね。

タグ:

posted at 17:00:47

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 #Julia言語

標本中央値の分布
github.com/genkuroki/publ...

サイズnの標本の標本中央値の分布は、平均が「母集団中央値」で分散が「母集団中央値での母集団密度函数の値の2乗の2n倍の逆数」の正規分布で近似される。

証明はベータ分布Beta(m,m)の正規分布近似から直ちに得られる。 pic.twitter.com/rvlseYDyYk

タグ: Julia言語 統計

posted at 18:10:02

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 中央値に限らず、四分位数やその一般化についても同様にnを大きくすると、標本でのその値の分布は正規分布で近似されます。ベータ分布のパラメータを大きくしたときの漸近挙動から従う。

タグ: 統計

posted at 18:15:40

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 標本中央値や標本四分位数などの分布の話はもろにベータ分布の話で、ベータ分布はn個のrand()の値の中でi番目に小さな値の分布の一般化になっている。

これを知っているとコンピュータの乱数でベータ分布の例を作ってベータ分布を身近に感じることができるようになる。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 18:20:03

こだまっく @hidekodama

22年2月9日

いやあ、それは違う。 twitter.com/noricoco/statu...

タグ:

posted at 18:47:31

あおじるPPPP @kale_aojiru

22年2月9日

こんな負け惜しみをほざいたところで、間違いが正しくなったりその逆になったりはしねえもんだ。鏡見ろっつう話でもある。 twitter.com/soysauce4976/s...

タグ:

posted at 19:07:54

非公開

タグ:

posted at xx:xx:xx

三城 俊一/みきしゅんいち @T_Morlie

22年2月9日

常識的にクリアできない量のタスクをさせておいて、できなければ「お前の努力が足りない」と詰めるパワハラ上司と同じ思考回路。 twitter.com/noricoco/statu...

タグ:

posted at 19:17:58

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 rand()で0から1の一様乱数をα+β-1個生成したとき、その中の

 小さい方からα番目の数=大きい方からβ番目の数

の分布はBeta(α, β)分布になる。この説明だと、α, βは正の整数である必要があるが、正の実数まで一般化できる。

タグ: 統計

posted at 19:53:06

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 上からも下からもα番目の数が中央値なので、一様母集団の中央値の分布はBeta(α, α)分布になります。

Beta(α, α)分布の密度函数のグラフを描けば、大きなαで正規分布でよく近似されることは、見た目的に明らか。

タグ: 統計

posted at 19:53:08

Massimo @Rainmaker1973

22年2月9日

Huge polar ice sheets are more than 3 km thick in places & cover a combined surface area 50% bigger than that of the US. The huge mass of water frozen in ice sheets exerts a powerful gravitational force that pulls on nearby seawater. And when they melt... buff.ly/2S2hLDz pic.twitter.com/8DzKVhqucI

タグ:

posted at 19:53:57

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 任意のℝ上の連続分布はその累積分布函数F(x)を使って、y=F(x)でyに関する0〜1区間の一様分布に変換できる。これを使えば、ℝ上の連続分布の標本の中央値の分布も分かる。

一般のBeta(α,β)のα,βが大きなときの密度函数をプロットすれば、やはり正規分布で近似できることが分かる。

タグ: 統計

posted at 19:56:55

ねとらぼ生物部 @itm_nlabzoo

22年2月9日

このかわいさ……!

眠る子猫、ゆっくりと頭が動いて…… 前足で隠れた寝顔が現れる様子に「スロー再生?」「かわいすぎ」の声
nlab.itmedia.co.jp/nl/articles/22... pic.twitter.com/VNQagudHZM

タグ:

posted at 20:05:00

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 それでは、標本の下から25%、50%、75%の3つの数の同時分布はどうなっているか?

その場合はDirichlet(α,α,α,α)分布を使うことになる。

Dirichlet(α,β,γ,δ)分布はα+β+γ+δ-1個のrand()のうちの

下からα番目, α+β番目, α+β+γ番目
=上からβ+γ+δ番目, γ+δ番目, δ番目

の同時分布。

タグ: 統計

posted at 20:05:35

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 四分位数の話を生徒に教えなければいけない人は、ベータ分布だけではなく。Dirichlet分布についても知っておいた方が良いだろう。😊

タグ: 統計

posted at 20:10:35

黒木玄 Gen Kuroki @genkuroki

22年2月9日

#統計 補足

Dirichlet分布の変数は通常 x,y,z>0, x+y+z<1 の形に取るが、α+β+γ+δ-1個のrand()のうち下からもα, α+β, α+β+γ番目をr, s, tと書くと、x = r, y = s - r, z = t - s という関係になっている。

単体(simplex)への座標の入れ方も色々ある。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 20:14:43

あ〜る菊池誠(反緊縮)公式 @kikumaco

22年2月9日

@fair_gail モニタリングはスクリーニングではありません。福島の甲状腺検査はマススクリーニングなので、IARCの提言に反します

タグ:

posted at 20:22:43

黒木玄 Gen Kuroki @genkuroki

22年2月9日

うぉっ!

膨大な量の氷が海水を重力で引っ張っているのか! twitter.com/rainmaker1973/...

タグ:

posted at 20:22:44

PMJames @pm_james

22年2月9日

知り合いの(婉曲表現)受験生、数学自己採点で180点以上はとってたけど「終わった時点で3分しか残ってなかった」と言ってたので、分量多すぎは確かなんだろうなあ twitter.com/HirokazuOHSAWA...

タグ:

posted at 20:36:20

RochejacMonmo @RochejacMonmo

22年2月9日

今年度の数IAについて
・問題文を読解できず、定型的に解けなかったのが原因
という新井紀子氏の評には同意できない。
・問題の内容は難しくなかった
と評価をする人は新井氏だけではないが、私は同意できない。「読解」や「定型的」や「問題の内容」といった語の射程が曖昧で床屋談義にしかなってない pic.twitter.com/IC2JP1Or7q

タグ:

posted at 20:58:36

@turi2018

22年2月9日

毎日ほぼ一緒に過ごしているのに、離れた親父に対して慌ててすり寄る猫に笑った pic.twitter.com/PtbGWysvjT

タグ:

posted at 21:03:26

ニコ @nico_memo2

22年2月9日

@fair_gail @kikumaco 学生が対象の検査は学校での一斉検査ですので、表向きは任意ですが、実態は『ほぼ強制に近い』と思われます。

タグ:

posted at 21:13:16

あ〜る菊池誠(反緊縮)公式 @kikumaco

22年2月9日

甲状腺検査では「学校検診の半強制性」がずっと問題視されており、僕たちの書籍「福島の甲状腺検査と過剰診断」でも、とにかく学校検診はやめようと提言しています twitter.com/nico_memo2/sta...

タグ:

posted at 21:15:41

RochejacMonmo @RochejacMonmo

22年2月9日

新井紀子氏による下記日経記事へのコメント
www.nikkei.com/article/DGXZQO...
「統計では都道府県別の各産業の就業者割合が題材になった。」
って、それは去年の共通テストの問題で今年の問題ではないのでは?今年は国際交流基金の実施した「海外日本語教育機関調査」(今年度本試数IA大問2[2])なんですけど。 pic.twitter.com/VcQsfaCIM2

タグ:

posted at 21:18:47

非公開

タグ:

posted at xx:xx:xx

RochejacMonmo @RochejacMonmo

22年2月9日

新井氏のコメントツイート全体をメモ。 pic.twitter.com/AvSQOVF73Q

タグ:

posted at 21:20:05

あ〜る菊池誠(反緊縮)公式 @kikumaco

22年2月9日

え?科学ジャーナリストなの?この科学リテラシーで? twitter.com/sayawudon/stat...

タグ:

posted at 22:45:19

RochejacMonmo @RochejacMonmo

22年2月9日

「数学に閉じたスキル」では「コンピュータに代替される」とはどういう意味なのか。「数学に閉じたスキル」も定義が不明確だし、それが「コンピュータに代替される」も意味や射程が不明。比較されている「数学を活用するスキル」との違いも不明瞭。ミスリードだし曖昧過ぎ。 twitter.com/RochejacMonmo/...

タグ:

posted at 22:46:02

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました