Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
並び順 : 新→古 | 古→新

2022年08月26日(金)

天むす名古屋 Temmus @temmusu_n

22年8月26日

#超算数 この時代の朱註は原色原寸大の教科書に書き込まれる。現代の側注、下段註に当たる内容は、教師用指導書の後半、白黒の「詳細編: 単元の解説と指導の流れ 1年」に書かれている。なお私は前半を朱註と称したが、1980年に出版されたと思われる指導書には前半を呼称する名前が存在しない。

タグ: 超算数

posted at 00:18:14

天むす名古屋 Temmus @temmusu_n

22年8月26日

#超算数 詳細編は、合併(167)と、増加(168)とについて、具体的な操作とは絵の上にブロックやおはじきをおいて操作することであると考えているようである。「<参考>たし算について」(168)にある通り増加と合併は明確に異なるものと考えられているが、両者が持つ具体的な操作が相違するとは思われない。 pic.twitter.com/uYed59ctah

タグ: 超算数

posted at 00:37:19

天むす名古屋 Temmus @temmusu_n

22年8月26日

#超算数 169ページに28ページに対応する内容あり。やはりここでも合併と増加を異なったものとして指導する旨の記述はない。「<参考>記号と式」にある【立式は、無名数を本体とするが、式の意味を明確にするため、名数式を使ってもよい。】(同)にも注目。単位(算数教育界の用語法で助数詞を含む)が

タグ: 超算数

posted at 00:37:20

天むす名古屋 Temmus @temmusu_n

22年8月26日

#超算数 あれば名数式、なければ無名数ということになろう。そして、忘れてはいけないが、無名数なら算数教育界のルールに従っても、交換法則が無制限に使える。つまり掛順こだわりはおかしいとなるはず。実際には掛順にこだわらない教科書は当時も存在しないのですが。

タグ: 超算数

posted at 00:37:20

天むす名古屋 Temmus @temmusu_n

22年8月26日

#超算数 ちなみに奥付。現代の教師用指導書には作成に携わった人々のリストが載りません。ただし、この【編修】リストも、教科書のそれと違うのかどうなのか、調べていません。 pic.twitter.com/tyP7fzXejC

タグ: 超算数

posted at 00:40:38

Hiroo Yamagata @hiyori13

22年8月26日

@lotzun_DeuPol ああ、よっぽど自分の発言がまちがってるんじゃないかと不安だったんですねー。で、どっかの変な発言が自分を擁護してくれてると思って、大喜びしたんですねー。かわいそうに。

タグ:

posted at 03:10:26

nico @nicorn39

22年8月26日

どうしても趣味がJulia言語の方に行ってしまう(´・ω・`)大きな欠陥があるところ、不完全なところがまた愛おしいのですよ。#ロボット開発
www.mish.co.jp/applications/r...

タグ: ロボット開発

posted at 03:11:51

JuliaPackages @JuliaPackages

22年8月26日

New package: AbstractPDEInterfaces v0.1.0 announced #JuliaLang

AbstractPDEInterfaces: Ecosystem for writing partial differential equation solvers

Registration: github.com/JuliaRegistrie...
Repository: github.com/vpuri3/Abstrac...

タグ: JuliaLang

posted at 05:02:27

鎌塚 忠義 @kamayan1128

22年8月26日

@genkuroki こんなやり方があるんですね。追加したパッケージの依存関係で、ほかのパッケージのバージョンが変わるから、と思ってやり方を探ってたら、カーネル追加する方法がでてたので、それをやってました。
黒木さんの方が効率的ですね。ありがとうございます。

タグ:

posted at 05:19:03

富谷(助教);監修 シン仮面ライダー @TomiyaAkio

22年8月26日

最近、Julia がなんでいいの?と聞かれる機会が増えてる

タグ:

posted at 06:53:39

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計

xcelab.net/rm/statistical...
Statistical Rethinking 公式ウェブサイト

xcelab.net/rmpubs/sr2/sta...
Chapters 1 and 2

Chapter 2. Small worlds and large worlds の全文を読めます。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 09:22:39

クニえもん.inc @kun1em0n

22年8月26日

Julia言語は速いという話を聞いたので調べてみたら、この記事の実験ではfor文比較でpythonよりも100倍速いらしい。どうしてもpythonで長時間のfor文処理が発生してしまう場合にはその部分だけJuliaにやらせるのはありかも🤔 (並列処理もできる)

qiita.com/Ken-Kuroki/ite...

タグ:

posted at 09:48:39

yudai.jl @physics303

22年8月26日

このあたりのアドバイスを厳守した結果,爆速になりました!!! twitter.com/genkuroki/stat... pic.twitter.com/opAz4dSkLy

タグ:

posted at 10:31:31

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#Julia言語 うぉっ!アロケーションの減らし具合がハンパない!くっそ速くなっている!すごすぎ。 twitter.com/physics303/sta...

タグ: Julia言語

posted at 10:48:38

shigepong @shigepong

22年8月26日

不完全ガンマ関数を微分するってどうやるんだっけ?って調べていたらヤバい扉を開いてしまった。
おいおい、なんじゃこりゃ〜
mathworld.wolfram.com/MeijerG-Functi...

タグ:

posted at 11:45:14

浅野学園化学部 @AsnChemClub

22年8月26日

マグネシウムを二酸化炭素中で燃焼させました! pic.twitter.com/ic9R8l9P5V

タグ:

posted at 13:33:59

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 Statistical Rethinkingより。これも私がいつも言っていたこと。

ベイズの定理を使っているかでベイズ統計か否かを区別するのは間違いです。

例えば、有病率、感度、特異度にベイズの定理を適用することを、ベイズ統計扱いすることは間違っています。

xcelab.net/rmpubs/sr2/sta... pic.twitter.com/7JpKdtDcq3

タグ: 統計

posted at 15:44:08

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 教育的な注意

有病率、感度、特異度の話では、有病か否かと陽性か陰性かについての同時確率分布の2×2の表を描けてかつ、その状況を直観的に理解できるように教えるべきです。

小学5年生レベルの話題だと分かるように教えないとまずい。

ベイズの定理は無用であることも分かる。

タグ: 統計

posted at 15:53:05

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 統計教育の暗黒面の1つ

有病率、感度、特異度云々について、「感度」「特異度」の段階で非本質的な専門用語になっていることに気付かずに、さらに沢山の非本質的な用語を挙げ、ベイズの定理が必須であるかのように見せて、ベイズ統計だと言い張る見るに耐えない教育が一部で横行している。

タグ: 統計

posted at 15:55:19

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 ベイズの定理は条件付き確率の定義から自明に導かれるつまらない結果であることが分かるように努力しないとまずい。

ベイズ統計の理解でも、以下で述べることを理解していれば、ベイズの定理を知らなくても困りません。続く

タグ: 統計

posted at 16:05:49

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 p(x, y) = p(x|y)p(y)を満たすように、

(1) 同時分布p(x, y) から条件付き分布 p(x|y) と周辺分布 p(y) が得られること

(2) 逆に、パラメータyを持つxの分布 p(x|y) とyの分布p(y)から、x,yの同時分布 p(x, y) が得られること

が基本的です。(1), (2)の両方が大事。

タグ: 統計

posted at 16:05:52

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 パラメータyを持つxの分布 p(x|y) とyの分布p(y)から、x,yの同時分布 p(x, y) = p(x|y)p(y) を作ったときのx,yの同時分布に従う乱数は以下のようにして作れることも基本的。

①分布p(y)に従ってyの値をランダムに生成。
②そのyの値に対応するxの分布p(x|y)に従ってxの値をランダムに生成。

タグ: 統計

posted at 16:05:53

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 ベイズの定理は以下の2つのステップに分解されます。

リンク先の(2) p(x|y), p(y)が与えられているとき、p(x,y)=p(x|y)p(y)によってx,yの同時分布を作る。

リンク先の(1) x,yの同時分布p(x,y)から、p(x,y)=p(y|x)p(x) を満たすように、条件付き分布p(y|x)と周辺分布p(x)を作る。

続く twitter.com/genkuroki/stat...

タグ: 統計

posted at 16:15:08

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 続き

p(y|x)p(x) = p(x,y) = p(x|y)p(y) の全体をyで積分すると、∫p(y|x)dy=1より、

p(x) = ∫p(x|y)p(y)dy

なので、

p(y|x)
= p(x|y)p(y)/p(x)
= p(x|y)p(y)/∫p(x|y)p(y)dy.

これがベイズの定理。積分は和になることも多い。続く

タグ: 統計

posted at 16:15:11

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 続き。要するに、ベイズの定理は、同時分布を作るステップと同時分布から条件付き分布と周辺分布を作るステップを見えなくしただけの結果に過ぎません。

何をやっているかを直観的に理解しながら先に進みたい人は、その2つのステップをきちんと見ながら先に進んだ方が良いです。

タグ: 統計

posted at 16:15:13

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 積分を使う場合は小学5年生レベルとは言えないのですが、最も易しい有病率、感度、特異度から陽性的中率を計算する問題は小5レベルの割合の問題に過ぎず、小5で割合について習って理解できた子に自信を付けさせるために利用できます。

(実際に利用しました😊) twitter.com/genkuroki/stat...

タグ: 統計

posted at 16:22:54

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 小5レベルの話題なので、高等教育では「当然理解している」と仮定するべきなのですが、高等教育の側で小5レベルの話題について「ベイズ」の名を持ち出す権威的でよろしくない教え方で難解で高尚な話題であるかのように見せている場合があるので、その害を打ち消すための手間が必要になっている。

タグ: 統計

posted at 16:26:47

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 Statistical Rethinkingでも、ベイズ統計と非ベイズ統計の類似性を強調していますね。

「頻度主義」と言わずに「非ベイジアン」と書いている所もよいと思いました。

xcelab.net/rmpubs/sr2/sta... のp.39より
pic.twitter.com/aoWQXSQNhT

タグ: 統計

posted at 16:43:05

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 続きの解説。iidのベイズ統計では

ベイズ統計では、データy_1,…,y_nについて、

(log p(y_1|θ) + … + log p(y_n|θ)) + log p(θ)

を扱います。p(θ)が事前分布で、前半の括弧の内側が尤度の対数。nが大きくなると括弧の内側の和(=尤度の対数)が支配的になる。

タグ: 統計

posted at 16:43:06

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 ベイズ統計の枠組みには、統計分析的に適切な数学的操作を作ることが易しい(確率論的に最も自然な操作が正解になることが多い)という利点があります。

データの欠損値の取り扱いもベイズ統計の枠組みでは概念的に非常に易しくなります。

xcelab.net/rmpubs/sr2/sta... のp.35より
pic.twitter.com/PYfLy41g12

タグ: 統計

posted at 17:14:09

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 続き。ベイズ統計はある意味どんぶり勘定の世界であり、お気楽極楽に、現実とは決して一致することがない設定の統計モデルを使えます(すべてのモデルは間違っている(笑))。続く

タグ: 統計

posted at 17:21:19

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 現実には値が確定した定数になっていることがわかっている数値についても、それが観測できなかった(欠損値になった)という理由で、その値は確率分布に従ってランダムに決まっているという設定の統計モデルを使用できます。続く

タグ: 統計

posted at 17:21:20

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 現実においては確定した定数であるはずの値を確率変数でモデル化することが有用である理由は、主義思想哲学ではなく、数学的に得られます。

定数を確率変数でモデル化することの正当化のために妙な哲学が無用であることの理解はベイズ統計が有用であることの理解において本質的だと思います。

タグ: 統計

posted at 17:21:20

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 事前分布の任意性をベイズ統計を否定する理由に挙げることは、馬鹿げた態度であることも説明されています。

ほぼ同じことが、渡辺澄夫『ベイズ統計の理論と方法』にも書かれています。

この辺は「常識」扱いして良いことだと個人的には思います。

xcelab.net/rmpubs/sr2/sta... p.36より
pic.twitter.com/Ab9upEg28f

タグ: 統計

posted at 17:25:33

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 続き。統計学を使って不正な研究結果をでっち上げるために、事前分布を思いっ切り偏ったものにするのは無理な方法です。すぐにばれます。Stanのコードを読める人には数秒でばれる。

そうするより、モデルの事前分布以外の部分を複雑にしたり、データを不正にいじるなどの方法の方が有効(笑)

タグ: 統計

posted at 17:31:47

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 非ベイズ的方法が有効でない場合(モデルのパラメータが非常に多かったり、モデルが複雑であったりする場合)には、事前分布を適切に利用することが有効な統計分析をするために必要になります。

事前分布というモデルの自由度が増えたことが本質的に役に立つ場合がある。

タグ: 統計

posted at 17:34:26

やかわ@Lewisia @Jakwatm

22年8月26日

ずっとJuliaで解析やってみようって思ってるけど、新しい言語覚えるの大変やなーって考えのがデカくて動けない

タグ:

posted at 18:27:57

yudai.jl @physics303

22年8月26日

julia言語 でこーゆベクトルを得たいのですが,手っ取り早い方法ありますか?

いまはJのサイズが5ですけど,Jのサイズが7とか9とかでも大丈夫なような実装をしようとすると,[1,1,...,1,k,1,...,1] の部分をどうしたらよいか分からないです. pic.twitter.com/Z4HIyKvG5D

タグ:

posted at 18:35:47

まにう @maniyama

22年8月26日

尤度(いぬど)

タグ:

posted at 18:36:20

yudai.jl @physics303

22年8月26日

一番ナイーブな方法としては,

① onesでD次のベクトルをつくって,
② d番目を1個ずつ大きくしていって,
③ H[cum[d]-(d-2):cum[d+1]-d] に代入

だけど,もっと良い方法あったりしないかなと...

タグ:

posted at 18:41:51

はかせ @10ios4

22年8月26日

ゼータ関数の本が今ここに直面していて一気に難易度上がった感じして読む気がー( >_< ) twitter.com/genkuroki/stat...

タグ:

posted at 18:47:55

Yuki Nagai @cometscome_phys

22年8月26日

記事を投稿しました! 固有ベクトル-固有値同一性(Eigenvector-eigenvalue identity)をJuliaで確認してみる on #Qiita qiita.com/cometscome_phy...

タグ: Qiita

posted at 18:57:37

yudai.jl @physics303

22年8月26日

なんか,こーゆのでうまいことできない? pic.twitter.com/yD9NYoisKP

タグ:

posted at 19:00:50

yudai.jl @physics303

22年8月26日

とりあえず愚直にやった pic.twitter.com/hgVWWWgNpN

タグ:

posted at 19:18:56

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#数楽

nbviewer.org/github/genkuro...

genkuroki.github.io/documents/Calc...

の2.10節に、フルヴィッツのゼータ函数と対数ガンマ函数の関係に関する解説があります。

対数ガンマ函数の導函数は役に立つ基本特殊函数で、コンピュータでも効率的に実装されており、単に純粋数学的な興味を超えた余得があります。 twitter.com/10ios4/status/...

タグ: 数楽

posted at 19:19:40

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 フルヴィッツのゼータ函数と対数ガンマ函数の関係は若いときに投資する価値のある価値ある計算例です。それをやり切ると沢山の余得が付いてくる。例えば、

* 階乗に関するスターリングの公式の究極形であるビネの公式が得られる。

続く

タグ: 統計

posted at 19:19:40

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 続き

* 証明の途中で、対数ガンマ函数の1階2階の導函数を使用する。それらは、ディガンマ函数、トリガンマ函数と呼ばれる基本特殊函数で、ガンマ分布がらみの計算でほぼ必須。例えば、ガンマ分布の最尤法のニュートン法での実装で必須。

余得は他にも沢山ある。

タグ: 統計

posted at 19:19:41

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 一般化されたゼータ函数の概念は渡辺澄夫『ベイズ統計の理論と方法』の第4章で使われており(汚く計算すれば避けられる)、ゼータ函数の積分表示(Mellin変換表示)に慣れておくことも余得の1つになります。

関連の解説


genkuroki.github.io/documents/2016...

nbviewer.org/github/genkuro...

タグ: 統計

posted at 19:24:50

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 コンピュータで、ガンマ函数やその対数だけではなく、対数ガンマ函数の導函数も気軽に計算できる、という知識は持っておいた方がお得です。初等函数と同じ感じで気軽に計算できる。

タグ: 統計

posted at 19:38:53

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#数楽 一般化された調和級数

1/x + 1/(x+1) + … + 1/(x+n)

はn→∞で log n のように ふるまうのですが、それらの差の極限が対数ガンマ函数の導函数(ディガンマ函数)になっています:

ψ(x) = - lim_{n→∞} (1/x + 1/(x+1) + … + 1/(x+n) - log n).

例えば、-ψ(1) = γ = 0.5772…

タグ: 数楽

posted at 19:43:37

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#数楽

* 逆三角函数はπ=3.14159…の一般化
* 指数函数はe=2.71828…に一般化
* ディガンマ函数はオイラー定数γ=0.5772…の一般化

こういう意味でも、ディガンマ函数が出て来る所まで勉強しておきたいです。

私が受けた高等教育ではそれは無理でしたが、次世代では違っていて欲しい。

タグ: 数楽

posted at 19:48:04

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#数楽 ディガンマ函数の勉強はガンマ函数論の一環としてやれば良いということになるのですが、対数ガンマの導函数自体も興味深い函数だと気付くのはちょっと難しい。

しかし、フルヴィッツのゼータ函数と対数ガンマ函数の関係の証明では自然に(勝手に)出て来るので、避けられない話だと納得できます。

タグ: 数楽

posted at 19:51:43

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#数楽 フルヴィッツのゼータと対数ガンマの関係を理解すれば、フルヴィッツのゼータの積分表示から、対数ガンマの「主要項+積分」型の表示も自然に得られ、スターリングの公式の究極形が得られてちょっとうれしいです。

続く

タグ: 数楽

posted at 19:54:23

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#数楽 そういううれしい結果を得るためには、対数ガンマの1階と2階の導函数の性質を調べておく必要があります。

このようにして、フルヴィッツのゼータと対数ガンマの関係を調べると、対数ガンマの導函数達は性質を調べておく価値のある函数であることが自然にわかります。

タグ: 数楽

posted at 19:56:38

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#数楽 純粋数学の世界には常人では一生理解できそうもない難しくて面白い話が多いのですが、そこに行くためには一歩一歩地道に色々なことを徹底的に理解しながら進む必要があります。

タグ: 数楽

posted at 19:58:38

Massimo @Rainmaker1973

22年8月26日

Archerfish shoot their prey down with water droplets from their mouths. They are remarkably accurate and can bring down insects and other small animals up to 3 m above the water's surface

[📹 buff.ly/3RfpGqz]
[read more: buff.ly/3Kn98uh]
pic.twitter.com/QjOXiWX3H5

タグ:

posted at 20:38:33

imonkey.eth ⚛️ @MrAnonP1

22年8月26日

@Rainmaker1973 Related species, one one land too and this is their favourite prey pic.twitter.com/JjpGeRY3GN

タグ:

posted at 20:51:29

ごまふあざらし(GomahuAzaras @MathSorcerer

22年8月26日

既存のメソッドを上書きする type piracy なコードを書いてしまってある種の罪悪感を持つ一方で、自分自身が作ったパッケージだし使い捨てだしいいか📦♪といういい加減さをもつスキルを身につけた。

(設計はちゃんとしよう)

#Julia言語

タグ: Julia言語

posted at 21:01:23

竹田純【書籍編集】 @TJ_paki

22年8月26日

「現在、鳥取県の条例改正により、鳥取県で有害図書に指定されるとAmazonで販売停止になることが発覚いたしました。…
有害図書の問題に関してここで1度考えておくべきではないでしょうか」

「ラジオライフ」2022年10月号の有害図書に関する記事 www.sansaibooks.co.jp/info/%e3%80%8c...

タグ:

posted at 21:37:25

黒木玄 Gen Kuroki @genkuroki

22年8月26日

@shigepong #統計 不完全ガンマ函数の難しい方の偏導函数の計算と #Julia言語 での実装例が

nbviewer.org/gist/genkuroki...

にあります。参考になれば幸いです。

一般化超幾何函数が必要ですが、計算自体は大学1年生レベルです。 twitter.com/genkuroki/stat... pic.twitter.com/k3Mo5XN2Dd

タグ: Julia言語 統計

posted at 22:19:44

(「・ω・)「ガオー @bicycle1885

22年8月26日

ラボ内Juliaコンサル業をしてる

タグ:

posted at 22:42:22

shigepong @shigepong

22年8月26日

@genkuroki ありがとうございます😊

タグ:

posted at 23:03:44

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 東大出版会の『統計学入門』を信頼できる教科書だと思ってしまうと、ミスリーディングな解説を受け入れてひどいことになるので要注意。

信頼区間、尤度、パラメトリック、…、基本概念達についてことごとくミスリーディングな解説が並んでいる。

信頼区間の解説のまずさの説明に続く。 twitter.com/tachnopolis25/...

タグ: 統計

posted at 23:05:06

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 添付画像は『統計学入門』での信頼区間の解説部分です。(11.36)に

P(L≦θ≦U)≧1-α

という不等式があります。実用的には出来るだけ

P(L≦θ≦U)≈1-α

になるようにします。例えばα=5%ならばこれは

P(L≦θ≦U)≈95%

という条件になります。続く pic.twitter.com/X7KUi6UZ4H

タグ: 統計

posted at 23:05:10

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 区間[L, U]は95%信頼区間なので、式

 P(L≦θ≦U)≈95%



 データを生成した確率分布を決めるパラメータθが
 95%信頼区間に含まれる確率は約95%になる

ことを意味します。元の(11.36)では「95%以上になる」になりますが、P(~)が確率を表すことに変わりはありません。続く pic.twitter.com/vjykr6OOcg

タグ: 統計

posted at 23:05:19

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 (11.36)に確率を意味するP(~)が含まれているので、95%信頼区間の95%は区間にθが含まれる確率(の近似値や下限)を意味することは、確定しています。

まず、この点を押さえておく必要があります。

95%信頼区間の95%は確率です。

これを誤りだと言う人はどうかしています。続く pic.twitter.com/bRrUOKSsH0

タグ: 統計

posted at 23:05:22

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 ただし、その95%という確率は、現実の母集団に直接関係する確率ではないことに注意を払う必要があります。

その95%は、信頼区間を定義するために使った統計モデル内標本分布で測った確率に過ぎません。

この点は、信頼区間の解釈で重要です。続く

タグ: 統計

posted at 23:05:24

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 なぜならば、現実における母集団が、信頼区間を定義するために使った統計モデルの前提を満たしていない可能性がいつでもあるからです。

信頼区間を信頼するためには、統計モデルの妥当性を問題にする必要があります。

この点に触れていない解説を受け入れるには危険です。

タグ: 統計

posted at 23:05:25

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 受け入れてしまうと次のように考えてしまうだろう:

❌仮に現実の母集団から標本を何度も取り直して95%信頼区間を計算し直せば、その中で、現実の母集団に関する真の値が含まれる区間達の割合は95%になる。

これはひどい誤りなので、添付画像の説明はミスリーディングだと言わざるを得ません。 pic.twitter.com/E0ds9jCeIz

タグ: 統計

posted at 23:05:28

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 数学的フィクションに過ぎない統計モデル内部で計算した確率を、まるで現実の母集団における割合の話になると考えることは、モデルと現実の混同になっており、典型的に非科学的な思考であると言って良いと思います。

読者を非科学的な思考に誘導するのはとてもまずい。

タグ: 統計

posted at 23:07:59

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 代替となる正しくてかつ実用的な信頼区間の解釈の仕方(confidence intervalではなく、compatibility intervalと解釈すること)については、最新の論文で滅茶苦茶わかりやすく解説されています。

Amrhein-Greenland June 3, 2022
journals.sagepub.com/doi/10.1177/02... pic.twitter.com/It7TTbecsr

タグ: 統計

posted at 23:11:17

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 パラメータθを持つ統計モデルM(θ)内で生成されたデータX (確率変数)のθを含まない函数 L(X), U(X) (これらも確率変数)で

P(L(X)≤θ≤U(X)) ≈ 1 - α (もしくは ≥ 1 - α)

を満たすものが与えられているとき、区間 [L(X), U(X)] をパラメータθの100(1-α)%信頼区間と呼びます。

タグ: 統計

posted at 23:18:05

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 定義から、95%信頼区間がθを含む確率は約95%(もしくは95%以上)になります。

定義からそうなるので、これは誰も否定できません。

ただし、確率的に揺らぐと考えているのはθではなく、データXやそれから決まる区間の両端の値L(X), U(X)です。

タグ: 統計

posted at 23:18:06

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 そして、95%信頼区間の95%という確率の値は、現実の母集団とは無関係に、統計モデル内でランダムに生成されたデータXの確率的揺らぎに関する確率の値であることを絶対に忘れてはいけません。

タグ: 統計

posted at 23:19:53

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 「それじゃあ、数学的フィクションである統計モデルのことしかわからない」と思うかもしれませんが、実はそれが正しい理解です。

統計モデルと現実の母集団の関係は別に考える必要があります。この点を忘れると統計学の誤用になってしまいます。

タグ: 統計

posted at 23:24:27

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 より正確に言えば、現実の母集団から取得したデータから、信頼区間を計算すると、数学的フィクションである統計モデルと現実で取得したデータの整合性(consistency、両立性、compatibility)がある程度分かります。

journals.sagepub.com/doi/10.1177/02... pic.twitter.com/hLh6OdUajk

タグ: 統計

posted at 23:24:30

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 信頼区間に含まれるθの値は、パラメータをその値に設定した場合の統計モデルと現実で取得したデータの整合性が閾値αで「無さすぎる」と判断されなかった値になります。

信頼区間はデータから棄却されないパラメータ値の集合になります。

タグ: 統計

posted at 23:27:00

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 もしも、現実の母集団分布(これは未知!)との関係で、信頼区間を定義するために使った統計モデルがなんらかの意味で妥当であることの証拠があるならば、棄却されなかったパラメータ値の集合(信頼区間)は現実の母集団についても意味のある集合だということになります。

タグ: 統計

posted at 23:29:00

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 論文 journals.sagepub.com/doi/10.1177/02... では、以上で私が「統計学のモデル」とよんだものを background model とよんでいます。

統計モデルを無視せずにきちんと考えることが、現代では主流の考え方になっています。

タグ: 統計

posted at 23:31:00

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 新型コロナの影響で、ツイッターでも「信頼区間」という言葉を見る機会が増えました。信頼区間は、

* データ



* 統計モデル

に依存します。現実の統計分析では

* データは偏っている
* モデルは正しくない

という覚悟が必要があり、この覚悟に適した解釈をする必要があります。

タグ: 統計

posted at 23:36:24

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 データが偏っていて、モデルも間違っていたとしても、データとモデルの整合性の指標は色々計算できて、我々はそれを参考にすることができます。

P値や信頼区間はそういう知恵の一部分だと思っておけば間違い無いと思います。

ベイズ統計を使っても以上で述べた事情はそのまま同じです。

タグ: 統計

posted at 23:39:06

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 ツイッターのような場所で「信頼区間」などの言葉をよく目にするようになって、『統計学入門』のような基本概念についてことごとくミスリーディングな解説をしている教科書が力を持ってしまっていることをずっと放置し続けたことの社会的ダメージは結構大きいと思うようになりました。

タグ: 統計

posted at 23:42:13

須藤玲司 @LazyWorkz

22年8月26日

日本におけるオンライン・ハラスメントの現状と対策:Twitterでの女性記者のツイート「炎上」を例に
f1000research.com/articles/10-11...

査読論文、著者が宣伝していたのを見かけ、興味深く読んだのですが…。

かなり問題のある論文に見えます、素人目には。
明らかな瑕疵が多数あり、少なくとも1つは致命的。

タグ:

posted at 23:46:52

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 ぶっちゃけ、博士号を持っているような人達であっても、信頼区間の解釈を『統計学入門』レベルの教科書にしたがって述べて恥じずに済むというかなりお寒い状況になっている。

せめて、博士号持ちなら、データとモデルから得られる信頼区間について真っ当な解説をして欲しいと思います。

タグ: 統計

posted at 23:48:57

黒木玄 Gen Kuroki @genkuroki

22年8月26日

#統計 博士号持ちなら、私が繰り返し紹介している短くてクリアな論文 journals.sagepub.com/doi/10.1177/02... くらい、すぐに読めるはずです。

タグ: 統計

posted at 23:50:33

須藤玲司 @LazyWorkz

22年8月26日

問題はいろいろあるのですが、いちばん深刻なのは、用語定義の曖昧さ。
オンライン・ハラスメントについての論文なのに、「オンライン・ハラスメント」という用語の定義がブレていて、一貫していません。
ハラスメントの解釈や考え方より前に、論文としてきびしいです。
f1000research.com/articles/10-11...

タグ:

posted at 23:51:14

須藤玲司 @LazyWorkz

22年8月26日

>オンライン・ハラスメントとは「インターネット上で行われる、扇情的なコメントやヘイトスピーチの繰り返しの投稿(「荒らし」「トロール」)、サイバーストーカー、身体的な脅迫、同意なしに性的に露骨な画像を公開すること(「リベンジポルノ」)、個人情報を公開する(略)などの行為」を意味する pic.twitter.com/9ml9OVTGw6

タグ:

posted at 23:55:18

ながぴい @Nagapiii

22年8月26日

なんでコロナが遊びだと思うのだろう?
twitter.com/TcvDOhc8CFkwhK...

タグ:

posted at 23:58:05

須藤玲司 @LazyWorkz

22年8月26日

これが本論文で宣言されている定義です。PEN Americaの定義を採用したものです。

身体的脅迫、リベンジポルノ、個人情報晒しなどの犯罪行為はいいとして、問題は「扇情的なコメントやヘイトスピーチの繰り返しの投稿」です。

そう、オンライン・ハラスメントの定義に「繰り返し」を入れています。 pic.twitter.com/CqvSx4MupY

タグ:

posted at 23:59:06

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました