黒木玄 Gen Kuroki(@genkuroki)/2022年05月10日

黒木玄 Gen Kuroki

@genkuroki

いいね数 389,756/311,170
フォロー 995　フォロワー 14,556　ツイート 293,980
現在地 (^-^)/
Web https://genkuroki.github.io/documents/
自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。

Favolog ホーム » @genkuroki » 2022年05月10日

« 次の日| 前の日 »

並び順 : 新→古 | 古→新

2022年05月10日(火)

黒木玄 Gen Kuroki @genkuroki

22年5月10日

@tsatie 主に大学で学部生向けに統計学を教えている人達を想定読者とした発言スレッドです。

だから基礎的なことを相当に真剣に勉強しないと、そのスレッドで私が述べていることを理解できないと思います。

真剣に勉強せずに理解できるような話はしていない。

タグ：

posted at 23:06:42

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計教科書での説明がまずい件(続き)

佐藤俊哉さん曰く

「P値が小さければデータと帰無仮説の矛盾の程度が大きい」というふうに統計の教科書なんかに書かれているのですが、統計モデルの仮定の1つあるいは複数のものが間違っているんだと考える必要があります。

最重要キーワード：統計モデル pic.twitter.com/fRtcmJvixg

タグ：統計

posted at 23:01:28

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計教科書での説明がまずい件について

youtu.be/vz9cZnB1d1c

佐藤俊哉さん曰く、

「有意な検定結果(P≤0.05)は帰無仮説が誤りであり、棄却すべきであるきとを意味する」と、統計の教科書を見たら必ず書いてありますが、でもこれも誤解なんです。

続く twitter.com/genkuroki/stat... pic.twitter.com/EEfFVCZvgP

タグ：統計

posted at 22:57:38

黒木玄 Gen Kuroki @genkuroki

22年5月10日

再掲

#統計「サンプルを生成している統計モデルのパラメータの真の値」という意味での「真」です。

統計モデルでサンプルが生成されていると想定するとき、パラメータの値も決めないと仮想的なサンプル生成の仕方は分からないのですが、その答えという意味での真の値です。

「真の」≠「現実の」 twitter.com/tsatie/status/...

タグ：統計

posted at 22:47:37

黒木玄 Gen Kuroki @genkuroki

22年5月10日

@tsatie #統計「サンプルを生成している統計モデルのパラメータの真の値」という意味での「真」です。

統計モデルでサンプルが生成されていると想定するとき、パラメータの値も決めないと仮想的なサンプル生成の仕方は分からないのですが、その答えという意味での真の値です。

「真の」≠「現実の」

タグ：統計

posted at 22:46:33

林　譲治 @J_kaliy

22年5月10日

動物の名前を覚えるみたい教材（猿の絵に「さ」と書いてるようなやつ）を前に、知人の娘さんが、馬を指差し、「競馬のけ」と「う」の字を指したときの知人の顔が忘れられない。 twitter.com/47mature/statu...

タグ：

posted at 22:40:38

TaKu @takusansu

22年5月10日

PISA自体が批判される事例もあるようです。
なぜ低学力のフィンランドが１位になったのか？ - 「北欧ゴリ押し」ウォッチ
yasemete.hatenablog.com/entry/2019/11/...

PISAという幻想｜Kae Takaoka ｜note
note.com/kaeusagi/n/na7... twitter.com/genkuroki/stat...

タグ：

posted at 22:36:33

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#超算数

積分定数さん→大三元
chie_zouさん→オールスター
ハガネの連勤術師さん→百鬼夜行

1つ上で「国士無双」を提案したが、なんかもう敗北した感じ。

百鬼夜行！🤣 twitter.com/hgn_no_otaku/s...

タグ：超算数

posted at 22:35:15

まちゅあ @47Mature

22年5月10日

娘が「パパ」って言ってちょっとショックだったが、さすがに次は「ママ」だと期待していたら…「イカ」だった…。…というネタを今世紀初頭に読んだような気がする。 twitter.com/Wwmajidesorena...

タグ：

posted at 22:33:57

餃子 @4soN0e1Qk9Jc8wc

22年5月10日

@HuffPostJapan とりあえず部活の担当廃止とみなし残業から残業代支給に変えればマシになる気はする。個人的に教員になるには部活担任したくないっていう理由が大きすぎる。

タグ：

posted at 22:28:15

Akinori Ito @akinori_ito

22年5月10日

いろんな顔を描く術式を組んだ pic.twitter.com/zfZk70ELZP

タグ：

posted at 22:27:02

JuliaHub @JuliaHub_Inc

22年5月10日

Pfizer uses Julia to accelerate #simulations of new therapies for metabolic diseases up to 175x. For more details click here juliacomputing.com/case-studies/p...
#julialang #pharmaceutical pic.twitter.com/NaGM7uu9Yt

タグ： julialang pharmaceutical simulations

posted at 22:16:55

soorce @soorce

22年5月10日

65歳は若すぎる。まだ連載中のもあるのに、無念だろうん。作品はどうなるんだろう。 / 他4件のコメント b.hatena.ne.jp/entry/s/www.or... “『天牌』原作者・来賀友志さん死去　65歳　先月には急性リンパ白血病で緊急入院していた” (11 users) htn.to/2h62bse6a9

タグ：

posted at 22:07:31

@kankichi57301 @kankichi57301

22年5月10日

@genkuroki 赤牌全部使って上がると「オールスター」
（ローカルルール）
（赤５筒、赤５萬、赤５索１枚づつ、が多い）

タグ：

posted at 20:44:39

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計以上で出て来た「P値」「尤度」「事後分布」「予測分布」はどれも統計モデルの中に現実から得たデータの数値を持ち込むことによって作られます。それらの様子を見て、モデルの妥当性を評価したり、モデルから現実に関する推論推定予測を得たりします。

そして、それらは互いに無関係ではない。

タグ：統計

posted at 19:24:36

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計さらに、「統計モデル内でデータと同じ数値が生成されたと仮定して作った条件付き確率分布において次に生成されるデータの数値の分布」は「予測分布」と呼ばれています。(最尤法とベイズ法の両方で予測分布はそういうモデル内条件付き確率分布になっている。)

続く

タグ：統計

posted at 19:21:40

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計

「データの数値以上に極端な状態がその確率分布内で生じる確率」が「P値」と呼ばれている。

「データと同じ数値がその確率分布内で生成される確率またはその密度」は「尤度」(ゆうど)と呼ばれている。

さらに事前分布と尤度函数から作ったパラメータに関する事後分布も有用。

続く

タグ：統計

posted at 19:21:39

あ〜る菊池誠(反緊縮)公式 @kikumaco

22年5月10日

ニュースで「国の借金、国の借金」と財務省のプロパガンダに余念がありませんね。「国の借金」は年々拡大するのが当たり前で、今はむしろ出し足りないのだと思いますよ。岸田は財務省の言いなりだから。

マスメディアを信用してはだめです。あれは財務省のプロパガンダ機関です

タグ：

posted at 19:17:35

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計数学的フィクションであるモデル内も具体的な確率分布と現実から得たデータの数値の比較の仕方は色々あります。

タグ：統計

posted at 19:17:01

Iagoba Apellaniz @iagobaapellaniz

22年5月10日

Really nice results with Plots.jl! #julialang #juliaplots pic.twitter.com/CjONATL2Jf

タグ： julialang juliaplots

posted at 19:11:12

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計通常のP値や信頼区間の場合もベイズ統計の場合にも、統計モデルと現実の関係付けは、現実から得たデータの数値を統計モデル内に持ち込んで、統計モデル内の数学的フィクションの確率分布と現実から得たデータの数値を比較することによって行われます。 twitter.com/genkuroki/stat...

タグ：統計

posted at 19:10:56

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計そして、使用している統計モデルの現実の仕事における目的に合わせた適切さ(←これは非常に難しい問題)について別に考えなければいけないという事情を正直に説明しなければいけない。

タグ：統計

posted at 19:01:51

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計その点を誤解して、「真の値」や事前事後分布で確率分布しているパラメータ値を、現実における何かの値だといきなり最初から誤解しているせいで、「頻度主義vs.ベイズ主義」的な馬鹿げたくだらない考え方をするようになるのだと思います。

タグ：統計

posted at 18:59:25

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計通常のP値や信頼区間を扱っている場合も、ベイズ統計の事前事後分布を扱っている場合も、扱っているのは現実における何かの値ではなく、統計モデルのパラメータの値を扱っています。

タグ：統計

posted at 18:59:24

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計通常の信頼区間について「真の値」と言うときのその意味は「仮想的にデータを生成しているとみなしている統計モデルのパラメータの設定値」です。現実における真の値という意味ではない。

ベイズ統計での事前事後分布も同様に現実の値の分布ではなく、統計モデルのパラメータの分布です。続く

タグ：統計

posted at 18:55:22

黒木玄 Gen Kuroki @genkuroki

22年5月10日

@suzuki_psycholo #統計多分、多くの人にとって、佐藤俊哉さんの講義動画も情報の圧縮率が高過ぎて難しい。

さらに内容を易しくした解説を用意して、その用意した解説を興味深く思えるような予備知識を適切に提供できれば素晴らしいと思います。

しかし、作業量が半端ない分量になりそう。

タグ：統計

posted at 18:51:58

黒木玄 Gen Kuroki @genkuroki

22年5月10日

@suzuki_psycholo 目標として、佐藤俊哉さんのP値に関する講義動画を興味深く視聴できるような予備知識を提供できれば相当に有益な社会貢献になると思いました。

すぐに理解できなくても興味深いと感じられるだけでもよいと思います。

#統計 twitter.com/genkuroki/stat...

タグ：統計

posted at 18:42:48

黒木玄 Gen Kuroki @genkuroki

22年5月10日

@suzuki_psycholo 確率も検定もほとんど知らない人に信頼区間について説明するのは無理だし、確率について理解していない人が信頼区間について語るようになることは社会的にも有害だと思います。

あと、私は、SUZUKI, T.さん自身のために、信頼区間について長々と詳しい解説を書いて資料も提示したつもりです。

タグ：

posted at 18:39:01

はなもも(hanamomo) @hanamomoact

22年5月10日

お母さん帰ってきて、嬉しさ溢れるミニブーゲンズ。（ナバナさん踏まれたけど） pic.twitter.com/VVs3M1fdI4

タグ：

posted at 18:18:57

はなもも(hanamomo) @hanamomoact

22年5月10日

眠い。。 pic.twitter.com/quB2j02H9l

タグ：

posted at 18:06:22

はなもも(hanamomo) @hanamomoact

22年5月10日

ブーゲン母さん帰宅。お帰りなさいー！のアーラさん。アルタさんはまだ眠い。 pic.twitter.com/8iUgSxS3QV

タグ：

posted at 18:05:07

積分定数 @sekibunnteisuu

22年5月10日

確かに、他に比べようもない、という意味で　#超算数　は無双ではあるｗ

韓信が泣きそう。 twitter.com/genkuroki/stat...

タグ：超算数

posted at 17:54:34

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計例えば、正規分布の標本分布内での確率の計算は具体的な式がわかっているので積分で計算する(笑)

母集団からの無作為抽出の繰り返しによって信頼区間を説明することは、統計モデルと現実を混同させる非科学的な考え方を学生の心に植え付ける役目を果たしているだけだと思われる。

タグ：統計

posted at 17:22:34

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計【無作為抽出を繰り返す母集団が現実の母集団なのかモデル内の仮想的な母集団なのかを曖昧にする説明は廃棄されるべき】

統計モデル内での計算では、無作為抽出を繰り返すモンテカルロ法の必須ではないです(笑)

統計モデル内での値は多くの場合に「無作為抽出を繰り返さない」方法で計算する。

タグ：統計

posted at 17:19:34

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計私の経験では、P値や信頼区間や尤度のような統計学における基本概念の解説については、「学部生向けの教科書の多くに書かれている」という事実は「デタラメだ」と推測する有力な証拠になります。

おかしな説明の方がまるで常識のように流通している。

よく分かっている人達の説明と全然違う。

タグ：統計

posted at 17:11:52

黒木玄 Gen Kuroki @genkuroki

22年5月10日

相互リンク twitter.com/genkuroki/stat...

タグ：

posted at 17:05:22

黒木玄 Gen Kuroki @genkuroki

22年5月10日

関連スレッド twitter.com/genkuroki/stat...

タグ：

posted at 17:04:40

黒木玄 Gen Kuroki @genkuroki

22年5月10日

「真の値」は「仮想的にサンプルを生成していると考えている統計モデルのパラメータ値」という意味であり、「現実の母集団における真の値」という意味ではない。

「真の値」というジャーゴンのこういう紛らわしい点を教育では注意するべきだと思います。 #統計

タグ：統計

posted at 17:03:45

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計「検定で棄却されなかったこと」は「検定の手続きによって肯定も否定もされなかったこと」に過ぎないので、検定について理解していれば、データを取り直して95%信頼区間を繰り返し計算し直せば現実の母集団における真の値が95%の割合(=確率)で含まれるという説は__否定__されます。

タグ：統計

posted at 17:00:26

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計 P値(検定)と信頼区間が表裏一体であるという立場から、きちんと統計モデルの存在を考慮して、信頼区間の概念をクリアに説明することは何十年も前から行われていることです。

無作為抽出を繰り返す母集団が現実の母集団なのかモデル内の仮想的な母集団なのかを曖昧にする説明は廃棄されるべき。

タグ：統計

posted at 16:51:25

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計あと、超有名どころの教科書では、Rothmanさん達の疫学の教科書では、

* データと統計モデルから決まる「モデルのパラメータ値にP値を対応させる函数」(P値函数)

の重要性を強調し、P値函数の値が5%以上になるパタメータ値全体の集合を95%信頼区間だとしています。

タグ：統計

posted at 16:48:26

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計 YouTubeで閲覧できる佐藤俊哉さんの講義の動画でも、信頼区間を無数のパラメータ値に対して同時に検定を適用して得られる区間だと説明しています。

現実の真の値ではなく、仮想的なサンプルを生成している統計モデル内のパラメータ値を真の値と呼んでいることに注意。 twitter.com/genkuroki/stat...

タグ：統計

posted at 16:45:39

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計統計モデルのパラメータ値に関する検定法から信頼区間が得られるだけではなく、逆に統計モデルのパラメータ値の信頼区間の計算法が与えられれば逆に検定法も得られます。

この意味で、検定と信頼区間は数学的に同じものを別の視点から見ているに過ぎません。

タグ：統計

posted at 16:41:18

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計

信頼区間=「検定で棄却されない統計モデルのパラメータ値全体の集合」

であることの解説は「数理統計」と題された超有名教科書達に書いてあることなので、当然の常識的知識扱いで問題ないと思う。 twitter.com/genkuroki/stat...

タグ：統計

posted at 16:39:05

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計「95%信頼区間に真の値が含まれる割合(=確率)」という見方をしようとするから、信頼区間の解釈が難しくなる。

信頼区間は、統計モデルのパラメータの値を少しずつ動かして、各パタメータ値ごとに検定を無数に繰り返したとき、棄却されなかったパタメータ値全体の集合だと理解しておくと楽。続く twitter.com/suzuki_psychol...

タグ：統計

posted at 16:35:19

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計その「呪文A」は現実の母集団からの無作為抽出について唱えられたのではなく、数学的フィクションである統計モデル内で唱えられたことを正直にかつ明瞭に説明しないと、学生の教育でウソをついたことになると思う。

統計モデル内のことはそれでわかるが、現実と繋げるにはさらに議論が必要。 twitter.com/suzuki_psychol...

タグ：統計

posted at 16:24:11

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計それでは、例えば正規分布モデルを用いた統計分析はほとんどの場合に無意味になるのでしょうか？

それもひどい誤りです。

正規分布モデルを平均値に関する推論推定に使用した場合には。中心極限定理がよく聞いていれば誤差は小さくてすみます。

「1か0か」ではなく、「程度」で考えるべき。

タグ：統計

posted at 16:20:54

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計現実の母集団が正規分布に(ほぼ)ぴったり従っていることを当然の前提にして良いとか、無作為抽出が理想的に行われていることを当然の前提にしてよい、というような考え方は普通に健全な常識を持っていれば当然否定されます。

タグ：統計

posted at 16:18:11

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計それなのに、現実世界における母集団から無作為抽出を繰り返して、95%信頼区間を計算し直せば、95%の割合でその区間が真の値を含むかのように説明することは自明に誤りです。

モデルと現実の混同なので「非科学的に考えましょう！」と大声で語っているようなもの。

高等教育としてまず過ぎる。 twitter.com/suzuki_psychol...

タグ：統計

posted at 16:15:31

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計統計モデルは我々が設定するものなので、その設定に従うことによって数学的フィクションであるモデル内での仮想的な割合(=確率)は計算できる。

95%信頼区間の95%はそういう数学的フィクション内でのみ通用する割合(=確率)の値に過ぎません。

続く twitter.com/suzuki_psychol...

タグ：統計

posted at 16:15:30

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計信頼区間について「神様」は無用。

我々は、信頼区間の計算では、現実にぴったり一致しないことを当然のことだと分かっているような具体的な統計モデル(例えば正規分布モデルや二項分布モデル)を使っており、そのモデル内の真のパラメータ値は我々にはっきり見えている。「神様」は無用。

続く twitter.com/suzuki_psychol...

タグ：統計

posted at 16:15:30

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計沢山のサンプルから計算された95%信頼区間のうち95%が含んでいる「真の値」は現実の母集団における真の値では__ない__ことを正直に説明しなければ、統計モデルと現実を混同しており、典型的に非科学的な考え方をしているのでアウト。

続く twitter.com/suzuki_psychol...

タグ：統計

posted at 16:15:28

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計 "P is Arbitrary"に書いてあることを、P値と表裏一体の信頼区間で言い直せば、「サンプルサイズを大きくすれば信頼区間の幅が狭くなること」と同じ。

信頼区間の使用をすすめる側が「サンプルサイズを大きくすれば信頼区間の幅が狭くなること」を"P is Arbitrary"と否定的に要約するのは酷い。 twitter.com/genkuroki/stat...

タグ：統計

posted at 15:55:55

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計多分、人間の多くは「程度で判断すること」が苦手で「1か0か」で極端な判断をしがち。

「ぴったり正しくはないが、実用的にはその精度で十分」「一見誤差は小さく見えるが目的のためにはまだ誤差が大きすぎる」のように常に判断するようにしないとまずい。

統計学ユーザーは当然そうするべき。

タグ：統計

posted at 15:18:42

森山和道／ライター、書評屋 @kmoriyama

22年5月10日

取材に関するメールを危うく捨てちゃうところだった。もうほんとに、メールは連絡手段としては微妙すぎる

タグ：

posted at 14:40:16

黒木玄 Gen Kuroki @genkuroki

22年5月10日

手動分のバックアップも終了

タグ：

posted at 13:46:45

黒木玄 Gen Kuroki @genkuroki

22年5月10日

リポジトリを見ると、多重ディスパッチのスタイルでエコシステム全体を統一する方針に自信を深めて来たようにも見える。最初はこんなにうまく行くとは思ってなかったように見える。

タグ：

posted at 13:39:52

黒木玄 Gen Kuroki @genkuroki

22年5月10日

プログラミング言語の開発には「民主的な意思決定」は適さないように思われるのですが、#Julia言語のリポジトリの昔の記録を見ると、結構それに近いことをやっているようにも見えて、どうしてそういうことをやりながらうまくやって来たかは非常に興味深いと思います。

タグ： Julia言語

posted at 13:36:43

黒木玄 Gen Kuroki @genkuroki

22年5月10日

実用的なプログラミング言語の立ち上げには、その言語でパッケージを開発してくれる集団(エコシステム)の形成が最も本質的な問題なので、プログラミングのための純粋に技術的な事柄だけでは十分な理解に到達できず、社会科学的な事柄とうまく組み合わせる必要があると思います。

タグ：

posted at 13:31:49

黒木玄 Gen Kuroki @genkuroki

22年5月10日

積分定数さんは「大三元」といい、chie_zouさんは「オールスター」という。そろそろ「国士無双」という人も出て来そうだ。 #超算数 twitter.com/misomayo_omoch...

タグ：超算数

posted at 13:20:00

黒木玄 Gen Kuroki @genkuroki

22年5月10日

疲労困憊

タグ：

posted at 13:08:29

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計現実問題として、統計学のようなおそろしくややこしい道具について完璧な理解のもとで使うのは無理なので、科学的な誤りが生じることを防ぎ切るのは無理なので、事後的に重大な誤りを見付けた場合には適切に訂正して行く仕組みの整備が必要だと思います。

タグ：統計

posted at 13:04:43

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計あれやこれやで、理解していなくても、やり方を暗記して機械的に使えば統計分析をできるというような考え方は廃棄処分にする必要があります。

何をやっているかを理解してから、統計学の道具を使わなければいけない。理解していないことが多いとその分だけ科学的な誤りをおかす可能性が増える。

タグ：統計

posted at 13:02:21

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計ノンパラメトリック検定も検出力を高めるためには、現実にはおよそ成り立っているとは思えないような強い仮定が必要な検定もあるので、無条件に使ってよいことにはならない。

そもそも検定法を変えるとテストされる仮説も変わったりするので、それが本当にやりたいことかを考える必要がある。

タグ：統計

posted at 12:59:21

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計現実の母集団分布が正規分布から外れていても、中心極限定理が十分良く効いてくれていれば、正規分布モデルを使った平均値に関する推論推測推定の誤差は小さくなります。

だから、1か0かの判断ではなく、程度の判断にする必要がある。

タグ：統計

posted at 12:56:34

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計例えば、平均値の検定や平均値の信頼区間を求めるために正規分布の標本分布とそれから派生するt分布を使ったとします。

現実のデータを取得した母集団の分布が正規分布にぴったり一致している保証は大抵の場合にないので正規分布モデルの使用は不適切だ、と単純に判断することは誤り。続く

タグ：統計

posted at 12:53:56

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計「〇〇という目的にどのような統計モデルを使ってもよいか」は非常に非自明な問題です。なぜならば多くの場合に現実にはぴったり一致するはずの統計モデルを使うことが普通だからです。現実にぴったり合っているモデル以外を使うのは誤りだとする判断は誤りになります。

誤差の大きさが大事。

タグ：統計

posted at 12:50:20

川越囲碁の家 @KanpaiSore

22年5月10日

四歳の子供がアタリの石を見て「泣きそうな石（ぷよ碁のことね）」と言ってました。
これからは「アタリ！」ではなく「ナキソウ！」の時代です。

タグ：

posted at 12:10:29

早咲 @Sasaki910352

22年5月10日

@akimaeno @takofune 学校文化ですかね。
「やめてもご迷惑かかりませんか」
って個人でも聞く人少ないし、やってる方も良くわからないし、まず個人の疑問が市から上に届いていない風に見えます。
超算数問題も、とめはね問題も、似たように思えます。
そもそもツイッター見ててはじめて「やめても良い」って気づきました！

タグ：

posted at 08:49:00

積分定数 @sekibunnteisuu

22年5月10日

教科書には公式が載っている。
公式を覚えさせることを、「教えること」と認識している。
ハジキが覚えやすい

とでも思っているのだろう。

「ハジキ使わなくても、公式覚えさせるなら同じことだ。」と言う教員もいる。

その通り。どちらもろくなもんじゃない。 twitter.com/_za_kki_/statu...

タグ：

posted at 07:05:28

Mehmet Hakan Satman @mhsatman

22年5月10日

We are happy to have MCCGA (Machine-coded compact genetic algorithms) implemented in Metaheuristics package in #JuliaLang !

github.com/jmejia8/Metahe...

タグ： JuliaLang

posted at 05:18:08

数学の歩みbot @Auf_Jugendtraum

22年5月10日

彼は，他の者より先にしかじかの問題を解くといったことをばかりでなく，また，その人以外の者が決して持たなかった思想によって科学を豊かにすることを人々が期待するという人物であった．谷山もまたそのような人物である．（アンドレ・ヴェイユ） pic.twitter.com/PEc97d1lD6

タグ：

posted at 04:36:45

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計信頼区間の使用をすすめることは、

P値を「差がない」という仮説下の統計モデルだけではなく、「差は〇〇である」という無数の仮説についても計算しよう！

と言っているのと同じことなので、

P値をもっと沢山使おう

と言っていることになります。

タグ：統計

posted at 03:36:19

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計佐藤俊哉さんも動画では説明しているように、信頼区間は統計モデルのパラメータの値を少しずつ動かして無数のP値を計算することによって得られる区間とみなせます。

信頼区間の計算法はP値のかたまりのようなものです。

P値を攻撃しながら信頼区間をすすめる人達は信頼区間を理解していない。

タグ：統計

posted at 03:32:58

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計「差がない」という仮説を背理法で否定するという説明の是非を気にするのは相当に的を外していて、統計モデルを使っていることを正直に述べているかどうかの方が本質的。

タグ：統計

posted at 03:24:46

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計「差は〇〇である」という仮説下での統計モデルがデータにあまりにもフィットしていない場合には、その〇〇という値は信頼区間から外れる。

ただし、「あまりにもフィットしていない」の判断をP値と有意水準から機械的に行う。

これだけの話。

タグ：統計

posted at 03:22:16

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計あまりにもデータにフィットしない統計モデルは疑わしいと考えるのが普通で、そういう普通の判断を助けるための道具がP値の計算。

P値を「差がない」という仮説下の統計モデルだけではなく、「差は〇〇である」という仮説下での統計モデルでも計算すれば信頼区間も得られる。

タグ：統計

posted at 03:20:06

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計私のような見方は「統計的に有意である！」とか「統計的に有意でないではないか！」のような言い方でお墨付きが得られた強い主張をできると信じて来た人達には極めて都合が悪いと思う。

統計モデルが目的にとって適切かどうかを見積もる必要がある点を無視されちゃうと全てが台無しになる。

タグ：統計

posted at 03:15:46

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計「検定を帰無仮説を否定するための背理法だと説明することの是非」に関する議論もひどく的を外していて、統計モデルを使っていることを無視して「平均に差がない」の類の帰無仮説のみについて考えている時点でダメな議論になっています。

検定は統計モデルのデータへの適合度を見ているだけ。

タグ：統計

posted at 03:11:29

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計検定でテストされているのは、帰無仮説そのものではなく、帰無仮説下での統計モデル全体。

データを使って統計モデルをP値によって評価するのが通常の検定の手続き。

統計モデルの評価という見方ができれば、ベイズ統計も同じ考え方で理解できる。

タグ：統計

posted at 03:06:12

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計実際には統計モデルを使いまくっているのに、まるで帰無仮説をデータによってテストしているかのような態度は明らかに非科学的で批判するに値します。

P値を主な攻撃対象にするのは的を外していると思う。

統計モデルを前面に打ち出せばベイズ統計も含めて全部統一的に理解できる。

タグ：統計

posted at 03:02:02

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計上で紹介した佐藤俊哉さんの講義動画では、検定で評価されるのは、パラメータに関する帰無仮説ではなく、統計モデル全体であることを強調し、教科書におかしなことが書いてあることを指摘しています。

統計モデルを強調した説明こそ必要とされているのだと思います。

タグ：統計

posted at 02:58:35

黒木玄 Gen Kuroki @genkuroki

22年5月10日

webhome.auburn.edu/~tds0009/Artic... より

案の定「サンプルサイズを大きくすると小さな違いも検出できるようになる」という話を「P値は任意だ」と要約していますね。

こういう不合理でアンフェアな態度については、「あきれたものだ」とみんなで批評していかないとまずいと思いました。

#統計 pic.twitter.com/3kJHpzBCTf

タグ：統計

posted at 02:53:37

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#統計いつもお世話になっています。

こういう情報は非常に助かります。

webhome.auburn.edu/~tds0009/Artic...

を読んだまとめがこれなのか↓

takenaka-akio.org/etc/stat_test/... twitter.com/katzkagaya/sta...

タグ：統計

posted at 02:46:27

Katsushi Kagaya @katzkagaya

22年5月10日

@genkuroki こちらのサイトはその原因のひとつになっていると思います。とくに我々生物系で。takenaka-akio.org/etc/stat_test/...

タグ：

posted at 01:14:00

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#Julia言語並列化については以下のリンク先を参照。

docs.julialang.org/en/v1/manual/m...

タグ： Julia言語

posted at 01:03:13

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#Julia言語確率分布 dist のサイズ n のサンプルを大量に発生させてその各々について決まった計算をさせるタイプのモンテカルロ法では、2つ上のツイートのスタイルで書くと楽。

統計学を勉強中の人にお勧め。

CPUのコアを全部簡単に使えます。ただし公式ドキュメントの関連部分は読んでおくこと。

タグ： Julia言語

posted at 00:59:00

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#Julia言語 1つ前のコードでやれる仕事は

result = Vector{Float64}(undef, L)
for i in 1:L
X = rand(dist, n)
result[i] = f(X)
end

と同じなのですが、これだと無駄にアロケーションが発生して非常に遅くなってしまう場合がある。

並列化とrand!の併用の効果は非常に大きい。

タグ： Julia言語

posted at 00:53:20

黒木玄 Gen Kuroki @genkuroki

22年5月10日

#Julia言語

分布distのL個サイズnのサンプルXの各々についてf(X)を計算
↓
result = Vector{Float64}(undef, L)
tmp = [Vector{Float64}(undef, n) for _ in 1:Threads.nthreads()]
Threads.@ threads for i in 1:L
X = rand!(dist, tmp[Threads.threadid()])
result[i] = f(X)
end

タグ： Julia言語

posted at 00:50:28

Permalink - 2022年05月10日

« 次の日| 前の日 »

@genkurokiホーム

▲ページの先頭に戻る