Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
Favolog ホーム » @genkuroki » 2022年03月17日
並び順 : 新→古 | 古→新

2022年03月17日(木)

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 ポイントは、95%信頼区間の95%が現実の母集団に関する数値ではなく、数学的フィクションに過ぎない統計モデル内での確率の近似値に過ぎないということです。

キーワードは「統計モデル」です。

ASA声明でも「統計モデル」を強調しています。
www.biometrics.gr.jp/news/all/ASA.pdf twitter.com/c60evaporator/...

タグ: 統計

posted at 00:08:45

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計

TJOさんは信頼区間を理解していないので、この件では「無視する」または「誤解を広めるブログ記事であることの警告を発する」のどちらかにした方が良いです。 twitter.com/khis_ama/statu...

タグ: 統計

posted at 00:10:42

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 パラメータθの95%信頼区間の定義は「パラメータθを持つ統計モデルを使った検定でデータから有意水準5%で棄却されないパラメータ値θ全体の集合」です。

パラメータ値θの統計モデル内で「パラメータ値はθである」という仮説が有意水準5%で棄却されない確率は95%もしくはそれに近い値になる。続く

タグ: 統計

posted at 00:16:29

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 「パラメータ値θの統計モデル内で『パラメータ値はθである』という仮説が有意水準5%で棄却される確率は5%もしくはそれに近い値になる」は検定法を作るときに有意水準に課される基本的な条件です。

これから、95%信頼区間の95%がモデル内確率(もしくはその近似値)になることが出る。

タグ: 統計

posted at 00:16:30

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 P値がモデル内確率(の近似値)であるのと同じ理由で95%信頼区間の95%もモデル内確率(の近似値)になります。

ちなみに、ベイズ統計での95%信用区間(95%確信区間)の95%も数学的フィクションである統計モデル内での確率になります。

タグ: 統計

posted at 00:19:38

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 これは極めて頭の痛い問題で、何十年も統計学を学生に教えている人たちが、その間ずっと信頼区間(及びベイズ信用区間)について誤解させて来た。

しかも、自分達が間違っていたことをはっきり言わない。

科学や論理はその辺では蔑ろにされていると言ってよいです。

タグ: 統計

posted at 00:23:54

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 95%信頼区間及び95%ベイズ信用区間の95%は数学的フィクションである統計モデル内での確率(もしくはその近似値)に過ぎないので、95%信頼区間を重要な意思決定に使用する場合にはその統計モデルの現実での使用の妥当性に十分な注意を払う必要があります。←おそらくこれが一般教養として最重要!

タグ: 統計

posted at 00:27:12

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 95%信頼区間を計算するために用いる統計モデルを変えると、同一のデータから計算される信頼区間も変化します。

データと統計モデルの両方をチェックしないと、示された信頼区間が本当に信頼してよいかどうかは分かりません。

その辺を合理的に疑えるようになることが、教養として非常に重要。

タグ: 統計

posted at 00:30:31

Fukami@うさぎ飼い @maron_tweet

22年3月17日

母があの震災以来「中身の入ってる鍋は、寝るとき必ずシンクの中に置くようにしてるのよ」と今夜もそうしてたんだけど、大正解でした。コンロの上に置いてたら落下して大惨事でしたわ💦 pic.twitter.com/FyqjtMLHz0

タグ:

posted at 00:33:16

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 使っている統計モデルによって信頼区間が変わることを知らずに、求めた信頼区間を使って重要な意思決定をすることは、大変な危険行為であり、その危険性を多くの人達が認識できるように高等教育は頑張るべきなのですが、現時点では多分ひどく失敗しています。

非常に頭の痛い問題です。

タグ: 統計

posted at 00:33:35

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 現実と数学的フィクションである統計モデル内の区別が重要。

現実とモデルの混同は典型的に非科学的な考え方です。

例えば「現実の母集団分布は正規分布になっていると仮定する」のような説明の仕方は読者を非科学的な考え方に誘導しかねないので要注意です。

タグ: 統計

posted at 00:41:17

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 「現実の未知の母集団分布とは別に正規分布モデルを考える」ならば誤解せずに済む説明の仕方になると思う。

正規分布の仮定は現実においては確実に間違っているのですが、実用的には妥当な統計モデルの設定になることがよくあります。使用する統計モデルは非現実的な仮定を含んでいて良い。

タグ: 統計

posted at 00:41:18

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 実際には、実用的に使われている統計モデルは非現実的な仮定を含む方が普通です。

非現実的な仮定を含む数学的フィクションである統計モデルと現実から得たデータを使って信頼区間は計算されます。

データの取得の仕方と数学的フィクションが適切な意味でフィットしていないとまずい。

タグ: 統計

posted at 00:43:48

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 信頼区間の定義を知っていれば、【95%信頼区間とは、無作為抽出を繰り返し行って95%信頼区間を計算したとき、100回に95回ぐらいは真の平均値μを含んでいる範囲である】のような説明の仕方は相当に酷いと感じるはずです。続く

タグ: 統計

posted at 00:49:22

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 数学的フィクションである統計モデル内では、無作為抽出を繰り返さなくても、数学的に確率(=割合)の計算の仕方が与えられているので、割合(=確率)の値は得られるし、実際の計算の仕方もそうです。無作為抽出を繰り返して割合(=確率)の値を決定したりしない。

これは当たり前の話。続く

タグ: 統計

posted at 00:53:20

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 「100回に95回ぐらいは真の値を含んでいる範囲」というような説明の仕方も酷い。

「真の値」を「現実における真の値」だと解釈すると、モデルと現実を混同する典型的に非科学的な考え方をしていることになります。

非科学的な考え方はきちんと潰しておかないとまずいです。

タグ: 統計

posted at 00:55:55

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 パラメータ値がθの統計モデル内で、その統計モデル内で生成された標本から計算された95%信頼区間にθが含まれる確率は95%(もしくはそれに近い値)になります。

これの成立は、数学的フィクションである統計モデル内では正しいですが、現実では近似的にも成立していない可能性があります。

タグ: 統計

posted at 00:58:44

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 この手の知識に基いて統計分析の結果に合理的な疑いをはさむことができる人達で満ちた社会と、そうでない社会では、科学的な知見に基いた社会的意思決定の質で大きな違いが出るように思えます。

現実はダメな方になっているように見える。

頭の痛い大問題扱いが妥当だと思います。

タグ: 統計

posted at 01:02:29

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 数学的に確率の計算の仕方がすでに与えられている統計モデル内での確率計算の話なのに、現実の母集団から無作為抽出を繰り返さなければいけないかのように思っている人達は、根本的によく理解していないと思います。

非常に頭の痛い問題。

タグ: 統計

posted at 01:06:13

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計

(1)数学的フィクションである統計モデルを現実から得たデータを使って評価する。

(2)統計モデルという物差しを使って現実から得たデータを評価する。

の2つが基本。

タグ: 統計

posted at 01:15:37

積分定数 @sekibunnteisuu

22年3月17日

さすがにこれは詭弁が過ぎるだろう。 twitter.com/kongouin/statu... pic.twitter.com/bRRaFvJuEV

タグ:

posted at 01:39:32

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 統計モデル内での確率計算の話なのに、現実の母集団から無作為抽出を繰り返さなければいけないかのような説明がはびこる原因の1つは、「頻度論」「頻度主義」という用語を使った説明がまともだとみなされていることにあると思う。

統計モデル内の確率は主義によらずに数学的に決まっている。

タグ: 統計

posted at 02:13:33

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 数学的フィクションとしての統計モデル内での確率の現実における解釈や妥当性の類は「主義」によって一様に決まるようなことではなく、各場合ごとに判定されるべきことです。

個人的な意見では、確率について唯一の正しい主義思想哲学を決める試みは馬鹿げた行い扱いが妥当だと思います。

タグ: 統計

posted at 02:18:29

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 20世紀の統計学の黒歴史に影響されることなく、ユーザー側が自分の目的のために統計学の道具の使い方を合理的に決めるという方針にするべきで、主義によってお墨付きが得られる可能性を捨て去ることが必要だと思います。お墨付きを求める弱い心を捨てないと一瞬で考え方が非科学的になる。

タグ: 統計

posted at 02:21:50

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 統計学用語を使ってまるで科学的にまともだというお墨付きが得られたかのように語る人達を教養ある人たちが集団で馬鹿にするようになると我々の社会がより良くなる可能性が増すと思う。

タグ: 統計

posted at 02:27:47

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 統計学用語を使って説明する側は、現実には確実に間違っている仮定が含まれている統計モデルを使った分析が我々の意思決定に役に立つ妥当な分析だとみなせる理由を弱点をあらわにしながら正直にかつ正確に説明しなければいけない。

タグ: 統計

posted at 02:27:49

東北大学 @tohoku_univ

22年3月17日

学生、教職員の皆様へ。大きな地震が起きましたが、落ち着いて身の安全を確保してください。「安否確認システム」への応答をお願いいたします。
#地震 #安否確認

タグ: 地震 安否確認

posted at 02:36:12

大隅典子@東北大学(『小説みたいに楽しく @sendaitribune

22年3月17日

大学の機能は動いています。附属図書館本館は漏水が派生して臨時休館となります。#東北大学 #地震 twitter.com/tohoku_univ/st...

タグ: 地震 東北大学

posted at 02:38:16

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 数学的フィクションである統計モデル内での確率の話なのに、「頻度論」「頻度主義」という用語をなぜか使い始めて、現実の母集団からの無作為抽出を繰り返す話を始める人達は、おかしな解説によって誤解をひろめている人達なので要注意。

立派な人達の中にもそういう人達が沢山います。

タグ: 統計

posted at 02:38:26

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 95%信頼区間を計算するために使う統計モデルを変えると、95%信頼区間も狭くなったり広くなったりするのに、「無作為抽出を繰り返して95%信頼区間を計算し直すと、真の値を含む区間の割合が95%程度になる」のように説明するのは馬鹿げています。実際にはその割合は95%から程遠い値かもしれない。

タグ: 統計

posted at 02:41:53

黒木玄 Gen Kuroki @genkuroki

22年3月17日

ああ、地震のせいで目が覚めて眠れなくなった。

2011-03-11の経験のせいで地震が怖くなった。

タグ:

posted at 02:50:16

ずんだ@ 仙台つーしん @sentu_zunda

22年3月17日

仙台市内で災害応急用井戸に登録されている名簿です。断水している方は参考にしてください。

www.city.sendai.jp/taisaku-suishi... pic.twitter.com/kMtFZqW5CW

タグ:

posted at 04:51:42

我が家の黒猫 @kuro5696

22年3月17日

箱に入っただけでドヤ顔してくる黒猫 pic.twitter.com/S8eREw3pHy

タグ:

posted at 07:42:03

Dr. KID @Dr_KID_

22年3月17日

大きめの地震の後、建物などが崩れてしまう場所があるかもしれません。
汚れたガレキなどを素手で処理すると、手を切り、そこから皮膚が感染したり、破傷風になることがあります。
手袋が靴などで怪我を予防し、予防接種を受けているか確認するとよいでしょう。
怪我をした場合は放置せず医療機関へ。

タグ:

posted at 08:03:19

Dr. KID @Dr_KID_

22年3月17日

昨夜の地震で災害時の見直しをしたいご家庭もあると思います。

「医療機器が必要な子供の為の災害対策マニュアル」が以下のURLからダウンロードできます:
www.ncchd.go.jp/news/2019/2019...

医療機器が必要なお子さんがいらっしゃるご家庭は、ぜひとも参考にしてみてください。

タグ:

posted at 08:08:56

大' @satodainu

22年3月17日

おわ。常磐道もこんなになってたのか。宮城〜福島間の交通があれこれ途絶えてるなぁ。 twitter.com/e_nexco_tohoku...

タグ:

posted at 08:29:39

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 使用した統計モデルと現実から得たデータから有意水準5%の検定で棄却されないパラメータθの範囲がパラメータθの95%信頼区間の定義だと理解しておけば、P値を使う検定について理解すれば信頼区間についても理解できます。

P値についてはこれを試聴

youtu.be/vz9cZnB1d1c

タグ: 統計

posted at 09:04:20

黒木玄 Gen Kuroki @genkuroki

22年3月17日

@temmusu_n @hgn_no_otaku @sekibunnteisuu @physics_cats 参考資料

24/8(8分の24)は整数だと思いますか?
→いいえ19%

等式24/8=3の右辺の3は整数です。左辺の24/8も整数だと思いますか?
→いいえ35%

0は偶数ですか?
→いいえ30%

0は2の倍数ですか?
→いいえ33% twitter.com/genkuroki/stat...

タグ:

posted at 09:17:52

黒木玄 Gen Kuroki @genkuroki

22年3月17日

@sekibunnteisuu @snsnblog #超算数 よくある交換法則の説明は「アレイ図をどの向きに見るかと無関係に全部の個数は決まっている」ですが、以下のリンク先では添付画像のように説明していてひどい。

snsnblog.com/multiplication... pic.twitter.com/ezUndfMujP

タグ: 超算数

posted at 09:28:18

黒木玄 Gen Kuroki @genkuroki

22年3月17日

@sekibunnteisuu @snsnblog #超算数 大昔に英語のスライドでアレイ図を描いても数が大きくなると理解できなくなることを示唆したものがあったが、どこかにやって見つからなくてなってしまった。(英語圏にちょー算数を布教しようとしている人がいる)

そういうスライド資料を見つけた人がいたら教えて下さい。

タグ: 超算数

posted at 09:30:21

須山敦志 Suyama Atsushi @sammy_suyama

22年3月17日

最近のfully connectedなMLPとか見てるとまさに。
www.amazon.co.jp/dp/4320124626 pic.twitter.com/5MNJY40AnL

タグ:

posted at 09:37:24

黒木玄 Gen Kuroki @genkuroki

22年3月17日

@temmusu_n @hgn_no_otaku @sekibunnteisuu @physics_cats #超算数 0も含む数表中の2~10の倍数を「色塗り」させるときに0を省いて「色塗り」させる教え方をすすめている算数教育専門家がいる。

こういうのは社会的に責任を取らせる(一方的に自分が間違っていたことを認めて、0も倍数になることを教科書に載せさせる)ことが必要だと思います。 twitter.com/ookubotact/sta... pic.twitter.com/lzWsFtlN8E

タグ: 超算数

posted at 09:42:26

黒木玄 Gen Kuroki @genkuroki

22年3月17日

@temmusu_n @hgn_no_otaku @sekibunnteisuu @physics_cats #超算数 算数教育界は100年以上かけて、独自の非常識な算数もどきの体系らしきものを維持発展させていて、それを教科書にこっそり書き、教科書のマニュアル本や算数科指導法の本に書いたりしている。

それに従わされる教師は非常識なことを覚えることを強制される。

こういう酷いことになっている。

タグ: 超算数

posted at 09:46:22

黒木玄 Gen Kuroki @genkuroki

22年3月17日

@temmusu_n @hgn_no_otaku @sekibunnteisuu @physics_cats #超算数 算数教育界独自の非常識な流儀を覚え切れない先生達は、独自のスタイルで別の非常識な考え方を子供に教えるようになる。

算数教育は、なんぼでもデタラメを教えてしまう世界になっている。

家庭環境がよい子は悪影響を受けずに済むが、そうでない子には非常識の波状攻撃が直撃してしまう。

タグ: 超算数

posted at 09:51:09

須山敦志 Suyama Atsushi @sammy_suyama

22年3月17日

特定のタスク領域においてデータが大量に集まってきたことによって、暗記ベース・パターンベースの予測手法が相対的に強くなり、そのタスク領域限定で精度が上がったという部分が大きい気がします。受験で言えば、知能が向上したというより、過去問が増えて対策しやすくなったみたいなイメージ。

タグ:

posted at 09:55:02

kayoちゅう。 @KAYO_chu_des

22年3月17日

7路盤

18対20で敗北しました。 puyogo.app/rp?kf=M0RTQzRU... #ぷよ碁

タグ: ぷよ碁

posted at 10:01:40

水野篤@心臓の医者✨✨ @atmizu

22年3月17日

今見たらたしかに無茶苦茶不鮮明ですね(笑) twitter.com/genkuroki/stat...

タグ:

posted at 10:39:59

中村高康 @tnk4210

22年3月17日

大丈夫か?都教委。もう言っちゃいけないこと言ってるような気がする。

都立高入試英語スピーキングテスト、民間試験GTECとそっくり 都教委は「似ていても違う」 - 朝日新聞EduA www.asahi.com/edua/article/1...

タグ:

posted at 10:52:30

月刊アクション編集部 @gekkanaction

22年3月17日

ストーカーとは知らず
美少女を囲碁のパートナーに選んだ結果…

タグ:

posted at 12:00:00

黒木玄 Gen Kuroki @genkuroki

22年3月17日

ダメすぎ。昨晩よく眠れなくてめっちゃ眠い。

タグ:

posted at 12:22:59

kenta.nakamura @c60evaporator

22年3月17日

@genkuroki ありがとうございます。ご本人様よりご回答頂けてありがたいです。

また関連して2点ご質問させて頂きたいです。

タグ:

posted at 12:43:20

まさみつ@囲碁NFT開発 @igokyoto

22年3月17日

Windowsで囲碁AI(Lizzie+KataGo)を使う手順はこれだけです。

1.Javaをインストール
2.zipファイルをダウンロードして展開
3.ファイルを実行

そしてアンダー5万円の格安PCででも実用的に使えます。
(実際、それで使ってられるプロ棋士の方もおられます)

note.com/igokyoto/n/neb...

#note

タグ: note

posted at 12:43:23

kenta.nakamura @c60evaporator

22年3月17日

@genkuroki ①例えばt分布による母平均の信頼区間では上記統計モデルとして正規分布を採用していると解釈しましたが、平均値の分布はnが大きければ中心極限定理で正規分布に近づくため、母集団の分布が正規分布でなくともそれなりの精度で母平均の信頼区間が推定できるとみなして宜しいでしょうか?

タグ:

posted at 12:44:44

kenta.nakamura @c60evaporator

22年3月17日

@genkuroki ②以下のようにベイズ信用区間の解説で「頻度論での信頼区間は「θの値が区間内に入る確率は95%」と言えないが、ベイズ信用区間は「θが区間内に入る確率」と言えるので、直感的に解釈しやすい」という解説をよく見ますが、この解説はどのように理解するのが適切でしょうか
ai-trend.jp/basic-study/ba... pic.twitter.com/FUfqVXRDhl

タグ:

posted at 12:47:52

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 質問①回答

t分布を使った平均の信頼区間は、中心極限定理が十分に効くだけ標本サイズが十分に大きいならば、母集団分布が正規分布でなくても十分に正確になります。

ただし、標本サイズを相当に大きくしないと中心極限定理による正規分布近似がひどく粗くなる場合があるので要注意。続く twitter.com/c60evaporator/...

タグ: 統計

posted at 13:06:17

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 これについては自分でコンピュータで確認するまで「自分はまだ何も理解していない」と思っておいた方が良いです。

中心極限定理による正規分布での近似精度を粗くしたければ、コンピュータで扱う仮想的な母集団分布として、左右の非対称性が大きい分布を選ぶとよいです。続く twitter.com/c60evaporator/...

タグ: 統計

posted at 13:10:59

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 例えば、確率95%で標準正規分布になり、確率5%で平均10分散1の正規分布になる2つ山の混合正規分布のサイズ20の標本を10万個くらい生成して、その標本平均の分布をプロットしてみるとよいと思います。

その場合の95%信頼区間が母平均を含む確率は80%を切ります。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 13:18:17

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 ただし、正規分布モデル+t分布を使った平均の推定は例外的で、通常の場合には統計モデルが母集団分布からかけ離れていると妥当でない信頼区間が容易に得られます。

例えば、正規分布モデル+χ²分布を使って作った分散の信頼区間は、母集団分布が正規分布からかけ離れているとそうなる。

タグ: 統計

posted at 13:22:15

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 これも、コンピュータを使って自力で確認するまで「自分は何も理解していない」と思い続けるべきです。

誰かがそう言っていたこと(例えば私がそう言っていたこと)は正しいことの証拠にはならない。

タグ: 統計

posted at 13:24:02

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 質問②回答

ベイズ統計で使う統計モデルの方が事前分布も含んでいるせいでより複雑になっており、実践的には「モデルが複雑になったからベイズ法を使う」となりがちなので、ベイズ統計の側の方が圧倒的に直観的に分かり難いです。

ベイズ統計についてはクズのような解説が多数派なので要注意。 twitter.com/c60evaporator/...

タグ: 統計

posted at 13:28:53

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 日本では、心理統計の専門家でベイズ統計推しの人達が、異なる主義に基く異なる統計学としてベイズ統計を宣伝するという行為をやっているので要注意です。

特に豊田秀樹さんが論外にひどいと私は思っています。(私のツイログ参照)

あれを放置するような学者先生は信頼に値しないと思います。 twitter.com/c60evaporator/...

タグ: 統計

posted at 13:32:06

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 添付画像はどこからの引用?

その赤で囲んだ内側に書いてある「仮説Hが正しいかどうかの確率」は、(事前分布も含めた)統計モデル内でデータから作った条件付き確率分布(事後分布という)で測ったモデル内確率に過ぎず、P値のタイプのモデル内確率よりも、解釈は難しいです。 twitter.com/c60evaporator/...

タグ: 統計

posted at 13:39:22

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 その赤枠内の意味での「仮説が正しい確率」はモデル内確率に過ぎないので、統計モデルを変えれば幾らでも変わり得ます。信頼区間もそうでした。

このように、ベイズ統計を使うか否かと無関係に、使用した統計モデルの妥当性という厄介な問題の存在に触れない説明は全て不適切だとみなされます。 twitter.com/c60evaporator/...

タグ: 統計

posted at 13:43:41

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 信頼区間もまたP値から作られる区間なので、「P値と異なるアプローチ」として信頼区間を使うべきだと言っている人達は、誤解を招く有害な説明の仕方をしています。

区間推定の理解のためにもP値について正しく理解しておくことが必要です。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 13:50:53

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 新型コロナウイルス対策がらみの話題で「信頼区間」という用語の意味を正確に理解している人達が増えた方が社会的に有益であることに気付いた人は多いと思います。

そういう人は必然的にP値について理解している人を増やすことにも賛成する必要があります。

タグ: 統計

posted at 13:53:20

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 そして、それと同時に、非論理的かつ非科学的なスタイルで、P値の使用を否定してベイズ統計を推すという困ったことをしている人達が放置されていることにも気づくと思う。

P値や信頼区間を理解することの重要性とベイズ統計の素晴らしさは両立します。むしろ、それらは地続きで繋がっている。

タグ: 統計

posted at 13:56:09

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 新型コロナウイルス対策がらみで統計学の教養の重要性に気付いた人には

ocw.kyoto-u.ac.jp/course/328/
聴講コース 臨床研究者のための生物統計学

のビデオ講座がドンピシャの教材になるように思えます。

特に佐藤俊哉さんの講義が異様に聴きやすい。聴けば分かる。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 14:00:10

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 サンプル

youtu.be/cOHN444kBlo
臨床研究者のための生物統計学「回帰モデルと傾向スコア」
佐藤俊哉

16:40付近
【あまり統計の教科書には書いていないのですけれども
こういった仮定を満たしていないと、
実はこのモデルから得られた結果というのは
妥当な結果にならないわけですね】 pic.twitter.com/w17hZdpluO

タグ: 統計

posted at 14:39:43

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計

* モデルを変更すると大きく変化し得る95%信頼区間について「無作為抽出を繰り返して計算し直すと真の値を含む区間の割合が95%程度になる」のように説明すること

* モデルを変更すると大きく変化し得るベイズ統計での「仮説が正しい確率」は解釈が易しいと言うこと

ダメな所が共通している。

タグ: 統計

posted at 14:40:36

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 ②【この解説はどのように理解するのが適切でしょうか】

分かりやすく個人的な意見を述べると、

その解説を理解する必要は皆無である。無視するか、ひどい解説が書いていることへの警告を発するのがよい。

立派な地位の人がベイズ統計についてひどい解説を伝統的によく書いています。 twitter.com/c60evaporator/...

タグ: 統計

posted at 14:50:29

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 非常に困ったことに、「95%信頼区間については真の値を含む確率は95%だと言ってはいけないが、ベイズ統計の95%信用区間(確信区間)については真の値を含む確率は95%だとみなしてよい」とする極めてミスリーディングな解説が、定説のように流布している。

流布させている側に問題がありすぎ。

タグ: 統計

posted at 14:54:58

あをにまる @aonimaru_games

22年3月17日

というわけで毎年確定申告でお困りの皆様のために、申告のやり方を楽しく学べるフリーゲーム「確定申告を頑張るRPG」の開発をスタートしました。お楽しみに。 pic.twitter.com/jqrmfWSJO1

タグ:

posted at 15:14:32

Keno Fischer @KenoFischer

22年3月17日

I think this is an obvious place for formal methods research in #julialang. These annotations are indeed quite dangerous and easy to misuse, but at the same time also well defined and dealing with subject areas (effects/termination) that is well explored in the literature. twitter.com/kdwkshh/status...

タグ: julialang

posted at 15:49:11

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計

引用【p値は有意水準との比較に利用されるものである】

Rothmanさん達の疫学の教科書でのP値函数の使い方では、有意水準による安易な二値的判断を避けている。

そして、直観的に分かり易いかどうかは理解度による。「私のような理解度が低い人にとっては分かり難い」と書けば正直。続く twitter.com/c60evaporator/...

タグ: 統計

posted at 16:10:14

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 引用【パラメータθは定数なので「θの値が区間[a,b]にある確率は95%である」という言い方はできない】

これも論理的におかしい。θが定数であっても、区間[a,b]が確率的に揺らげば、θの値が区間[a,b]に含まれる確率を考えることができる。そして、95%信頼区間の95%はそういう意味での確率である。

タグ: 統計

posted at 16:13:39

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 続き。ただし、現実から得た数値がすでに決定されているデータから計算した信頼区間は確率的に揺らぎようがないので、その区間にθが含まれる確率を考えることはできない。

95%信頼区間の95%は数学的フィクションである統計モデル内での確率に過ぎない。

タグ: 統計

posted at 16:16:07

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 信頼区間を実用的に使うときには、「真の値が含まれる確率」というような方向に行かずに、何度も繰り返しの述べているように、検定(P値)と信頼区間の表裏一体性を使うのがよいと思います。(入門的教科書には書かれていないが、数理統計と題された売れ線の教科書には書いてある。)

タグ: 統計

posted at 16:19:26

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 与えられた観測データについて、パラメータθを持つ統計モデルの仮説「θ=θ₀」のP値は、θ=θ₀のときの統計モデルとデータの整合性の指標になっています。

P値が小さい場合には、θ=θ₀のときの統計モデルとデータの間に整合性がない(弱い)と考えます。続く

タグ: 統計

posted at 16:26:17

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 パラメータθの95%信頼区間の定義は、θ=θ₀の統計モデルのP値が5%以上になるパラメータ値θ₀全体のなす区間のことです。

5%という閾値の設定で整合性がないと判断したパラメータ値を全て捨てて残ったパラメータ値全体の集合を95%信頼区間と呼ぶわけです。

タグ: 統計

posted at 16:26:18

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 要するに、パラメータθを持つ統計モデルにおいて、整合性の指標であるP値について5%の閾値を設定して、データと整合性がないとされるパラメータ値を全て捨てて残ったパラメータ値達が95%信頼区間となるわけです。

捨てちゃいけないと判断されたモデルのパラメータ値全体が信頼区間になる。

タグ: 統計

posted at 16:29:13

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 例えば、ワクチンの効果を意味する統計モデルのパラメータθの信頼区間が0を含むならば「その統計モデルの下でワクチンの効果がないという仮説は捨て切れない」と解釈されます。

この解釈のどこがどのように直観的に分かりにくいのでしょうか?

タグ: 統計

posted at 16:31:49

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 例えば、ワクチンの効果を意味する統計モデルのパラメータθの信頼区間が負の値と正の値の両方を含むならば、「その統計モデルの下でワクチンが負の効果を持つ仮説も正の効果を持つという仮説も捨て切れない」と解釈されます。

要するに当該データからはよく分からないということが分かる。

タグ: 統計

posted at 16:34:53

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 ただし、信頼区間の使用時には、必然性がない5%の閾値を使うことが多く、必然性がない5%の閾値に頼った安易な二値的判断をしないように注意する必要があります。

こういう方向に考察を進めればP値函数全体をプロットして利用するというスタイルに誰でも行き着くと思います。

タグ: 統計

posted at 16:37:47

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 必然性皆無の閾値の設定に頼らずにP値函数全体を利用することについては、疫学の超有名教科書のRothmanさん達の教科書に書いてあります。

「頻度主義」のような非科学的な響きを持つ用語を安易に用いる人達はまずRothmanさんに学ぶべきだと思います。

タグ: 統計

posted at 16:41:12

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 安易な二値的判断を捨てて、P値函数全体がどのような情報を持っているかを学べば、その中に(少なくとも近似的に)最尤法による点推定の情報も含まれていることにすぐに気付きます。

P値函数全体の情報は、尤度函数全体の情報に相当に近い。続く

タグ: 統計

posted at 16:46:51

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 尤度函数全体の情報は、ベイズ統計の事後分布の情報にも相当に近いです(事前分布の違いしかない)。

これによって、

* 検定や信頼区間におけるP値函数
* 最尤法における尤度函数
* ベイズ統計における事後分布

を「似たようなもの」と認識できるようになる。

一挙に使える道具が増える!

タグ: 統計

posted at 16:46:52

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 統計学入門の教科書に書いてあるP値や信頼区間に関する事柄は、Rothmanさん達の疫学の有名教科書ですすめているP値函数全体の利用を経由すれば、同じような直観を維持したままで、最尤法やベイズ法による統計モデリングの世界に自然に到達できるように思えます。

タグ: 統計

posted at 16:49:54

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 例えば、95%信頼区間に含まれないパラメータ値の全体は5%の閾値の設定でデータと整合性がないと判断されたモデルのパラメータ値の全体になるのでした。続く

タグ: 統計

posted at 16:56:00

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 ベイズ版95%信用区間(確信区間)に含まれないパラメータ値全体も5%の閾値の設定でデータと整合性がないと判断されたモデル(ただしベイズ版なのでモデルは事前分布を含む)のパラメータ値の全体とみなせます。

事前分布も含めての整合性を見ているだけで考え方の基本を変える必要はない。

タグ: 統計

posted at 16:56:01

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 そして、通常の信頼区間とベイズ版信用区間の両方で注意するべきことは、モデルを変更すると区間も変化することです。

不適切なモデルで計算した区間を現実における重大な意思決定で使う場合には、モデル自体も疑うという慎重な態度が必要になります。

タグ: 統計

posted at 16:58:26

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 こういう現実での重大な意思決定で重要なことについて何も説明せずに、「頻度主義vs.ベイズ主義」というようなくだらない図式を描いて誤解を広めている人達はそれで何がうれしいのかさっぱり理解できません。

新型コロナウイルスはそういうことの害を可視化したと私は思っています。

タグ: 統計

posted at 17:02:38

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 補足

Stanなどをすでに使ったことがある人は、P値函数全体のプロットは事後分布のプロットに近い行為だと思っておけば間違いないです。

もちろん、P値函数と事後分布を比較すると違う所も多いのですが、それはむしろアイデアを多彩にするために役に立つ良いことだと思います。

タグ: 統計

posted at 17:17:04

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

22年3月17日

#統計 信頼区間などの解説は大抵の場合に誤解に誘導するような説明になっていることが多いのですが、それを書いたのと同じ人が書いたもっと「高級な話題」の解説は素晴らしいというようなことは珍しくないです。

おそらく「統計学入門」という特殊な分野内部でのみおかしくなるのだと思う。

タグ: 統計

posted at 18:22:01

長野県の部活動を考える会 @Naganobukatsu

22年3月17日

「部活を止めたら生徒がダメになる」

本当ですか?部活がなくなって生活に余裕が出て、十分に勉強や睡眠時間が取れるようになったり、帰宅が早くなって家族でご飯が食べられるようになったりした、という嬉しい声を聞きます。試験の点数が上がったという嬉しい結果も聞きますよ。#教師のバトン #部活

タグ: 教師のバトン 部活

posted at 19:11:09

WOLKE✈️ @AztWolke

22年3月17日

4ヶ月ほど前、うちの高校の周りの塀(腰の高さのコンクリ塀+金属製の柵)の上にモバイルバッテリーの繋がった車のスマートキーのようなものが2つ置いてあるを友人が見つけた
友人は怪しいと思いながら拾って学校に持ってきた
続く pic.twitter.com/X6c7GuHXi3

タグ:

posted at 19:55:53

WOLKE✈️ @AztWolke

22年3月17日

僕がそれを聞いて、モノを見てみると車のキーに偽装したカメラだった
まだあるかもと探してみると新たに2台見つかった
入っていたマイクロSDを確認すると登校する生徒がほとんど全員写っていて、他の学校(女子校)の生徒の映像もあった
なんと設置した人の映像もあった

↓中央に直径1mmほどのレンズ pic.twitter.com/jmhZ4C9wP7

タグ:

posted at 19:55:56

WOLKE✈️ @AztWolke

22年3月17日

学校に話しても対応が遅いと思ったので直接警察に持ち込んだ
カメラは証拠品として渡した
しかし、後日学校を通じて「公道をを撮影するのに違法性はなく、遺失物として処理する」との連絡があった
ならば、と警察に行って「遺失物として処理するするのであれば遺失物届を書かせてくれ」と言った

タグ:

posted at 19:55:57

WOLKE✈️ @AztWolke

22年3月17日

そして、3ヶ月後カメラを受け取ることができた
SDカードはデータ消去に自信がないらしく、警察で処分したとのこと
カメラはフルHDで撮影が可能で、買うと4万円くらいするもののよう
カバーを除いた重さは26グラムだけど、半分以上はバッテリーなのでそこを工夫したらラジコンにも積めそう pic.twitter.com/7ekZJy1KV4

タグ:

posted at 19:56:04

積分定数 @sekibunnteisuu

22年3月17日

ゼレンスキー大統領、米連邦議会で『真珠湾攻撃』例にした訴え…ネットで抗議の声「日本人として不愉快」「例えとして不適切」 (中日スポーツ)
#Yahooニュース
news.yahoo.co.jp/articles/ca4e1...

タグ: Yahooニュース

posted at 21:31:23

積分定数 @sekibunnteisuu

22年3月17日

なぜ不快になるのか、意味が分からない。

>「真珠湾攻撃そのものを非難するつもりは無いよ。あの時と我らは同じだ。って言いたいだけ」

この擁護論も訳が分からない。

真珠湾攻撃を是認するの?

タグ:

posted at 21:32:35

Limg @LimgTW

22年3月17日

こういうのは流儀の問題では済まず、色塗りのパターンで直感的に可視化することで、「0も塗った方が規則的」という数理的な考え方まで養う必要がある。逆にこういう不規則に鈍感なセンスは望ましくない。 twitter.com/genkuroki/stat...

タグ:

posted at 21:33:24

kenta.nakamura @c60evaporator

22年3月17日

@genkuroki ご丁寧にありがとうございます。
・nが大きいと中心極限定理で信頼区間の精度は上がるが、どの程度正確かは分布の種類等により異なり、シミュレーションで確認すべき(貼って頂いたタイムライン参考にさせて頂きます)
・母分散の信頼区間に関しては上記は成り立たない
と理解致しました

タグ:

posted at 21:34:20

積分定数 @sekibunnteisuu

22年3月17日

日本向けには、「原爆投下を思い出してほしい」
イラク向けには、「19年前の米軍の爆撃を思い出してほしい」
ベトナム向けには、パナマ向けには、・・・

タグ:

posted at 21:34:27

積分定数 @sekibunnteisuu

22年3月17日

twitter.com/search?q=kongo...

昨日やり取りした人、掛け算順序論者と同じで、「直前の相手のツイートに反論する」という姿勢なので、言っていることがどんどんずれていく。

タグ:

posted at 21:40:19

積分定数 @sekibunnteisuu

22年3月17日

分かりやすい例がこれ

金剛院天光氏 「ロシア軍は病院を爆撃している。米軍がこんなことしているなんて聞いたことがない」

積分定数 「1983年グレナダ侵攻で病院爆撃。2015年、アフガンの国境なき医師団の病院を爆撃」

金剛院天光氏 「過去を言い出したらキリがない」

????? pic.twitter.com/1iZonhIDmp

タグ:

posted at 21:46:10

積分定数 @sekibunnteisuu

22年3月17日

その前に自分が何言ったのかすっかり忘れているんだよね。

タグ:

posted at 21:46:25

河合祐介 @tkawai18_tkawai

22年3月17日

こういうことを信じるとその先に躓く生徒がいくらか出てくるよなぁ。
どうしてその先に学ぶ事との整合をチェックしないのか twitter.com/genkuroki/stat...

タグ:

posted at 22:03:28

WOLKE✈️ @AztWolke

22年3月17日

結果としてカメラが貰えたのは良かったが、学校及び警察の対応には不満が残る
カメラでの撮影だけでは犯罪でなく、警察も忙しいのであまり手が回せないのはわかるが、カメラを明らかに生徒を撮影する目的で塀の上という学校の敷地内に設置しているのだから建造物侵入等で捜査できないのだろうか

タグ:

posted at 22:25:08

黒木玄 Gen Kuroki @genkuroki

22年3月17日

@c60evaporator おかしなことを言っている人達がどうして誤りを認めて訂正しないのかはよく分かりません。

ちなみに、ある場合には「P値」と事後分布で測った「仮説が正しい確率」がぴったり一致していたりもします。標本サイズを大きくすれば多くの場合にそういうことが一般的に成立しています。 twitter.com/genkuroki/stat...

タグ:

posted at 22:36:34

黒木玄 Gen Kuroki @genkuroki

22年3月17日

引き分けの例を作ってみた。

11対11で引き分けました。 puyogo.app/rp?kf=QTNCIkM0... #ぷよ碁

タグ: ぷよ碁

posted at 22:50:05

黒木玄 Gen Kuroki @genkuroki

22年3月17日

これも引き分け。

11対11で引き分けました。 puyogo.app/rp?kf=QzNEMjQk... #ぷよ碁

タグ: ぷよ碁

posted at 22:56:53

WOLKE✈️ @AztWolke

22年3月17日

カメラはこれですね
Wi-Fi接続
500万画素
42,900円
www.akiba-garage.com/shopdetail/000...

タグ:

posted at 23:15:36

Viral B. Shah @Viral_B_Shah

22年3月17日

@Prof_Leao @MIT_CSAIL Technically 2009, but we announced publicly in 2012.

タグ:

posted at 23:25:04

WOLKE✈️ @AztWolke

22年3月17日

これらの商品自体には違法性はなく、法律で規制しようにも盗撮以外の目的で使用する小型カメラとの区別がつきにくいので難しいと思われます
私もこのような商品を規制したほうが良いとは思っておりません

タグ:

posted at 23:32:59

あんどろいど@ @android_IGO

22年3月17日

ぷよ碁に物足りなさを感じてきた方アンケートにご協力おねがいします。 twitter.com/android_ugenPA...

タグ:

posted at 23:35:28

かんの @Turtle_movie

22年3月17日

東北新幹線の被災現場を見てきました。
これまで見たことのないような現場に言葉を失うと共に今後の復旧を祈ってやみません。 pic.twitter.com/aPVwnCuctS

タグ:

posted at 23:47:57

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました