Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
Favolog ホーム » @genkuroki » 2022年10月28日
並び順 : 新→古 | 古→新

2022年10月28日(金)

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#Julia言語 大量のスクショを使ったインストール記事!

初めての人はこれを見るといいかも。

私が書いたJulia Jupyter notebooksが github.com/genkuroki/public に大量に置いてあります。 twitter.com/julia_kizi/sta...

タグ: Julia言語

posted at 00:03:48

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 上の方で私が解説したことの一部をすでに書いていたことについさっき気付きました。😊

パラメータθに関する「θ=θ₀」型の仮説群(値θ₀は自由に動かせないとダメ)について定義された検定法じゃないと、信頼区間と双対の関係にならないです。 twitter.com/tendy10tendy/s...

タグ: 統計

posted at 00:25:10

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 適切な指標が何であるかに合わせて検定法を選択する必要がある。

1つ上のツイートに関連した解説が以下のリンク先の上と下にある。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 00:27:01

猫と人間が付属している眼鏡 @sankyoh

22年10月28日

@genkuroki 信頼区間は、症状が消失する中央値の差についての信頼区間ですが、検定は「2つの生存曲線が同一である」という帰無仮説を検定しているものと思われます。

そのため、この状況は下記のような状況と考えられます。
・「中央値に差がない」は棄却できない
・「曲線に差がない」は棄却できる

タグ:

posted at 00:36:58

黒木玄 Gen Kuroki @genkuroki

22年10月28日

@sankyoh 既出っす。例えば以下のリンク先。

他にも関連の話題について解説しています。

読者のために、類似のよりシンプルな場合としてWilcoxonの順位和検定が「2群の母集団分布は等しい」という強烈に強い条件なせいで否定もし易い帰無仮説を扱っていることも説明しています。 twitter.com/genkuroki/stat...

タグ:

posted at 00:46:38

猫と人間が付属している眼鏡 @sankyoh

22年10月28日

@genkuroki 既出でしたか、すいません。
他の話題も拝読します。

タグ:

posted at 00:47:28

黒木玄 Gen Kuroki @genkuroki

22年10月28日

@sankyoh 中央値の差の検定(信頼区間)の話の解説はしていない。した方がいいのかな?

具体的な計算を読者が自分でもできるような解説をしないと落ち着かないのですが、まだそうしていない。

タグ:

posted at 00:47:45

黒木玄 Gen Kuroki @genkuroki

22年10月28日

@sankyoh いえ、私の説明はくどい上に分かりにくいので、既出であってもシンプルなコメントは非常にありがたいです。どうもありがとうございました。

タグ:

posted at 01:18:07

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 例えば、薬の治験の結果について、P値と効果量の信頼区間の両方が報告されたとする。

P値が4%であるが、効果量の95%信頼区間が0をまたいでいた!

これ、非常にバツの悪い話。

こういうことが生じる理由は、検定と信頼区間の表裏一体性(双対性)について理解している人が少ないからだと思う。

タグ: 統計

posted at 01:26:44

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 検定と信頼区間の双対性の一般論は自明で易しいです。しかし、そういう自明な一般論だけを見ていても、統計学としての理解にはなりません。

よく使われている検定と信頼区間の間の関係を具体的に理解していないと実用になりません。

タグ: 統計

posted at 01:26:45

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 おそらく、最も易しいのは、t分布を使って計算される母平均の信頼区間と1群のt検定の双対性です。

二項分布モデルを使った母比率の検定と信頼区間はそれぞれ複数通りあるので、互いに双対な検定と信頼区間の対が複数できる。

↓詳しい解説

github.com/genkuroki/publ...

タグ: 統計

posted at 01:31:44

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 2群の母平均の差についても、互いに双対な検定と信頼区間の対は容易に得られます。

2群の母比率の違いに関する検定についてはどうでしょうか? おそらくこの場合が初めて出会う非自明な場合になります。違いの向きと大きさを表すパラメータの選び方がただ一つに決まりません!

タグ: 統計

posted at 01:35:04

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 2群の母比率の違いに関する検定を、違いの向きと大きさを表すパラメータを決めて拡張することについては、Modern Epidemiologyがかなり詳しいと思います。

Wilcoxon-Mann-Whitney検定の場合については以下のリンク先スレッドを参照。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 01:39:49

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 以上の統計学入門レベルの検定と信頼区間の段階で(単なる一般論ではなく)具体的にどうなっているかを理解していれば、そのヴァリエーションとしてより複雑な場合にも対応し易いと思います。

再度一般論に戻りたければ journals.sagepub.com/doi/10.1177/02... を読むと良い。 pic.twitter.com/WJtgNeFdoV

タグ: 統計

posted at 01:44:47

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 「θ=θ₀」型の仮説群で定義された検定法を大量生産する方法に、

 最尤法+{対数尤度比,スコア,Wald}検定

があります。検定と信頼区間の双対性より、信頼区間も自動的に定義され、最尤法という点推定の方法が区間推定の方法に自然に拡張されます。

タグ: 統計

posted at 01:56:43

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計

最尤法+{対数尤度比,スコア,Wald}検定+信頼区間

の数学があまりにもテクニカルだと感じた人は、数値的にこれとほぼ同じ結果をベイズ統計のシンプルな考え方で出せることを知ればちょっと感動するかもしれません。

逆に言えばこの場合はベイズを使っても大差ないです。

タグ: 統計

posted at 01:56:44

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 その「ベイズ統計を使っても大差ない」場合に、ベイズ統計を使っている場合が結構ある。

そういう場合に、「ベイズ統計なので主義思想哲学が全く異なるので違う解釈が必要だ」と__誤解__していると、通常のP値と信頼区間の組み合わせと大差ないことをやっていることを理解できなくなります。

タグ: 統計

posted at 02:00:33

黒木玄 Gen Kuroki @genkuroki

22年10月28日

訂正

❌差の中央値
⭕️中央値の差 twitter.com/genkuroki/stat...

タグ:

posted at 02:07:29

Reuters @Reuters

22年10月28日

Elon Musk has completed his $44 billion deal for Twitter. The company's CEO and CFO were terminated and escorted out of headquarters reut.rs/3ziMaA7 pic.twitter.com/SBWTIzqPnx

タグ:

posted at 10:16:46

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 添付画像は

journals.sagepub.com/doi/10.1177/02...

からの孫引き。縦軸はP値で横軸はモデルの興味あるパラメータです。95%信頼区間は高さ0.05でこのグラフを切断して得られる線分になります。

つまり、P値が5%以上になるような興味あるパラメータの値全体の集合が95%信頼区間になります。 pic.twitter.com/BnuHu272Gl

タグ: 統計

posted at 10:31:00

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 続き。パラメータ値aのP値が5%以上のとき、パラメータ値aは棄却されないと言うことにすれば、95%信頼区間は棄却されないパラメータ値全体の集合になります。 pic.twitter.com/HMnbR7ozs4

タグ: 統計

posted at 10:31:02

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 要するに、すべてのパラメータ値aについて「パラメータの値はaである」という仮説が棄却されないような値aを全部集めたものが信頼区間なわけです。

これを読んで「後出しで仮説を決めるのは~」とか言う人は思い込みが激し過ぎ。続く

タグ: 統計

posted at 10:31:03

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 続き。多分、以下のような状況を想像しているのだと思う。

①効果を意味するパラメータθの値が30%以上ならば十分に効果があることにしようと思っている。

①θの信頼区間が30%をまたいでしまったので、信頼区間に含まれない20%以上なら十分効果があることにした。www

これはまずい。続く

タグ: 統計

posted at 10:31:04

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 そこで問題になっていることは、十分に効果があることの定義を与える閾値30%の値を後付けで20%に恣意的に下げたことです。

それと、すべての値aについて同時に仮説「θ=a」の検定を実行して、棄却されないaの値を全部集める話は全然違います。続く

タグ: 統計

posted at 10:31:04

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 おそらく、検定と信頼区間の自明な双対性とそのよく使われる検定と信頼区間での具体例について無知過ぎて、論文 journals.sagepub.com/doi/10.1177/02... にある添付画像のような見方ができることに気付けないせいで、検定に関する思い込みの方が強く出てしまったのだと思います。 pic.twitter.com/VyFGP7NaV1

タグ: 統計

posted at 10:31:06

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 論文 journals.sagepub.com/doi/10.1177/02... のタイトルは、

点推定やヌルP値だけではなく、区間推定やP値函数に基く結果の実践的重要性について議論しよう

です。点推定や単独の帰無仮説のP値だけを使うことは止めようという非常に常識的な話をしており、その代替案の1つが添付画像なわけです。 pic.twitter.com/OSiRSNrKph

タグ: 統計

posted at 10:31:09

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 そしてさらに、添付画像のような代替案を採用しても、結果を過信するようになってしまっては困るので、P値は、

データの数値と背景モデル+パラメータ値のcompatibilityの指標の1つ

でしかないことが強調されており、confidence intervalもcompatibility intervalに言い換えられています。 pic.twitter.com/2VggwQ5tzA

タグ: 統計

posted at 10:31:11

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 特定の帰無仮説(例えば少し上の例では「θ=30%」や後付けの「θ=20%」)のP値に関する結果だけを特に重要視することも否定されているし、P値を使って得られた結果全般を過信することをどのようにして防ぐべきであるかも議論されています。続く

タグ: 統計

posted at 10:53:14

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 講義や教科書では、特定の帰無仮説のP値を使った仮説検定は仮説検証のプロセスであるかのように習って、今でもそのように信じている人達は結構いると思います。

しかし、統計学の適切な使い方に関する現代の議論ではそういう考え方は最初から相手にされていません!続く

タグ: 統計

posted at 10:53:16

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 主流なのは、仮説の科学的検証や重要な意思決定はケースバイケースで総合的に考えて行うべきであるという穏健で常識的な考え方です。

タグ: 統計

posted at 10:53:16

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 そもそも、Neyman-Pearsonの方のPearsonさんも、acceptanceやrejectionは不幸な用語選択だったと認めており、さらにFisherさんの「統計的検定は『学習の手段』である」という考え方を最初から共有していたと言っています。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 10:53:17

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 しかし、特定の帰無仮説のP値や効果量の点推定値を報告して来た人達に、「それじゃあ全然ダメ。総合的に考えて結論を出しなさい」と言うだけだと途方にくれさせてしまうかもしれない。

タグ: 統計

posted at 10:53:18

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 そういう状況で、総合的な判断に繋げるリンクを代替案として提案しているのが、紹介している論文 journals.sagepub.com/doi/10.1177/02... だとみなせます。

似たような主旨の文献は他にもいろいろあるのですが、この論文は非常に短くて読み易いので勧めています。

タグ: 統計

posted at 10:53:19

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 最終的に、総合的な科学的判断を合理的にできれば何をやってもよいと思うのですが、特定の帰無仮説のP値と効果量の点推定には慣れている人がその次に何を学ぶと良いかに関する提案として、紹介している論文 journals.sagepub.com/doi/10.1177/02... はよく考えられていると思います。

タグ: 統計

posted at 10:58:49

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 論文 journals.sagepub.com/doi/10.1177/02... の良いところは、「もうP値はダメなのでベイズ統計を使おう」のような誤解に満ちた極端な意見を述べたりせずに、既存の統計学ユーザーが困り難い提案をしていることだと思います。

タグ: 統計

posted at 10:58:50

黒木玄 Gen Kuroki @genkuroki

22年10月28日

訂正:2つ目の①は正しくは②です。 twitter.com/genkuroki/stat... pic.twitter.com/JVQpV7NrPy

タグ:

posted at 11:03:48

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 もしかしたら、このスレッドのトップを見て、5症状消失までの時間の中央値の差の95%信頼区間が0をまたいでいても、

❌P値が4%で5%を切っているのだから、検証プロセスとして他のことは小事に過ぎない

のように思ってしまった人達がいたら嫌だなと思いつつ以上の解説を追加しました。

タグ: 統計

posted at 11:08:46

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 言いたいことはこれ↓

論文 journals.sagepub.com/doi/10.1177/02... は、点推定値とヌルP値だけで科学的な判断を行うのは止めて、区間推定やP値函数も利用するべきであると論じているが、www.shionogi.com/content/dam/sh... では信頼区間を無視して点推定値とヌルP値だけ【主要評価項目を達成】と結論を出している。 pic.twitter.com/XRtEXJyeGR

タグ: 統計

posted at 11:28:16

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 私が既読の文献では、「点推定値とヌルP値だけを見て判断してはいけない」とみんな言っているという印象がある。

点推定値とヌルP値だけを太赤字で目立つようにして、信頼区間を相対的に目立たなくするプレゼンテーションは、印象が非常に悪い。

www.shionogi.com/content/dam/sh... pic.twitter.com/Wqbna9Fo6w

タグ: 統計

posted at 11:36:44

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 しかし、私がこういうことに気付けたのは、「点推定値だけを示してはダメで、その精度がわかるような情報(例えば信頼区間)も必ず示さなければいけない」という統計学的常識に忠実にスライドを作ってくれていたから。

プレスリリース www.shionogi.com/jp/ja/news/202... の側に信頼区間の情報はない!

タグ: 統計

posted at 11:43:47

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 プレスリリースの側は「点推定値だけを示しちゃダメ」という基本を守っていないので、想定している読者はそういう問題に気付かないと思っているんだろうな、と思いました。

これも印象が悪かったです。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 11:50:09

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 点推定値とヌルP値だけで重要な結論を出している場合は、この場合に限らず、孤立していないような気がします。

この手の問題が生じる原因は多岐にわたると思いますが、高等教育で教えている内容は無視できない問題。

特に「統計学は御墨付きを得るための道具である」という誤解が大問題。

タグ: 統計

posted at 13:37:46

Kentaro Inomata @matarillo

22年10月28日

```csharp
var source = Enumerable.Range(1, 100).Skip(1);
var primes = source.Except(from x in source from y in source select x * y);
``` twitter.com/genkuroki/stat...

タグ:

posted at 14:35:56

Togetter(トゥギャッター) @togetter_jp

22年10月28日

若者の『動画に比べて漫画はタイパが悪い』という感覚が分からない→情報処理の方法が違うのでは?
togetter.com/li/1964450.

タグ:

posted at 16:45:08

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#Csharp これ、分かり易いと思ったので結構好き。
twitter.com/matarillo/stat...

タグ: Csharp

posted at 17:41:49

積分定数 @sekibunnteisuu

22年10月28日

@kaz005 失礼します。どういうことでしょうか?

タグ:

posted at 18:49:23

積分定数 @sekibunnteisuu

22年10月28日

@tani101shi @mickey07251104 かけ算の順序といった嘘デタラメやハジキなどのくだらないこと教えるのをやめるのが先でしょうね。

タグ:

posted at 19:02:03

積分定数 @sekibunnteisuu

22年10月28日

@penguin_karl 問題文の読み取りは数学でも重要でしょう。それを国語と言うならそれども構わないけど、

かけ算の順序とどう関係するのでしょうか?

タグ:

posted at 19:05:59

sekkai @sekkai

22年10月28日

ファクトチェックセンター、Google から2億円ももらってるのに賢い高校生の自由研究みたいな記事しか公開してなくてウケるな。

タグ:

posted at 19:13:34

むううみん @muuumin20

22年10月28日

@genkuroki @Hyrodium たしかに、一般的な名前だと、意図せずうっかり上書きは怖いですね

タグ:

posted at 19:52:50

OokuboTact 大久保中二病中年 @OokuboTact

22年10月28日

@temmusu_n @takusansu 遠山啓が批判する「数え主義」というのがピンとこないのですが、緑表紙は現場で不評だったので、使用された期間が短いですね。
ところで塩野VS遠山の暗算VS筆算についてはこんな感想がありました。
(栗田哲也『暗算力』から) pic.twitter.com/04cPLtel2T

タグ:

posted at 21:34:33

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 #Julia言語 1次元のシンプルな正規分布モデルの共役事前分布のベイズ統計については、このスレッドで作成したノートブック

github.com/genkuroki/publ...

を参照。t分布を用いた母平均の信頼区間を、平均と対数分散について平坦な事前分布のベイズ統計でぴったり再現できる。 pic.twitter.com/VMLqIZuPyh

タグ: Julia言語 統計

posted at 23:15:55

黒木玄 Gen Kuroki @genkuroki

22年10月28日

#統計 正規分布モデルの最尤法は実質的に十分統計量(標本平均と標本分散)で尤度函数を表示する計算でしかない。

そこからほんのちょっと足を伸ばして、共役事前分布を使った計算結果をまとめておくと、後で数値的なベイズ統計の計算法のテストで使えて便利です。手間をかける価値があります。

タグ: 統計

posted at 23:19:58

maigo @maigo92008732

22年10月28日

ウクライナの女性の民族衣装を美声の民謡とともに
紹介している動画。
60言語に対応していて、歌詞が日本語で出ました。
Julia Valova チャンネル
曲 Сонце низенько, вечір близенько
(太陽は低く、夕方は近い)4か月前 / 3分50秒
www.youtube.com/watch?v=okyyNX...

タグ:

posted at 23:23:14

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました