黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2022年10月28日(金)
#Julia言語 大量のスクショを使ったインストール記事!
初めての人はこれを見るといいかも。
私が書いたJulia Jupyter notebooksが github.com/genkuroki/public に大量に置いてあります。 twitter.com/julia_kizi/sta...
タグ: Julia言語
posted at 00:03:48
#統計 上の方で私が解説したことの一部をすでに書いていたことについさっき気付きました。😊
パラメータθに関する「θ=θ₀」型の仮説群(値θ₀は自由に動かせないとダメ)について定義された検定法じゃないと、信頼区間と双対の関係にならないです。 twitter.com/tendy10tendy/s...
タグ: 統計
posted at 00:25:10
#統計 適切な指標が何であるかに合わせて検定法を選択する必要がある。
1つ上のツイートに関連した解説が以下のリンク先の上と下にある。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 00:27:01
@genkuroki 信頼区間は、症状が消失する中央値の差についての信頼区間ですが、検定は「2つの生存曲線が同一である」という帰無仮説を検定しているものと思われます。
そのため、この状況は下記のような状況と考えられます。
・「中央値に差がない」は棄却できない
・「曲線に差がない」は棄却できる
タグ:
posted at 00:36:58
@sankyoh 既出っす。例えば以下のリンク先。
他にも関連の話題について解説しています。
読者のために、類似のよりシンプルな場合としてWilcoxonの順位和検定が「2群の母集団分布は等しい」という強烈に強い条件なせいで否定もし易い帰無仮説を扱っていることも説明しています。 twitter.com/genkuroki/stat...
タグ:
posted at 00:46:38
#統計 おそらく、最も易しいのは、t分布を使って計算される母平均の信頼区間と1群のt検定の双対性です。
二項分布モデルを使った母比率の検定と信頼区間はそれぞれ複数通りあるので、互いに双対な検定と信頼区間の対が複数できる。
↓
↓詳しい解説
↓
github.com/genkuroki/publ...
タグ: 統計
posted at 01:31:44
#統計 2群の母比率の違いに関する検定を、違いの向きと大きさを表すパラメータを決めて拡張することについては、Modern Epidemiologyがかなり詳しいと思います。
Wilcoxon-Mann-Whitney検定の場合については以下のリンク先スレッドを参照。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 01:39:49
#統計 以上の統計学入門レベルの検定と信頼区間の段階で(単なる一般論ではなく)具体的にどうなっているかを理解していれば、そのヴァリエーションとしてより複雑な場合にも対応し易いと思います。
再度一般論に戻りたければ journals.sagepub.com/doi/10.1177/02... を読むと良い。 pic.twitter.com/WJtgNeFdoV
タグ: 統計
posted at 01:44:47
Elon Musk has completed his $44 billion deal for Twitter. The company's CEO and CFO were terminated and escorted out of headquarters reut.rs/3ziMaA7 pic.twitter.com/SBWTIzqPnx
タグ:
posted at 10:16:46
#統計 添付画像は
journals.sagepub.com/doi/10.1177/02...
からの孫引き。縦軸はP値で横軸はモデルの興味あるパラメータです。95%信頼区間は高さ0.05でこのグラフを切断して得られる線分になります。
つまり、P値が5%以上になるような興味あるパラメータの値全体の集合が95%信頼区間になります。 pic.twitter.com/BnuHu272Gl
タグ: 統計
posted at 10:31:00
#統計 続き。パラメータ値aのP値が5%以上のとき、パラメータ値aは棄却されないと言うことにすれば、95%信頼区間は棄却されないパラメータ値全体の集合になります。 pic.twitter.com/HMnbR7ozs4
タグ: 統計
posted at 10:31:02
#統計 おそらく、検定と信頼区間の自明な双対性とそのよく使われる検定と信頼区間での具体例について無知過ぎて、論文 journals.sagepub.com/doi/10.1177/02... にある添付画像のような見方ができることに気付けないせいで、検定に関する思い込みの方が強く出てしまったのだと思います。 pic.twitter.com/VyFGP7NaV1
タグ: 統計
posted at 10:31:06
#統計 論文 journals.sagepub.com/doi/10.1177/02... のタイトルは、
点推定やヌルP値だけではなく、区間推定やP値函数に基く結果の実践的重要性について議論しよう
です。点推定や単独の帰無仮説のP値だけを使うことは止めようという非常に常識的な話をしており、その代替案の1つが添付画像なわけです。 pic.twitter.com/OSiRSNrKph
タグ: 統計
posted at 10:31:09
#統計 そしてさらに、添付画像のような代替案を採用しても、結果を過信するようになってしまっては困るので、P値は、
データの数値と背景モデル+パラメータ値のcompatibilityの指標の1つ
でしかないことが強調されており、confidence intervalもcompatibility intervalに言い換えられています。 pic.twitter.com/2VggwQ5tzA
タグ: 統計
posted at 10:31:11
#統計 そもそも、Neyman-Pearsonの方のPearsonさんも、acceptanceやrejectionは不幸な用語選択だったと認めており、さらにFisherさんの「統計的検定は『学習の手段』である」という考え方を最初から共有していたと言っています。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 10:53:17
#統計 そういう状況で、総合的な判断に繋げるリンクを代替案として提案しているのが、紹介している論文 journals.sagepub.com/doi/10.1177/02... だとみなせます。
似たような主旨の文献は他にもいろいろあるのですが、この論文は非常に短くて読み易いので勧めています。
タグ: 統計
posted at 10:53:19
#統計 最終的に、総合的な科学的判断を合理的にできれば何をやってもよいと思うのですが、特定の帰無仮説のP値と効果量の点推定には慣れている人がその次に何を学ぶと良いかに関する提案として、紹介している論文 journals.sagepub.com/doi/10.1177/02... はよく考えられていると思います。
タグ: 統計
posted at 10:58:49
#統計 論文 journals.sagepub.com/doi/10.1177/02... の良いところは、「もうP値はダメなのでベイズ統計を使おう」のような誤解に満ちた極端な意見を述べたりせずに、既存の統計学ユーザーが困り難い提案をしていることだと思います。
タグ: 統計
posted at 10:58:50
非公開
タグ:
posted at xx:xx:xx
#統計 言いたいことはこれ↓
論文 journals.sagepub.com/doi/10.1177/02... は、点推定値とヌルP値だけで科学的な判断を行うのは止めて、区間推定やP値函数も利用するべきであると論じているが、www.shionogi.com/content/dam/sh... では信頼区間を無視して点推定値とヌルP値だけ【主要評価項目を達成】と結論を出している。 pic.twitter.com/XRtEXJyeGR
タグ: 統計
posted at 11:28:16
#統計 私が既読の文献では、「点推定値とヌルP値だけを見て判断してはいけない」とみんな言っているという印象がある。
点推定値とヌルP値だけを太赤字で目立つようにして、信頼区間を相対的に目立たなくするプレゼンテーションは、印象が非常に悪い。
www.shionogi.com/content/dam/sh... pic.twitter.com/Wqbna9Fo6w
タグ: 統計
posted at 11:36:44
#統計 しかし、私がこういうことに気付けたのは、「点推定値だけを示してはダメで、その精度がわかるような情報(例えば信頼区間)も必ず示さなければいけない」という統計学的常識に忠実にスライドを作ってくれていたから。
プレスリリース www.shionogi.com/jp/ja/news/202... の側に信頼区間の情報はない!
タグ: 統計
posted at 11:43:47
#統計 プレスリリースの側は「点推定値だけを示しちゃダメ」という基本を守っていないので、想定している読者はそういう問題に気付かないと思っているんだろうな、と思いました。
これも印象が悪かったです。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 11:50:09
```csharp
var source = Enumerable.Range(1, 100).Skip(1);
var primes = source.Except(from x in source from y in source select x * y);
``` twitter.com/genkuroki/stat...
タグ:
posted at 14:35:56
Togetter(トゥギャッター) @togetter_jp
若者の『動画に比べて漫画はタイパが悪い』という感覚が分からない→情報処理の方法が違うのでは?
togetter.com/li/1964450.
タグ:
posted at 16:45:08
OokuboTact 大久保中二病中年 @OokuboTact
@temmusu_n @takusansu 遠山啓が批判する「数え主義」というのがピンとこないのですが、緑表紙は現場で不評だったので、使用された期間が短いですね。
ところで塩野VS遠山の暗算VS筆算についてはこんな感想がありました。
(栗田哲也『暗算力』から) pic.twitter.com/04cPLtel2T
タグ:
posted at 21:34:33
#統計 #Julia言語 1次元のシンプルな正規分布モデルの共役事前分布のベイズ統計については、このスレッドで作成したノートブック
github.com/genkuroki/publ...
を参照。t分布を用いた母平均の信頼区間を、平均と対数分散について平坦な事前分布のベイズ統計でぴったり再現できる。 pic.twitter.com/VMLqIZuPyh
posted at 23:15:55
ウクライナの女性の民族衣装を美声の民謡とともに
紹介している動画。
60言語に対応していて、歌詞が日本語で出ました。
Julia Valova チャンネル
曲 Сонце низенько, вечір близенько
(太陽は低く、夕方は近い)4か月前 / 3分50秒
www.youtube.com/watch?v=okyyNX...
タグ:
posted at 23:23:14