黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2022年09月19日(月)
昼間のこの辺、「正確なグラフ」ってのがどういうモノを指すのかって基準がちゃうと思うのよね。
ワシの場合、「実測値は全然おかしいけど、通る点の数値は正しく記載してるので良し!」みたいな感じなんだけど、そういうのが許せない人は、二次関数のx切片を取るのに定規で測りだしちゃったりするのね twitter.com/Yossy_K/status...
タグ:
posted at 00:30:51
服部 美咲 HATTORI Misaki @misaki_hattori
福島の甲状腺検査について、2020年の読売新聞連載記事①【無害ながん多数発見 「過剰診断」か被曝影響は否定】(読売新聞福島県版2020年8月26日)
緑川早苗・元福島県立医科大学准教授「福島県でもいったん検査をやめ、方法論を検討すべきだった」 pic.twitter.com/ZyxyohDNux
タグ:
posted at 00:37:13
服部 美咲 HATTORI Misaki @misaki_hattori
福島の甲状腺検査について、2020年の読売新聞連載記事②【不安解消の意図 裏目 被曝データ足りず推計頼み】(読売新聞福島県版2020年8月27日)
越智小枝・東京慈恵医科大学講師(当時)「不安に寄り添うためだった検査に、いつのまにか科学的な意義が過度に求められてしまった」 pic.twitter.com/U196olC5wP
タグ:
posted at 00:46:13
服部 美咲 HATTORI Misaki @misaki_hattori
福島の甲状腺検査について、2020年の読売新聞連載記事③【当事者説明どこまで 科学的知見共有する努力を】(読売新聞福島県版2020年8月28日)
大津留晶・長崎大客員教授「医師が一人一人じっくり問診を行い、必要に応じて触診しながら説明するくらいの丁寧さが必要だ」 pic.twitter.com/QJUyhYJBfb
タグ:
posted at 00:51:56
Genie v5.5.0 release!!!
Fix default parameter in Genie.Cookies.set
#GenieFramework #JuliaLang
🔴🟢🟣 🧞
github.com/GenieFramework...
posted at 00:56:40
そういえば自作パッケージがちゃんと公開されました.
Unitful.jlを拡張して,`string(::Quantity)`がjuliaでパース出来る文字列を返すようにしたものです.
#JuliaLang twitter.com/JuliaPackages/...
タグ: JuliaLang
posted at 07:03:51
非公開
タグ:
posted at xx:xx:xx
@yoshiokatsuneo ええと、P値の計算では統計モデル内での帰無仮説しか使いません。
P値の計算ではデータを生成した確率分布も使わず、データの数値のみを使います。
現実の母集団で帰無仮説が成立している状況でも対立仮説が成立している状況でも、同じデータの数値からは同じP値と信頼区間が得られます。続く
タグ:
posted at 08:48:43
@yoshiokatsuneo 自分で、コードを書いて、確認すればその辺もクリアになると思います。
自分が実装したP値と信頼区間を計算する函数について、データの数値
a b
c d
から計算したP値と信頼区間が常に整合的になっているかを確認すればよいと思いました。続く
タグ:
posted at 08:50:31
@yoshiokatsuneo P値と信頼区間を確実に整合的にするには以下の手続きに従えばよいです。
(1) データの数値Aとモデルのパラメータ値ωにP値を対応させる函数pvalue(A,ω)を実装する。
(2)信頼度1-αの信頼区間を計算する函数confint(A,α)を
confint(A,α)={ω|pvalue(A,ω)≥α}
を満たすように実装する。😊
タグ:
posted at 08:54:14
@yoshiokatsuneo データAが与えられたときに、P値函数がωの函数として単峰型ならば、pvalue(A,ω) = α を満たす2つのω=ω_L, ω_U を二分法やニュートン法など(運が良ければ手計算)を使って求めれば、区間[ω_L, ω_U]として信頼区間が求まります。
実装例が大量に公開済み
↓
github.com/genkuroki/publ...
タグ:
posted at 08:59:10
@yoshiokatsuneo prop.testで表示されるP値と信頼区間に整合性がない理由は、P値はPearsonのχ²検定のP値で、信頼区間はWaldの信頼区間で、それぞれで使っている分散の推定値が違うからというのは正しいです。
P値の側で使う分散をWaldの信頼区間で使う分散に合わせればそれらは整合的になります(添付画像の緑字部分)。 pic.twitter.com/LEENy5Q2JV
タグ:
posted at 09:10:04
@yoshiokatsuneo 逆に、比率の差の信頼区間の計算で使う分散に推定値をPearsonのχ²検定の側に合わせることができない(もしくは難しい)というのもその通りです。
比率の差ではなく、比率の比やオッズ比の信頼区間ならば、信頼区間を求めるときに使う分散の推定値を拡張されたPearsonのχ²検定の側に合わせられます。
タグ:
posted at 09:13:17
OokuboTact 大久保中二病中年 @OokuboTact
アホな定義
「具体的な物を使っているから抽象的ではない」というわけではない。
「2個のリンゴ」は具体的でもあり、同時に抽象的でもある。
そして、「どうしてそういう答えになるのか?」を考えるのも算数では大事 pic.twitter.com/jVRzNOyohJ
タグ:
posted at 09:16:35
@yoshiokatsuneo 信頼区間をP値と確実に整合的にする方法は有名な教科書達に書いてあります。教科書を読むことは結構大事。どこに何が書いてあったかを思い出せるだけで全然違う。
↓ twitter.com/genkuroki/stat...
タグ:
posted at 09:18:14
OokuboTact 大久保中二病中年 @OokuboTact
> 数学は負の数や平方根など、日常生活では目にしない抽象的なもの
はああ?
小学生は使わないかもしれなけれど、「日常生活では目にしない」と抽象的なのか? pic.twitter.com/3Lr5NBvj8E
タグ:
posted at 09:22:53
OokuboTact 大久保中二病中年 @OokuboTact
しかし小学生でも「借金」ぐらいは日常生活でも使うだろから、「負の数」は日常生活では目にするだろう。
ルートの記号は目にしないかもしれないけれど、正方形の面積と辺の関係だし。
「算数は抽象的ではない、理屈を重視しないただの計算」みたいな主張はムチャクチャ
タグ:
posted at 09:35:24
Ryan Hendrickson @tipofthespear42
Thank you @Hub_Volmer for the great article. Yesterday Ukraine lost a true warrior and patriot to a mine. I've seen the destruction and lives landmines destroy and the situation in Ukraine is at a critical point. The world needs to know. #Germany
www.n-tv.de/politik/Der-Am...
タグ: Germany
posted at 09:43:39
OokuboTact 大久保中二病中年 @OokuboTact
「算数は抽象的ではない」みたいな主張ってなんなんだろう?
例えば
百円のリンゴ3個と200円のミカン2個、買いました。合計はいくらですか?
この問題は具体的でもあると同時に抽象的でもある。
四則演算は抽象的な思考が必要だし、
タグ:
posted at 09:46:46
単純にエラーでテスト失敗してくれるならいいんだけど、出力なしで固まってworkflowがタイムアウトするパターンなので困った。原因はたぶんマルチスレッド周りなんだろうけど…。
タグ:
posted at 11:00:44
Juliaにおけるコレクションを扱います。 #はてなブログ #IT #プログラミング #Julia #JuliaLang #プログラミング言語
Juliaを基礎からゆっくりと(その05/X) - 「大人の教養・知識・気付き」を伸ばすブログ
power-of-awareness.com/entry/2022/09/...
タグ: IT Julia JuliaLang はてなブログ プログラミング プログラミング言語
posted at 12:00:16
#統計 添付画像①②はそれぞれ
biolab.sakura.ne.jp/u-test-permuta...
github.com/genkuroki/publ...
より。
ヒストグラムはビンの取り方で印象が大幅に変わるので要注意。
所謂「正確検定」での帰無仮説下の統計モデル内でのP値の累積分布函数は45度線に下から接するグラフになります。添付画像②のOut[7]を参照。 twitter.com/iguchi_y/statu... pic.twitter.com/kBsX5YgKQy
タグ: 統計
posted at 12:06:58
#統計 exact Wilcoxon-Mann-Whitney検定の各種実装に関する注意。添付画像の赤線部分を参照。
私は、
⭕️自分の実装
⭕️RでのexactRankTests::wilcox.exact
⭕️Rでのcoin::wilcox_test
は信用していますが、JuliaのHypothesisTests.jlやSciPyでの実装は信用していません。
github.com/genkuroki/publ... pic.twitter.com/MCo9QMCbba
タグ: 統計
posted at 12:13:13
#統計 Wilcoxon-Mann-Whitney検定の誤用が非常に一般的になっていることについては、粕谷さんが20年以上前に指摘しており、論文も書いています。
kasuya.ecology1.org/stats/utest01....
Mann-WhitneyのU検定と不等分散
粕谷 英一 2001
すでにWilcoxon-Mann-Whitney検定を使って報告を書いた人は要チェック。
タグ: 統計
posted at 12:18:22
#統計 検定法選択フローチャート的な教え方は非常にまずいです。
素人過ぎて事情が見えていない段階では見過ごしていましたが、ここまでひどい教育が高等教育機関で世界的に行われていることは大問題だと思います。
教わった側ではなく、教えている側がまずい。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 12:35:54
#統計 Statistical Rethinking という有名な本の第1章が、この検定法選択フローチャートを教えてしまっているという問題にあてられています。
xcelab.net/rmpubs/sr2/sta... で1~2章の全文を読めます。
そこにも添付画像のように書いてあって、教える側の問題であることが明確化されています。 twitter.com/genkuroki/stat... pic.twitter.com/Fm9AH8Sdw8
タグ: 統計
posted at 12:40:25
まさかとは思うが、
これを、数学的な「2=1の証明」と思ってないよね。
数学、できるんだよね。
数学が無理な人ぢゃないよね、確認だけど… twitter.com/cikuwabusan/st...
タグ:
posted at 12:44:51
#統計 Brunner-Munzel検定が何を検定しているかについては以下のリンク先スレッドを参照。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 12:47:46
#統計 Brunner-Munzel検定に関する日本語の情報で最も充実しているのは、私のツイログだと思います。日本語での解説でおかしなものが結構多いので要注意。
↓
twilog.org/genkuroki/sear...
タグ: 統計
posted at 12:50:36
#超算数 の最後の逃げ場がこれ。ただし色々なバリエーションがある。数学の準備のために算数があるんじゃないの。 twitter.com/w2Y3lkPhWhOwuq...
タグ: 超算数
posted at 13:05:59
色々切り分けてみたけど、やっぱりforループに[at] threadsをつけてるとGitHub上のCI環境(Windows)で単体テスト失敗する。(手元のWin11では動く。)
CI環境のWindowsがWindows Server 2022なのが悪いのか…?JULIA_NUM_THREADSもちゃんと指定してるんだけどなあ。
タグ:
posted at 13:14:36
どうやら既知のバグっぽい。
Deadlock bug on Julia 1.6.2 and Julia-nightly for multithreading on Windows Server 2019 · Issue #42075 · JuliaLang/julia github.com/JuliaLang/juli...
タグ:
posted at 13:35:00
@hgn_no_otaku twitter.com/cikuwabusan/st...
>わたしですら『算数と数学は違う』と理解してるのに
じゃあ「わたし」がアホなんでしょうね。
タグ:
posted at 13:42:31
@Yta8Ntion1FKvR0 @cikuwabusan @iroa1991 これは小学校の算数でも xやy が登場する時点で、理由にならない。
謎解きと考えるのは別に構わないが、数学を日常生活で使わないと思うのは、使わない人の勝手であって、数学の性質としては間違い。
算数も数学も日常生活でも使うし、社会活動でも使う、学問研究でも使う。
twitter.com/cikuwabusan/st...
タグ:
posted at 14:28:59
算数と数学の違い
・具体か抽象か→リンゴ1個とミカン1個を合わせて1+1=2とできるのは抽象でわ?
・算数は日常、数学は云々→日常の定義(視野の狭さ
・文科省ガー→権威主義
他は?w
タグ:
posted at 14:29:23
>数学では負の数(マイナス)や平方根(ルート)など、日常生活では目にしない抽象的なもの
改めて読んだケド、栄光の知性ヤバすぎじゃない?www
>算数では正しい答え、数学では答えまでの過程が重要視される
超算数と反対やんけ!!!!!!
www.eikoh-vis-a-vis.com/kyoiku/vol11/
タグ:
posted at 14:34:50
[at]threads を [at]syncと[at]spawnで書き直したら無事通った! これだからWindowsは(略 pic.twitter.com/k4ZmuOORwA
タグ:
posted at 14:39:32
>算数は、図形の面積や体積の意味や求め方を学ぶ教科です。
日常生活に不可欠な計算力が重視される
マイナスは日常で見ないが、体積の意味が日常に不可欠とは、俺の知ってる「日常」とは随分異なる世界線やな…w
タグ:
posted at 14:40:01
>算数の勉強は、計算することが主な内容となっているため、テストの間違いの多くは計算ミスがほとんど。 計算ミスによる不正解を無くすには、「見直し」をすることが重要です。
コレで最後です。本当にありがとうございました!!!!
(「算数 数学 違い」で1番上に出てくるSEO対策あっぱれ!(諦観
タグ:
posted at 14:42:12
啓林館の小2の教科書の問題
指導書に書いてある解答は
長方形…あ
正方形…え、か twitter.com/a_saitoh/statu... pic.twitter.com/9xrHtqMyZF
タグ:
posted at 14:48:37
「算数と数学は違う」論者って、
まず科目の名称が異なっていることから「違う」という結論があって、
その後、小学校での算数と中学以降の数学で異なる点を探し出して、(あるいは現実を見ないで妄想での異なる点を創作し)、
「こういう理由から異なる」
と言っているだけなんだよね。
タグ:
posted at 16:27:20
息子が算数のテストで5cm4mm+2cm8mmを
「54㎜+28mm = 82mm = 8cm2mm」
と計算した
先生にそのやり方は”正しいやり方”ではない
と注意されたようだ
算数における”正しいやり方”か
やりやすさ、覚えやすさは子供にとり様々
”正しいやり方”というのが日本らしい
タグ:
posted at 16:28:10
中学数学と高校数学だって異なる点があるだろう。共通点もある。
中学1年での数学と、2年での数学だって異なる。
カリキュラムが異なるのだから、そんなの当然。
小学校では帯分数を扱うが、中学以降ではあまり登場しない、とかいうのも、その是非はともかく、まあそうだろう。
タグ:
posted at 16:30:03
しかしそんなものをいくら積み上げたところで、算数と数学が本質的に異なる理由にはならない。
まして、「算数と数学は名称が異なるから異なるはず」として、テキトーな理由を持ち出して、「このように異なる」として、「だから、かけ算の順序などを数学から批判するのはおかしい」とかいうのはアホ
タグ:
posted at 16:31:23
www.eikoh-vis-a-vis.com/kyoiku/vol11/
>算数は日常生活で必要となる計算で正確な答えを出すことが目的です。しかし、数学では負の数(マイナス)や平方根(ルート)など、日常生活では目にしない抽象的なものを使って「なぜそうなるのか」を理解し、表わすことが求められます。
タグ:
posted at 16:32:57
www.eikoh-vis-a-vis.com/kyoiku/vol11/
>数学は、その数がどのような意味を持っているのか、世の中の現象について数を使ってどう表わすのかを学ぶ教科です。なぜそうなるのかという答えを導くまでの過程が重視されるため、"論理の正確性"が求められる教科ともいえます。
タグ:
posted at 16:35:38
横浜市教委の馬鹿指導主事は
「数学は答えが出ればそれでいいのだろうが、算数は考え方・答えを出すプロセスが大切だから、教えた公式と異なる解き方をしたら減点もあり得る」
と、全く逆のことを言っていたよ。
つまり各自が思い付きで言うから、相矛盾することになる。
タグ:
posted at 16:37:26
#統計 以下のリンク先の解説は私が言っているのとほぼ同じことをより詳しく解説してくれています。
towardsdatascience.com/6-reasons-why-...
タグ: 統計
posted at 16:39:11
@sekibunnteisuu 「もっとれんしゅう」というページは答えがついています。解釈は変わっていません pic.twitter.com/fz47wp48KP
タグ:
posted at 16:42:51
#統計 余談:私は、 #Julia言語 のPlots.jlで連続分布の巨大なサンプルのヒストグラムをプロットするときには、stephistをよく使っています。
kernel density estimationの代替物扱いでかつ、複数のグラフを重ねても見難くなり難いので結構便利。
MCMCの結果をstephistでプロットした例
↓ pic.twitter.com/rlxkCxOPxZ
posted at 16:46:11
ところでなぜ彼らは「算数と数学は異なる」という主張をするのか?
マウント取るのもその一つだろうな。
例えばこれとか
www.kobetsu.co.jp/manabi-vitamin...
タグ:
posted at 16:53:41
#統計
総務省統計局が小学6年生に向けて、
悪名高い3次元円グラフ
を勧めており、しかも
ドーナツ型円グラフ
になっている。
小学生に教えて良いレベルの統計学的教養がないことが、私には明瞭に見えました。日本の将来大丈夫か? twitter.com/genkuroki/stat...
タグ: 統計
posted at 16:55:14
#超算数
啓林館教科書、正方形は長方形にあらず
著者に数学者の根上生也氏(横国大)
清水静海氏の名前も
根上生也氏は、かけ算の順序推進の桜井進氏
@sakurai_susumu と共著を出している。 twitter.com/yougakuszk/sta... pic.twitter.com/CxaQn56YTI
タグ: 超算数
posted at 16:58:25
@hirokijjd169169 mmに単位を合わせて計算する方法は教えてないから正しくないそうです
cmはcm
mmはmm
で計算しないと正しくないそうです笑
この場合5cm+2cm=7cm
4mm+8mm=12mm=1cm2mm
7cm+1cm2mm=8cm2mm
と計算するのが正しいと言われたそうです
タグ:
posted at 17:02:08
@banyanyanmi その解説は私が求めるものではないです。
むしろ誤用を誘導しかねない安易な解説になっていると思いました。
「Scottの公式」の類を紹介する場合には、正規分布からかけ離れた場合にそれではうまく行かない場合があることを具体例で示すべきだと思います。
タグ:
posted at 17:07:54
#統計 分岐
❌自動的にビンを決めてうまく行くよ
のような印象を与えるヒストグラムの解説はどれも有害だと思います。
⭕️ヒストグラムのビンの設定については常に通用する普遍的な方法はないので、別のプロットと併用して誤誘導しないように気をつけよ
という結論を目指さないとアウトです。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 17:12:42
jyuku-online.com/blog/bs-suugak...
>小学生の算数では具体的な数だけの計算式を取り扱っていましたが、中学生の数学では文字を含む文字式を使うようになります。
算数でも虫食い算は扱う。さらに最近は文字式も扱う。
タグ:
posted at 17:15:51
>つまり、算数は、実用的な計算力を養う教科ということです。
>図形の面積や体積の求め方・四則演算など、計算力が重視されています。
日常生活で面積や体積計算することって、そうそうある?
タグ:
posted at 17:17:22
poruka01.com/arithmetic-mat...
>算数の「=」は「ならば」という意味を持つ
>数学の「=」は「イコール」という意味を持つ
この手の独自解釈もありがち
タグ:
posted at 17:19:12
www.manavi.zoshindo.co.jp/sakoda-sensei-...
算数 … 日常生活で必要とされる知識・技術
数学 … 言葉として必要となる知識・技術
「数学はコトバである」
タグ:
posted at 17:21:11
釧路市立清陵中学校
www.kushiro.ed.jp/seiryo-j/htdoc...
これ書いた人が、算数を暗記という間違った方法で勉強してきただけだろうが。
暗記で何とかなってしまうという点では、中学数学も同じ(テスト範囲が限定されているので、不幸にもそれで得点できてしまう) pic.twitter.com/oY21qVxnNE
タグ:
posted at 17:27:02
@banyanyanmi ググったときに、いつも「これはひどい!」と思っていることの1つが、その「スタージェスの公式」の安易な解説がものすごくたくさんヒットすることです。
ヒストグラムを適切に使いたいなら、毎回、誤誘導にならない適切なビンの設定を試行錯誤で行うべきだと思います。
タグ:
posted at 17:28:18
算数で扱う事項で、数学に含まれないモノを1つでも出してほしい。
以前「九九は数学ではない」とかいう謎主張をされたが、こういう出鱈目な主張しかできんのかい。栄光ゼミナールの記事も意味不明だし。
タグ:
posted at 17:46:57
#数楽 「affine Lie代数」のような高尚な話題ではなく初等的な(小学生でも理解可能な)ディンキン図形のフォールディングの話は、フリーズパターンで得られます。
私による解説
↓
genkuroki.github.io/documents/2012...
これ、非常に易しい解説になっていると思います。クラスター代数入門にもなっている。 twitter.com/adhara_mathphy... pic.twitter.com/K7fGt6pG3E
タグ: 数楽
posted at 17:57:41
今回、「算数と数学は違う」論(論と言うか詭弁)が話題になった発端て、定規云々だっけ?
算数は実用性がドータラ、いうなら、筆算やるのにいちいち定規使うなんて実用性がないよね。
日常生活でいうなら、計算機があるんだから、筆算も不要だよね。
ご都合主義なんだよね。
タグ:
posted at 19:07:52
「算数」と「数学」は違うっていうのは、こういうことだよね。
小学校1年生が習うのは「さんすう」であり、2年生以降にならう「算数」とは違うもの。
www.tokyo-shoseki.co.jp/textbook/e/4/
タグ:
posted at 19:24:06
Juliaのパッケージ開発を始めます。高頻度金融の分析パッケージがないようなので、一日一関数ずつ開発します。github.com/ys-fr/marketmi...
#JuliaLang
タグ: JuliaLang
posted at 19:43:22
Over the course of 3 days scientists pumped 10 tons of cement into an abandoned ant hill. After weeks of digging, the colony’s intricate & impressive structure is revealed. This one
[full video, from "Ants! Natures Secret Power": buff.ly/2ICATyB]
pic.twitter.com/G71KrCYafP
タグ:
posted at 19:44:49
というより,基本的にダメだ,と教えられたほうが,飲み込みやすいと思う。正規分布でないから,ノンパラメトリックなU検定というのが定番になっている。学術誌の査読でも,そういう指摘が結構ある。 twitter.com/genkuroki/stat...
タグ:
posted at 20:00:46
「算数 学習指導要領」とでもして、検索で見つかったものを喜んで出したんだろうな。
その後、「算数的活動」すべてが「数学的活動」に改定されたのに。
こういうおかしな誤解をする人を防ぐために。 twitter.com/cikuwabusan/st...
タグ:
posted at 20:25:03
@SSako86 #超算数
www.tokyo-shoseki.co.jp/textbook/e/4/4...
なるほど、「さんすう」と「算数」は違うんですね。 pic.twitter.com/VMF9tqCXPB
タグ: 超算数
posted at 20:25:44
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
#統計 a,bが正の整数の場合のベータ分布Beta(a,b)は、0から1の間のa+b-1個の一様乱数の中のa番目に小さな値の分布になっている。
そのことから、ベータ函数の値の逆数1/B(a,b)はa+b-1個のa-1個、1個、b-1個への分割の仕方の個数(a+b-1)/((a-1)!1!(b-1)!)に等しい、という解釈が自然だと分かります。 twitter.com/akku000518/sta...
タグ: 統計
posted at 21:19:36
#超算数
積分定数さんの造語「問題な問題」というやつでしょう。
これが事実だったとしても全く驚かない。
youtube.com/shorts/-gqgGR8...
タグ: 超算数
posted at 21:58:46
「Juliaで精度保証付き数値計算」更新しました。
部分固有対の精度保証付き数値計算
taklab-blog.blogspot.com/2021/01/rigoro...
一般化固有値問題の部分固有値と付随する固有ベクトルを精度保証付き数値計算するときの方法で、力学系の平衡解における安定・不安定多様体などを計算するときに必要になります。
タグ:
posted at 23:03:37
@yoshiokatsuneo 【A/Bテスト(比率の差の検定)では、p値がA/Bの差だけでなく個々のCVRにも依存するので、いずれかを固定する必要はありそうには思いました。】
「個々のCVR」の意味が、「個々のCVRの真の値」(←これは未知)なのか、「データから計算された個々のCVRの推定値」なのかで、全然話が違って来ます。
タグ:
posted at 23:08:45
@yoshiokatsuneo あと「対立仮説」という用語の使い方もおかしいと思います。
P値の計算では対立仮説は一切使用しません。
今後は対立仮説という用語を使わずに説明した方がわかりやすくなると思います。別に専門用語を使う必要はないです。
専門用語抜きで正確に説明すれば良い。
タグ:
posted at 23:11:22
@yoshiokatsuneo しかし、指摘していることは鋭いと思いました。
所謂 nuisance parameter の問題について述べているのだと思います。
2つに比率パラメータp, qの差p-qを決めても、自由に動けるパラメータ(例えばq)が1個残るので、P値を適切に定義するためにはqのパラメータ値を使わずに済む方法を探す必要がある。
タグ:
posted at 23:14:08
@yoshiokatsuneo #統計 そのようにして残ったおじゃまなパラメータ q をnuisance parameterと呼び、P値の適切な定義ではnuisance parameterの問題への対処が非常に重要になります。
ご指摘の通りなんらかの近似を使ったりすることになります。
(Fisher検定では条件付き確率分布に移ってnuisance parameterを消す)
タグ: 統計
posted at 23:17:06
@yoshiokatsuneo #統計 p-qのP値のWald法による安易な定義では、データ
a b
c d
から得られるm=a+b, p̂=a/m, n=c+d, q̂=c/n について、p̂-q̂の分布を平均p-q、分散p̂(1-p̂)/m+q̂(1-q̂)/nで粗く近似することによって行います。(この話に「対立仮説」は無関係)
これでWald法のP値と信頼区間の両方が定義されます。
タグ: 統計
posted at 23:21:09
@yoshiokatsuneo #統計 1つ上のツイートの方法を使えば、p̂-q̂の分布がp-qとデータの数値のみで得られる(qにはよらない)分布で近似され、nuisance parameter q を排除できるわけです。
ただし、そのように定義されたP値はχ²検定のP値とは違うものになり、prop.testで表示される信頼区間と整合的になります。
タグ: 統計
posted at 23:24:22
@yoshiokatsuneo #統計 しかし、この素朴なWald法で使っている近似はかなり粗いです。よりマシな方法はZou-Donnerの方法です。
FisherのZ変換 = arc tanh 変換した後に正規分布近似を適用した方がよりよくp-qの区間推定をできます。 pic.twitter.com/T3Z6Lj9Pdg
タグ: 統計
posted at 23:27:57
@yoshiokatsuneo #統計 あと、大事なことなので繰り返しますが、比率の違いを測る適切な指標が
比率の差p-q
とは限りません。他にも
比率の比p/q
オッズ比 (p/(1-p))/(q/(1-q))
も非常によく使われています。疫学の教科書に解説があり、Rの疫学関係のパッケージで計算できます。
タグ: 統計
posted at 23:30:41
#統計 まず、大昔から指摘されている不等分散の場合にWilcoxon-Mann-Whitney検定で無用に有意差が出易くなることの数値例を示しましょう。
Brunner-Munzel検定ならこういう場合も大丈夫です。
github.com/genkuroki/publ... pic.twitter.com/faJDw0fApb
タグ: 統計
posted at 23:38:07
#統計 次に2つの母集団分布の分散が等しくても不当に有意差が出易くなっているように見える(2つの分布に優劣は付けられないのに、サンプルからは有意差が出易くなる)例を示しましょう。
github.com/genkuroki/publ... pic.twitter.com/zoF3NfjyTd
タグ: 統計
posted at 23:39:53
@kamokita1 Wilcoxon-Mann-Whitney検定の脆弱さは昔から指摘されていて、WMW検定の代替案が複数提案されているようです。
私が試した範囲内ではBrunner-Munzel検定が非常に頑健で良いという印象を持っています。
Welchのt検定とBrunnet-Munzel検定の2つは頑健で使い易いと思います。
タグ:
posted at 23:46:39
@kamokita1 Studentのt検定は、等母分散の場合だけではなく、等サンプルサイズ(2つの群の標本サイズが等しい(もしくはほぼ等しい))場合には使える。
Welchのt検定もStudentのt検定も、母集団分布が正規分布でなくても、標本平均に中心極限定理が十分効いていれば使えます。
個人的にWMW検定は怖くて使えない。
タグ:
posted at 23:50:09
@kamokita1 #統計 私以外に誰も言っていないように見えることですが、ある特定の方法(MWM検定の場合と同様の方法)でBrunner-Munzel検定の信頼区間を定義してやると、正規母集団では、Welchのt検定に付随する信頼区間と互いに近似し合うことを数値的に確認できます。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 23:54:13
Mathematical Programming with Julia: Mathematical Programming with Julia is a new book by Richard Lusby and Thomas Stidsen. It features an open source approach to linear and mixed-integer programming. Click here for more www.man.dtu.dk/MathProgrammin...
#julialang #programming #opensource pic.twitter.com/M5MplLoYQz
タグ: julialang opensource programming
posted at 23:56:04
#統計Welchのt検定+信頼区間のユーザーが、Brunner-Munzel検定を使うときにどのように信頼区間を定義したら良さそうかについては、以下のリンク先からリンクをたどれば書いてあります。
ただし、対応しているRのパッケージはないと思います。 twitter.com/genkuroki/stat...
タグ: 統計Welchのt検定
posted at 23:56:08