黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2019年11月23日(土)
#統計 文献紹介
www.jstage.jst.go.jp/article/sugaku...
統計学とグレブナー基底
青木 敏, 竹村 彰通
2007
独立性検定で使うχ²統計量の値が大きすぎるかどうかの評価が【周辺頻度を共有する分割表の集合の中での相対的な比較である】としている。
これは誤り。
例えば2×2で超幾何分布にこだわるのはダメ。 pic.twitter.com/ftpcVRSTMb
タグ: 統計
posted at 23:29:38
局メイクもあるよ、と連絡があったのですが普段の調子でメイクをさぼりました。髪の毛の後ろの方だけ直されたんですが、メイク用品をバッグに入れて歩き回るプロの人が居て、あっこれテレビドラマで見た、と思ったのだけど、そもそも自分のいる場所が今日はテレビ局のスタジオだったw
タグ:
posted at 22:56:03
国語の記述問題のみを中止するとの見通しがあるようだが,数学も必ず中止させなければいけない。
数学の採点者の方が質の低さは酷い。たいていの採点者は用意された正答例以外は不正解と扱ってしまう。しかも,事後の検証が難しく,足切りも合否判定にも必ず使われてしまう。被害は甚大である。
タグ:
posted at 22:55:27
非公開
タグ:
posted at xx:xx:xx
「主観」「事前分布」という用語を使っていたので、資料としてスクショを記録しておく。
ベイズ統計について表層的な理解しかしてなさそうだし、機械学習一般についても全然わかってなさそう。 pic.twitter.com/m15MQsMhGC
タグ:
posted at 22:44:01
#統計 #Julia言語 おまけ
nbviewer.jupyter.org/gist/genkuroki...
漸近論が使えない(と思われる)期待値が
2 2k
3 3k
型の期待値を持つ分布でサンプルを生成した場合。
やはり、独立性に関するG検定=対数尤度比検定が上の方にオーバーシュートしている。
χ²検定はこの場合にも結構安定している。 pic.twitter.com/3dv1dIEEib
posted at 21:48:16
@mellowhound @pss_bell @oznokakashi @satsuki_yama @genkuroki @akinashi3762 @663eggeater @46167703 @ophiacodon @zacco71163881 @ripplemirror @ukai_23ku @Chief_Editor7 @clashofclans_J あなたのツイートをトゥギャりました。読んでいただけると幸いです。 togetter.com/li/1434120
タグ:
posted at 21:44:26
#統計 #Julia言語
nbviewer.jupyter.org/gist/genkuroki...
χ²検定とG検定とFisher検定の比較
第一種の過誤が起こる確率は名目有意水準αに近い方がよい。そして、上の方に大きくオーバーシュートするのはまずい。
G検定は見事に上の方に大きくオーバーシュートしており、サンプルサイズ→大での収束も遅い。 pic.twitter.com/iu37QAnHEE
posted at 21:43:40
えー、あの位置のライトにそんな技が仕込まれてるのw何か今回は初めてだったので、番組作ってる側のバックヤードの方が興味深かったりで…… twitter.com/kasa_ga_nai/st...
タグ:
posted at 21:35:53
テレビ番組、特にバラエティ的なものを見なくなって久しいので、進行がわからなくて戸惑った。ここからここまで何分、というのが事前の台本を見ただけでは頭に入ってこない。CMの時に、次は何分ですかときいたりしていた。8分、と言われたので、ああウチのコースの卒研発表1人分の時間かとw
タグ:
posted at 21:32:24
役職はわからないのだけど、カメラの後ろの方に何人もスタッフの方が立っていて、生放送作るって大変なのだなあと思いながら見ていた。それでも局が小さいので最低限の人数で回していて、大手の局ならもっと大勢いるだろうということだった。
タグ:
posted at 21:30:21
放送している内容は、床近くで全員から見える位置にモニターがあって、確認できるようになっている。カメラはやや高い位置から見下ろす感じなのでモニターがあるのは多分わからない。CMのたびにストローつけた水が配られ、終わる直前に回収される。放映内容以外のところでも手間がかかってる。
タグ:
posted at 21:27:58
スタジオの机が明るかった。カメラからは見えない部分、パネルとかを立てる下の机のへりのところに、小さなLEDみたいなライトがずらっとはめ込んであって、下から顔を照らすようになっていた。上からの照明で顔に影ができないように工夫されていた。
タグ:
posted at 21:25:30
控え室は大きな部屋をパーティションで仕切ってあるだけで、天井部分は空いてるから、隣の打ち合わせの声が聞こえる。多分隣が木村先生で、エントロピーの話とか磁場って、とか聞こえてたので、説明したいけど割り込みもできんしなあと思いながら資料見てたら、本番で突っ込みが炸裂したw
タグ:
posted at 21:23:46
早めにスタジオ近くまで行って喫茶店で時間つぶそうと思っていたら、東京駅の地下で小波さんとばったり会ったので、じゃあ一緒に行きましょうか、で、移動開始。喫茶店で時間つぶして待ち合わせ場所に。休日なので正面入り口が閉まってて、裏口を探して迷う。
タグ:
posted at 21:22:05
それにしても今日は、11時ごろの新幹線で出ようと思ったら、山形新幹線が人身事故で止まってて狙ってた新幹線が運休になってた。その次は切符売ってたけど、時間通りに動く保証もなさそうだったので、数分後に出る仙山線に飛び乗り、仙台経由で東京入り。
タグ:
posted at 21:20:20
いやもうネットとうほく検討委員としてコメントぜったいすべきな世論調査のテーマでした……お近くの消費生活センターを頼って下さい。もし問題が解決しちゃっても、問題あると思ったら連絡いれてください。みなさんの相談が、問題提起が、申し入れを後押しする場合があるのです。
タグ:
posted at 21:14:55
@Chief_Editor7 テレビで情報を得る層と、マンションの管理組合や理事会をやっている比較的年輩の層はわりと重なっているだろうと思うので、要注意情報をそこに届けることができれば、と思っています。
タグ:
posted at 21:10:40
ありがとうございます。返品につながる効果判定は1年後の1回のみ、改善の数値目標なしで画像の読み方がすこしずれれば変わる程度の改善でも改善したと言い張れる契約書になっているので、買った人にとって不利な内容です。10年後に劇的な効果というのなら、10年後検査で返品返金可能にすべき。 twitter.com/PlanetaryNatuk...
タグ:
posted at 21:07:53
20年も販売していて、社長自らがTVに出て、ここぞとばかりに取り出した情報がこのレベル
つまり「これ以上マトモな根拠が出てこない」と思われても仕方ないのでは?
タグ:
posted at 21:02:00
特任准教授氏の「教員として」問題なのは、「中国人のパフォーマンスが低い」という断言。会社での雇用ポリシーは大学の管轄外だろうが、このような教員を中国人学生が甘受しなければならないのは酷い話だとおもう。講義聞くのも嫌だろう。
タグ:
posted at 20:34:24
Julia言語 : 若者の比率が高い!
{黄:10代,緑:20代,青:30代,赤:40歳以上}
#Julia言語 twitter.com/ayatokura/stat...
タグ: Julia言語
posted at 20:12:05
#統計 分岐のリンク
2×2の分割表の独立性に関する検定の方法を計算して比較してみたら、G検定(対数尤度比検定)の小サンプルでの挙動の印象が最悪だったという話。
G検定(対数尤度比検定)をどこの誰が積極的に他人に勧めているかについては、統計学はど素人なのであまり把握できていません。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 20:11:48
@tbs_i #統計 2×2の分割表の独立性についてG検定(対数尤度比検定)は小サンプルで使わない方がよいことの根拠となる計算結果のプロットは以下のリンク先にあります。第一種の過誤が起こる確率を正確に計算したものです。上にオーバーシュートしまくっているのがG検定。
比較した検定法の中ではG検定が最悪。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 20:04:24
ごまふあざらし(GomahuAzaras @MathSorcerer
Jeffさんからいただいた情報
github.com/KristofferC/Pa...
タグ:
posted at 19:59:10
本日放送した
#田村淳の訊きたい放題!
賛否両論!
科学?疑似科学?
問題を考える
11月26日(火)20時〜
TOKYOMXにて再放送致します
是非ご覧ください📺
過去の放送で使用した
資料パネルはこちら
▽
s.mxtv.jp/variety/kikitai/
#田村淳の訊きたい放題 !
#キキタイパネル
#キキタイ pic.twitter.com/sscXZkTqPq
タグ: キキタイ キキタイパネル 田村淳の訊きたい放題
posted at 19:24:47
この記事は「マンション管理新聞」のもの
専門家がたくさんいるでしょうに、なぜこの装置を何度も紹介するのか不思議ですね
せめて「取材記事」と「広告記事」の区別はつけてほしい
www.mansionkanri-shimbun.co.jp/top.html
タグ:
posted at 19:05:52
TVで社長が振りかざしていた記事がこちら
10年後の抜管検査で防錆効果が一目瞭然という主張ですが、10年後とされる写真もサビで真っ赤ですよね
#キキタイ pic.twitter.com/1IQ5g1pY7X
タグ: キキタイ
posted at 18:59:38
なんか拡散している。これはMITのグループが作っているmusic21というライブラリです。web.mit.edu/music21/ 楽譜の描画自体はpythonではなくMuseScoreやlilypondなどの外部ツールに投げている。他にもいろいろできるらしいが私はまだ把握してません
タグ:
posted at 18:31:26
科学の概念が飛び交っていたが基本は消費者問題。10年(という期間は天羽さんも言っていた)程度気軽に水道管の状況を確認できるように工事すべきだし、そうなっていなくても10年で効果が確認できなければ返金可能な契約で販売しないとおかしいでしょう。
タグ:
posted at 18:06:12
#田村淳の訊きたい放題 まとめ
NMRパイプテクター「なぜかはわかんないけど、なんか電磁波?が出るっぽいので売ってます」
NMRパイプテクター「動作してない証拠を出されても、私はそんな例把握してないので嘘です」
NMRパイプテクター「10年経って効果が分かるけど、返金保証は1年です」#キキタイ
タグ: 田村淳の訊きたい放題
posted at 18:03:38
#キキタイ エムキャスでみた。
mcas.jp/sp.html
iPadにアプリを入れて。
天羽さんの言う通りで、10年後に調べて効果が無ければ全額+αを返金するという契約にして欲しい。
その辺を誤魔化そうとしている様子の放送は「インチキ商売をやっている」という印象を強めたと思う。
タグ: キキタイ
posted at 18:02:32
「書いてある原理ではこのような現象は起こらない」という節の説明に「でも実際にパイプは長持ちしてるのだから原理が正しくなくても学者が正しい理屈を見つけてくれる」とか超理論。それは偽装表示では…。
タグ:
posted at 17:39:46
テレビでパイプテクターが擬似科学かという討論やってるけど、パイプテクター側がしどろもどろすぎて面白い…分解したらただのネオジム磁石が入ってた(製品仕様と違う)という話になった時に「それは本物ですか?」とか言い出したり逆に学者側に「これは偽者?」と問われると答えられなかったり。
タグ:
posted at 17:34:53
非公開
タグ:
posted at xx:xx:xx
この番組のような説明は、私なら避けるし、日本語を専門にする研究者や辞書関係者も、まあ避けると思います。ところが、番組では識者と称する人が出てきて、以上の説明をしていた。ご本人の反論をぜひ伺いたいところ。核心部分はご本人が説明していたので、編集で発言が歪曲されたとも思えません。
タグ:
posted at 16:32:06
以上をファクトチェックの用語に即してまとめると、(1)「どら猫は、のらりくらりから」との説明は「根拠不明、もしくは誤り」。(2)「どら猫は盗みをする猫」は、たしかに盗みをする猫を罵ることもあるけど、「ミスリード(誤解を招く)」。(3)「どら息子は銅鑼から」は「根拠不明」です。
タグ:
posted at 16:31:40
番組では「どら息子」は打楽器の「銅鑼」から、とも。たしかに語源説のひとつではあるのですが、客観的な検討に耐えないと思います。「どら息子」は「のら息子」(なまけ者で遊び好きの息子)とも言い、これこそ「のらりくらり」と同語源と考えられます。濁音減価で「どら息子」になったのです。 pic.twitter.com/grCcgDwCmA
タグ:
posted at 16:31:21
番組ではまた「のら猫」「どら猫」違いを「どら猫は盗みをする猫」と説明しましたが、不正確です。歴史的には「のら犬」を罵って言う「どら犬」もあります。「のら猫」「のく(退く)」を「どら猫」「どく」と濁音化すると、価値を低める効果があります。「のら猫」を罵って「どら猫」と言うのです。 pic.twitter.com/XDi5cJQfKK
タグ:
posted at 16:31:07
「わい」のルーツについてのテレビの説明が不適切という話のついでに、先月テレビで偶然に見た「どら猫」の語源について批判しておきます。「のら猫」は「のらりくらりしている猫」と説明していましたが、他の語や意味の変遷を考えると、普通に「野良」(=野)にいる猫だから「野良猫」でOKです。 pic.twitter.com/TvtaN3ant1
タグ:
posted at 16:30:51
話題の特任准教授、「最新科学技術」を棍棒として振り回すスタイルを気取ってるのだけど。その野蛮さは問題外として、発言の「科学技術」部分が隙だらけなので、迫力がイマイチで、道化にしか見えない。
タグ:
posted at 15:51:49
そうなると矢張り #tikz/#pgf なのやろか... #LuaLaTeX と #MetaPost な人としては惑うなぁ。まぁそれに #Asymptote も未だ見捨ててはいないのだけど... twitter.com/genkuroki/stat...
タグ: Asymptote LuaLaTeX MetaPost tikz
posted at 15:44:31
@eco_tetsu @enukasu バイナリファイルを貼り付けるのではなく、すべてをtexファイルだけで済ませることにもメリットがあります。
1枚のtexファイルに図も含めることができ、場合に寄っては図の部分に手で変更を加えることもできる。
タグ:
posted at 15:40:53
次に学びたいプログラミング言語ランキングは!(中間発売)
1位 Python
2位 Go
3位 Rust
#osc19tk #cybozu #プログラミング言語 pic.twitter.com/BtseDrA8fW
posted at 15:40:14
#統計 期待値が
1 2
2 4
の4つのポアソン分布のもとでは、
名目有意水準5%でのFisher's exact testで第一種の過誤が起こる確率は1%を切っており、名目有意水準1%では0.06%を切っている! pic.twitter.com/FkhIhzMgiX
タグ: 統計
posted at 15:36:02
#超算数 算数を公式暗記で乗り越えようと無駄で有害な努力への覗き窓twitter.com/search?q=(%E3%...。
(みはじ OR はじき) 公式
で検索。
タグ: 超算数
posted at 15:34:22
AI救国論の人、よほど本が売れないのか講座に寄付が集まらないのか炎上ネタを投げているけど、糞コンサルに騙されてるにしても炎上商法は「東大准教授」の肩書で集金するには逆効果だとしか思えないんだけどなぁ
タグ:
posted at 15:32:01
ついに切込隊長に補足される。もうオワタ。
「大澤昇平」なる超新星|山本一郎(やまもといちろう) #note note.mu/kirik/n/n66795...
タグ: note
posted at 15:18:07
OokuboTact 大久保中二病中年 @OokuboTact
#超算数
「正方形は長方形」ということを無視したテスト。
これも定番
pic.twitter.com/YRZDocOJnP
タグ: 超算数
posted at 15:10:31
#Julia言語 RでできるならばRCall.jl経由でJuliaからRを使えば……。
すでに使い慣れた道具があるなら、無理して使う必要はないと思いますが、Julia言語のPlots.jlのpgfplotsバックエンドを使えば一応pgfplotsのtexファイルで保存できます。
nbviewer.jupyter.org/gist/genkuroki...
twitter.com/enukasu/status... pic.twitter.com/QBBbZfoMWZ
タグ: Julia言語
posted at 14:59:35
やっちまったん😂
午前中からマイクラやると言いながら、今、起きましたぁ😭
ということで、午後3時よりマイクラマルチの海水をぶっこぬきます!
www.youtube.com/c/nonbeisamura...
お時間ある方は是非!
今日明日で、予定している海水をぶっこぬきまーす! pic.twitter.com/fagJIw4vzH
タグ:
posted at 14:41:45
須山敦志 Suyama Atsushi @sammy_suyama
AIに大量データを食わせればガシャガシャポンで人間が気付かない「真実」を出してくれるみたいに勘違いされがちですが,今人気のAI技術はむしろ因果関係を無視して相関だけ抽出するようなものばかりなので,人間以上に結果が差別的になりがちです.
タグ:
posted at 13:20:51
須山敦志 Suyama Atsushi @sammy_suyama
↓ふとこれを思い出しました.表現が難しいですが,観測データは「事実」であるかもしれないですが「真実」ではないです. twitter.com/sammy_suyama/s...
タグ:
posted at 13:10:59
私は、件の人が、ベイズ 統計を主観確率で説明することがどうしてダメなのかについては素で何もわかっていないように見えることが気になっています。機械学習をかじっていれば当然知っていなければいけない事柄だと思います。
タグ:
posted at 12:36:22
#統計
2×2の分割表の独立性検定について、
「小サンプルへのχ²検定の単純適用は誤用である」
というようなことを安易に言うことは慎むべきだと思う。
「独立性χ²検定警察」については「警察の側に問題がある」と私は思っています。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 11:43:36
#統計 ググっても、Fisher's exact testのP値がx以下になる確率がxよりひどく小さくなる理由の動画による説明を見つけることができませんでした。見つからないので自分でやってみました。
使用した #Julia言語 でのソースコードは
nbviewer.jupyter.org/gist/genkuroki...
で全公開されている。
posted at 11:33:23
#統計 収束先のポアソン分布×4でのFisher's exact testのP値がx以下になる確率(第一種の過誤が起こる確率)のプロット。
このようなグラフがプロットされる状況では検出力は過剰に低くなります。Fisher's exact testを小サンプルに適用するとこういうことになる。 pic.twitter.com/6GWR5YaM0f
タグ: 統計
posted at 11:20:56
#統計 サンプルの取得に困難が伴う場合には前もってサンプルサイズを固定できなくなる。そのような場合には「ポアソン分布×4」モデルも考慮するべき。
添付動画は多項分布のNを動かして足し上げてポアソン分布×4の場合に収束する様子。
45度線より下のものを足し上げても45度線には近付かない。 pic.twitter.com/RJZagoG5j4
タグ: 統計
posted at 11:17:27
#統計 収束先は、全合計のみがa+b+c+d=9と固定された多項分布(4項分布)の場合です。
Fisher's exact testのP値がx以下になる確率は、特に小サンプルでは、xよりひどく小さくなります。
この場合には名目の有意水準を5%に設定しても、Fisher's exact testで第一種の過誤が起こる確率は2%まで下がる。 pic.twitter.com/Aixud6BmUI
タグ: 統計
posted at 11:13:36
#統計 横に合計の固定も外すためには、二項分布×2の場合の計算結果を横の合計を動かす荷重平均として足し上げればよい。 pic.twitter.com/ZpsXw5frlk
タグ: 統計
posted at 11:13:33
#統計 横の合計のみがa+b=3,c+d=6と固定されたa,c側が起こる確率が1/3の二項分布×2におけるFisher's exact testのP値がx以下になる確率は、超幾何分布の場合の荷重平均によって、添付画像のようになります。
右半分は仮説検定で特に重要なxが10%以下での様子です。45度線よりひどく下に位置している。 pic.twitter.com/QPaYirjquR
タグ: 統計
posted at 11:07:00
#統計 添付動画は横の合計をa+b=3, c+d=6に固定するが、縦の合計を固定せずに動かして、超幾何分布の場合を適切に足し上げて、横の合計のみが固定されている場合にどのように収束するかの動画です。
45度線に下から接する函数達の荷重平均なので45度線より真に下になってしまう。 pic.twitter.com/JhE9QLw7XO
タグ: 統計
posted at 11:03:56
Kouji Ohnishi 大西浩次 @koujiohnishi
ヒルデガルトさん
私は11年間仙台に住んでいて、主に宮城県内の海岸線で星を見ていました。太平洋の波の音を聴きながら水平線から昇る星を見るのが楽しみでした。震災以降、何度か訪問しています。星空がみなさまの心に少しでも希望と安息を与えられることがあれば、私もたいへん嬉しいです。 twitter.com/R_Lingua0lgnot...
タグ:
posted at 10:57:41
#統計 まず、Fisher's exact testが確率の正確な計算になっている超幾何分布の場合。確率の正確な計算になっているので、P値がx以下になる確率は45度線に下から接するグラフになります。
添付画像2は固定される縦横の合計を変えた場合のプロット。どの場合でも45度線に下から接する。 pic.twitter.com/3jbbYKPpqT
タグ: 統計
posted at 10:54:49
#統計 添付動画の収束先はポアソン分布×4の場合の分布。
超小サンプルで我慢しなければいけない状況では、サンプルのサイズを前もって固定できないケースが多いと思われるので、ポアソン分布×4モデルは特に重要。
この場合には(N-1)/N倍補正をしてもχ²検定のP値がx以下になる確率はxに近付かない。 pic.twitter.com/5c5Ms5zjQu
タグ: 統計
posted at 10:48:08
#統計 #Julia言語
nbviewer.jupyter.org/gist/genkuroki...
超幾何分布から積Poisson分布における統計量の分布の変化(足し上げ)の様子のノートブックに
* (N-1)/N倍補正付きのピアソンのχ²統計量
* Fisher's exact test
の動画作成を追加した。添付画像は(N-1)/N倍補正χ²検定のP値がx以下になる確率。 pic.twitter.com/15YvAECtH4
posted at 10:48:05
Yoshiki NAGATANI @nagataniyoshiki
なるほど,.show() は xml を出力して OS の関連付けで開くのか。ちょっと一手間いるなぁ。(ちなみに show('midi') も同じように .mid ファイルが関連付けで開かれる仕様だった。)
タグ:
posted at 10:08:35
Yoshiki NAGATANI @nagataniyoshiki
こんなライブラリもあるのか! この例みたいに何も指定しなければ少々不思議な書き方になるみたいやけど、.show だけでこれが書けるならよいなぁ。
そして、もちろん細かい指定もできるみたい。バッハのコラール達がサンプルに入ってるらしいのも良い!
web.mit.edu/music21/doc/ab... twitter.com/ktrmnm/status/...
タグ:
posted at 09:46:22
#統計 #Julia言語
nbviewer.jupyter.org/gist/genkuroki...
では、各種検定法を期待値のオッズ比が1でない場合に拡張しています。Fisher's exact testの拡張ではFisherの非心超幾何分布を使うことになりました。
添付画像の表上段のFisher's exact testは私による実装。Rのexact2x2::fisher.exactと一致。 pic.twitter.com/V2zhCWLcCJ
posted at 09:35:57
#統計 Fisherの非心超幾何分布は、「期待値のオッズ比=1」という独立性の帰無仮説のFisher's exact testを「期待値のオッズ比=ω」の場合に拡張するときに必要になります。
その拡張はFisher's exact testに自然に対応するオッズ比の信頼区間を求めるために必要になります。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 08:55:07
防弾仕様の車 窓ガラスに鉄球投げたら…割れた テスラ株価下落 #nhk_news www3.nhk.or.jp/news/html/2019...
タグ: nhk_news
posted at 06:57:03
某大「最年少准教授」を名乗って差別発言などをしているという人の現職を調べると、寄付講座の特任准教授とのことらしい。産業が大学に密接に関わるようになればなるほどこの手の人士は増えるのであり、68年のテーマが「産学共同」であった意味も明らかになろう。この機会に過去ツイートも掲げておく。 twitter.com/hhasegawa/stat...
タグ:
posted at 06:01:11
#統計 期待値が
1 2
2 4
の場合のPearsonのχ²統計量を使ったχ²検定におけるP値がx以下になる確率のプロット。 pic.twitter.com/Z8GjF9WwDD
タグ: 統計
posted at 03:50:27
#統計 さらに、
多項分布→足し上げ→4つのPoisson分布の直積
の様子をアニメ化すると添付動画のようになります。足し上げる多項分布が増えると精度が上がる。最終コマは4つのPoisson分布の直積における分布に(ほぼ)一致しています。 pic.twitter.com/GuLnctYNuN
タグ: 統計
posted at 03:25:23
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
#統計 1つ前のツイートの添付動画の最後のコマは2つの二項分布の直積におけるPearsonのχ²統計量の分布に一致します。
このツイートの添付動画は同様のアニメ化を
2つの二項分布の直積→足し上げ→多項分布
で行ったものです。やはり、足し上げる2つの二項分布の直積が増えると精度が上がる。 pic.twitter.com/fxzVDeqQt9
タグ: 統計
posted at 03:23:13
#統計 2つの二項分布の直積におけるPearsonのχ²統計量の分布を、縦方向の合計の値ごとに決まる超幾何分布に分解し、その平均で計算することができます。添付画像はその過程をアニメ化したものです。足し上げる超幾何分布の個数が増えると近似の精度が上がって行くことがよく分かります。 pic.twitter.com/y6fc6ROzaR
タグ: 統計
posted at 03:20:36
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
#統計 各セルの期待値が 1,2,2,4 の独立なポアソン分布に従う場合には添付画像のようになります。これと超幾何分布の場合を比較すると天と地くらい近似の誤差の大きさが違うことがわかります。
各セルの期待値が1,2,2,4の場合なので、超小サンプルの場合であることにも注意して下さい。 pic.twitter.com/Zr8EvLzOck
タグ: 統計
posted at 03:14:18
#統計 分割表による分析が行われる現実のサンプルでは、超幾何分布のように縦横の合計が固定されている場合はないと言って問題ありません。
縦横の合計も確率的に揺らぐ。そのような場合には生じる分割表の種類が増えて、χ²分布による近似の誤差がずっと小さくなります。添付画像を見て下さい。 pic.twitter.com/E9X0tt2mdx
タグ: 統計
posted at 03:12:18
#統計 超幾何分布では、分割表
a b
c d
の縦横の合計 a+b, c+d, a+c, b+d をすべて固定されます。例えばHypergeometric(1,2,2,4)分布で生じる分割表は
0 3
3 3
1 2
2 4
2 1
1 5
3 0
0 6
の4種類しかありません。このような状況では連続的な分布である自由度1のχ²分布による近似の誤差は大きい。 pic.twitter.com/u6z7rpfZPc
タグ: 統計
posted at 03:06:29
#統計 #Julia言語
nbviewer.jupyter.org/gist/genkuroki...
超幾何分布から積Poisson分布におけるPearson's χ²統計量の分布の変化
2×2の分割表の期待値(1,2,2,4)の超幾何分布におけるピアソンのχ²統計量の分布は添付画像のようになり、近似の精度が極めて悪いように見える。しかし~続く
twitter.com/genkuroki/stat... pic.twitter.com/i13bXLWoyB
posted at 02:58:47
Masahiro Ono 小野 昌弘 @masahirono
モデルと事実の区別もつかず、公的な空間での民族差別を公言して憚らない、基本的な知識とモラルのないひとが、東大と人工知能の名の下にナチズムから殺人まで価値観を相対化した言論を展開している図はさすがに問題が大きい。このような未熟者がはばかると東大の凋落だけでなく社会に害悪。毫毛斧柯
タグ:
posted at 02:46:02