黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2019年11月21日(木)
Juliaのメモリプロファイリングは--track-allocationオプションを使って実行して,どの部分でメモリのアロケーションが起きてるのかを知るのが基本。
ただし関数のJITコンパイルコストも加算されちゃうので,Profile.clear_malloc_dataで実行語一度キャンセルするのを忘れず。
docs.julialang.org/en/v1/manual/p...
タグ:
posted at 00:39:42
Juliaの今のメモリプロファイラ若干使いづらいんだけど,新しい仕組みが開発中なので,これが入ると使いやすくなると思う。
github.com/JuliaLang/juli...
タグ:
posted at 00:47:31
三原氏といい村中璃子氏といいワクチン推進派はなんでこうケンカ腰の人が多いのだろうか、いらぬ争いを生むではないか、と思っていたのだが、反ワクチン派の個人攻撃の酷さを見るに至り、ああこれはこういう性格でないと務まらんわ、と考えを改めた。
www.buzzfeed.com/jp/naokoiwanag...
タグ:
posted at 01:23:09
確率解析の技法、再び改訂しました。@sasaburo さんとのディスカッションを踏まえ、定理3.2・ファインマンカッツの証明を修正、鏡像原理の加筆、その他軽微な記載修正を行いました。(注意:旧版のリンクと違います)
drive.google.com/file/d/1wPQ7qT...
タグ:
posted at 01:31:56
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
@jumping5555 私も当時、同じことを漏れ聞きました。国大協、全高長、私立中高連の会長を呼んだ勉強会だったと。それが事実なら下村氏はメディアに虚偽の説明をしたことになる。「100%ない」も嘘だったし、証拠が出てきたら今度こそ辞任てすね。
twitter.com/kitspeakee/sta...
タグ:
posted at 05:28:17
@jumping5555 これについてもまた、万一、岡入試委員長が下村氏をかばうような発言をするなら、実現不可能な制度の導入を強行しようとして土壇場で延期、受験生を極度に混乱させたことについて、下村氏や遠藤氏と国大協、東大は共犯。社会的な制裁を受けて当然と思います。
タグ:
posted at 05:35:53
@jumping5555 一方、宮本全高長会長(当時)はどの議事録を読んでも早くから地域・経済格差等の問題を高校(生)の立場から訴えておられる。万一4/13の会でも同様のことを述べられているなら、同じ場で席を連ねながら、強行のために「東大の指導」を文科省幹部に命じ国大協にもプレッシャーかけた下村氏の罪は尚更重い。
タグ:
posted at 05:47:48
資料:ミュートしていたのでクリックして読んだ。ミュートしておいて良かった。怖い。 twitter.com/genkuroki/stat... pic.twitter.com/nSoK8A0o5o
タグ:
posted at 06:14:51
#統計 ベイズ統計の主観確率の解釈では、事前分布は主観で決まるものであり、ベイズ統計では主観のもとでの主観的リスク最小化を扱うと考える。しかし、その主観によって、現実世界における予測が外れたり、現実と合わないモデルが構築されたりするリスクは考慮しない。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 06:32:34
マドモアゼル、という呼び方が行政の場で使えなくなった。性差別にあたると抗議されて。そうか、そうきたかと驚いたが、マダムとムッシュにあたる呼び方って日本だとなに? おばさん、おじさん?日仏のこの老若男女の呼び方の差にふかーく考えさせられた。
今日の日記です。
www.designstoriesinc.com/jinsei/dairy-3...
タグ:
posted at 06:48:40
#統計 統計学入門書によくある母平均の信頼区間を正規分布モデルを使って計算する方法がどれだけの場合に有効であるかは非自明な問題。
母集団分布が正規分布でなくても、正規分布に適切な意味で(その意味は非自明な)近ければ、正規分布モデルで計算した母平均の信頼区間も結構信頼できます。続く twitter.com/genkuroki/stat...
タグ: 統計
posted at 07:25:30
#統計 「Fisher検定とYates補正のコンピューターで計算したら誤差が非常に大きい。補正無しのχ²検定の方がまし」という批判に対するYatesさんの論文(1984)にある反論を読んだら、「χ²検定も縦横の合計を固定するconditional testである」という誤解に基いた議論が書いてあった。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 08:07:44
#統計 Fisher's exact testが特にその使用が推奨されている小サンプルで大きな誤差を持ち、補正無しのχ²検定は意外に頑健であったという計算結果は何十年も前から論文として出版されていて、Yatesさんは1984年に反論の論文を書いています。
その反論の論文は致命的な誤りを含むのですが~続く twitter.com/urotauyoshiuso...
タグ: 統計
posted at 08:12:47
#統計 しかもYatesさんの誤りは論文と同時に出版されたコメントでもしっかり指摘されていた。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 08:18:08
#統計 ところが、相当に痛い誤りを指摘しているコメントとともに出版されたYatesさんの1984年の論文は、2009年には "a long and detailed defense of the exact test" として引用されていたりする。
こういう感じになっているので、論文にするかどうかの問題では無くなっている様子がよくわかる。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 08:24:00
「○○派は××と言っていた」とツイートするときには,できれば「たとえばこの人が言っていた」と付け足してほしいし,欲を言えば出典/リンクをつけてほしい.flipoutcircuits.blogspot.com/2014/09/blog-p...
タグ:
posted at 08:37:09
#統計 実際の計算に基いたFisher's exact testと補正無しのχ²検定の比較をしている日本語の文献の例1 twitter.com/genkuroki/stat...
タグ: 統計
posted at 08:38:31
#統計 実際の計算に基いたFisher's exact testと補正無しのχ²検定の比較をしている日本語の文献の例2 twitter.com/genkuroki/stat...
タグ: 統計
posted at 08:40:10
松岡亮二・早稲田大准教授:問題の根本は、これまでの「教育改革」が、データの蓄積や分析なしに、「これからはグローバル時代だ」といった理念で進められてきたこと。← 同意! 「理念」というよりむしろ「妄想」と思うが。
www.asahi.com/articles/ASMC5...
タグ:
posted at 10:40:25
竹内洋・関西大学東京センター長:近代の日本には全国で優秀な人材を育成するという理念がありました。戦後も各都道府県に国立大学が置かれ、広く人材を育てる伝統は受け継がれました。しかし今はそれが崩れ、東京と地方では「身の丈」が違う社会になってしまいました。
タグ:
posted at 10:46:17
←東京都の生徒は都の受験料負担で英語民間試験を受け,高校入試へのスピーキングテスト導入も都の予算で。
www.tokyo-np.co.jp/article/nation...
大阪府立大と大阪市立大に入学する年収590万円未満の世帯の府内在住 学生・院生には入学金と授業料が免除される。
www.sankei.com/west/news/1911...
タグ:
posted at 10:54:17
Anyone have examples of mixing R/Python and Julia that they'd be willing to share? I'd love to see some examples of workflow.
タグ:
posted at 11:46:47
昔は貧乏な家の子の方が体力があるイメージがあったが / “世帯格差が子どもの体力低下にも繋がっている | ワールド | 最新記事 | ニューズウィーク日本版 オフィシャルサイト” htn.to/2R1YWtAsgT
タグ:
posted at 12:19:00
#統計 15個上のツイートから引用【例えば、母集団中の小部分集団が飛び離れて高い得点を得ている場合には、正規分布モデルによる平均得点の信頼区間は信頼できなくなる】
コンピューターによるそうなる場合の計算例が次のリンク先にある。小サンプルでは一部の例外を補足できていないかもしれない。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 12:40:54
Can I train an actual MNIST #fluxml model in #julialang and then run it on encrypted images using #homomorphicencryption? Why yes, yes I can! Fairly efficient too - less than a minute for a batch of 64 and lots of known optimizations left on the table. Blog post coming up! pic.twitter.com/QPH3ZSZclp
タグ: fluxml homomorphicencryption julialang
posted at 13:42:56
黒木さんがやってるような議論はこの本でもやってる。この本では最終的に全部対数オッズ比の尤度比検定で良いとしてる。まあχ二乗と似たようなもんだから実質同じ結論。
分割表の統計解析: 二元表から多元表まで (統計ライブラリー) www.amazon.co.jp/dp/4254128398/... twitter.com/urotauyoshiuso...
タグ:
posted at 16:04:53
松本俊彦先生は薬物依存症の専門家。「松本クリニック・松本浩彦院長」は、医師ではあるけど、ぜんぜん専門家でもなんでもない。デイリースポーツが非専門家の話から【専門家の目】と称して安易に記事をつくったのが問題。 twitter.com/tabitora1013/s...
タグ:
posted at 16:14:43
An interesting take on tensegrity where one heavy wire frame seems mysteriously suspended above another. This configuration is related to the concept of tensegrity invented by Kenneth Snelson and made famous by the architect Buckminster Fuller in 1949 buff.ly/349NSm6 pic.twitter.com/R4Zj4k4Vza
タグ:
posted at 16:22:30
Using #YaoFramework to prove this weight-9 error can be corrected by Shor’s code in #JuliaLang #QuantumComputing pic.twitter.com/v59RkSpgLv
タグ: JuliaLang QuantumComputing YaoFramework
posted at 16:34:24
need master branch however, like add Yao#master in your pkg mode. But next release is coming soon after my finals!
タグ:
posted at 16:38:42
Determinanteの用語は確かにGaussに依る
twitter.com/sugar_underkey...
のだが,連立一次方程式ではなく,2次形式に対して定義している:
歴史的著作"Disquisitiones arithmeticae" 1801
archive.org/details/disqui...
タグ:
posted at 17:02:55
中村正弘氏(おそらく推理作家の天城一)の言葉を疑ってはいないが,私は藤原松三郎が高木貞治以前に「行列」という言葉を使った文献を知らないし,高木が「方列」という訳語を使ったものを知らない。時間ができれば探してみたい。貴重なお話:
twitter.com/oto_oto_oto/st...
タグ:
posted at 17:12:00
久々に気合いの入った(覚悟を決めた?)NHKの報道。くまモン見て喜ぶ学長たちは恥ずかしくないのか。金で自大学の受験生を売ったも同然。
www3.nhk.or.jp/news/html/2019...
タグ:
posted at 18:58:43
福島県漁連会長がおしどりマコ氏やグリーンピースとつるんでいるのって、なんかの悪い冗談か?(・・?)
おしどりマコ氏やグリーンピースは風評加害者だお。悪いことは言わない。今からでも手を切ったほうがいい。
タグ:
posted at 19:35:54
なんとなく続けられている福島県での甲状腺検査ですが、私はもう中止した方がいいと思っています。
考えていることをシノドスさんがまとめて下さいました。
【SYNODOS】福島県の甲状腺検査は一刻も早く中止すべきだ――森田知宏氏インタビュー/福島レポート編集部 synodos.jp/fukushima_repo...
タグ:
posted at 19:50:40
#統計 文献紹介
「Lehmannの本でFisher's exact testはUMP (uniformly most powerful) unbiasedであることが証明されている」と主張する専門家達が存在する謎の解明。
その主張は誤り。
E.L.Lehemann, Testing Statistical Hypotheses, 2nd ed., 1986 を見ると、そのようには書かれていない。続く pic.twitter.com/K1IpxLcKLS
タグ: 統計
posted at 20:25:21
#統計 Lehmannさんは、Fisher's exact test (以下、Fisher検定)がUMP unbiasedであるとは言っていません。
UMP unbiased testを作るためには、同一のサンプルであっても仮説がある確率で棄却されたりされなかったりする必要があると言っている(ランダム化)。それは受け入れ不可能なので~続く pic.twitter.com/4FTqWEVcWc
タグ: 統計
posted at 20:37:30
#統計 続き~、ランダム化を行わない検定=Fisher検定が使われていることを説明しています。
さらに、Yatesの連続性補正を行わないχ²検定ならば、
* 有意水準αで第一種の過誤が起こる確率がoverallでαに近くなる
という事実や~続く pic.twitter.com/4hdHcNg4pm
タグ: 統計
posted at 20:37:37
明日、「研究者の皆さん!うまくいかなかったこと、うまくいってないこと、聞かせてください」というイベントをします。詳しくは、添付pdf を。www.ton.scphys.kyoto-u.ac.jp/~sasa/macsflie...
タグ:
posted at 20:40:55
#統計 続き
* Fisher検定では、有意水準αで第一種の過誤が起こる確率がαよりずっと小さくなりがちで、検定力も弱い
* 有意水準αで第一種の過誤が起こる確率がoverallでα以下になる検定(consevative test)で、Fisher検定よりある意味でましなものも提案されていること
もしっかり書かれています。 pic.twitter.com/gP1gfYqXC5
タグ: 統計
posted at 20:41:14
#統計 Yatesさんの1984年の論文の手痛い誤りを指摘しているFienbergさんはLehamannさんの本の1956年版を引用して、Fisher's exact testはuniformly most powerful unbiasedであると主張していますが、この部分の議論の仕方は間違っています。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 20:46:08
#統計 HavilandさんによるFisher検定批判論文(1990)に対する批判的なコメントでも、Lehmannさんの本を引用して、Fisher's exact testがuniformly most powerful unbiasedであることはとっくの昔に証明済みであると主張していますが、もちろん間違っています。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 20:55:46
#統計 直上の話題の数学的内容を1ツイートでまとめると次のリンク先のツイートの内容になります。 twitter.com/genkuroki/stat...
タグ: 統計
posted at 21:02:20
#統計 【だから臨床研究から遠くなる】というコメントは非常に参考になり、色々考えさせられた。
2×2の分割表の独立性検定のごたごたの原因はFisher's exact testが普及してしまったこと。
その害は、単に「検定力が大幅に下がった」だけではなく、ずっと大きい可能性がある。
Simple is best. twitter.com/urotauyoshiuso...
タグ: 統計
posted at 21:23:49
google kick start のこの問題、一見簡単目だけど、時間計算量はもちろん、ナイーブに解くとmemory limit errorになったりしてメモリ効率についてもちゃんと考えてないと解けないのでとても良問だと思った。
codingcompetitions.withgoogle.com/kickstart/roun...
タグ:
posted at 21:24:11
twitter.com/chestnut100kg/...
嘘のような本当の話。一時期ウイキペディアがEM菌を肯定する内容に編集されてしまい、大騒ぎになりました。⇨togetter.com/li/1264493
タグ:
posted at 21:25:07
#統計 #Julia言語
2×2の分割表について、自分で書いたP値と信頼区間を求める函数達と、#R言語 による各種ライブラリによる計算結果の比較の表をさらに拡充した。
P値と信頼区間の組は、私の計算と一致しているものを選べば整合性のある報告をできる。Rだと結構ばらばら。
nbviewer.jupyter.org/gist/genkuroki... pic.twitter.com/CMEHYLyXIq
posted at 21:37:54
上野千鶴子は以前話題になった東大での祝辞でも無茶苦茶なことを言っていたのに、あれを絶賛する人がたくさんいてびっくりした。東大生も東大教員もあれで怒らないのが不思議。激怒するのが当たり前でしょう。上野千鶴子は過大評価されていると思うよ
タグ:
posted at 22:06:55
#統計
UMP unbiased test では同一のサンプルでもある確率で独立性帰無仮説が棄却されたりされなかったりするようにする必要があるという話は、Fisher検定のmid-P補正の根拠になり得ますね。続く twitter.com/genkuroki/stat...
タグ: 統計
posted at 22:10:51
9×3=27と書くとなんで間違いになるのですか? #小学校算数 #かけ算 #教育の失敗 pic.twitter.com/wd3vuKCa7W
posted at 22:15:37
#統計 しかし、添付画像を見れば分かるように、mid-P Fisher検定では、第一種の過誤が生じる確率が補正無しのχ²検定よりもαを超えて大きめになる場合もあるし、補正無しのχ²検定より優れているようにも見えないです。mid-P Fisher検定を今から普及させるのも大変。
"Simple is best." twitter.com/genkuroki/stat... pic.twitter.com/XRb46WwTLc
タグ: 統計
posted at 22:17:24
秋月康夫『輓近代数学の展望』 (ちくま学芸文庫)には「matrix という字の意味から、園先生は母式と訳しておられたので、旧著では、母式という術語をとって書いたが、今日これは‘行列’というふうに定着しているので行列と改めた」とコメントがあり、面白い twitter.com/Paul_Painleve/...
タグ:
posted at 22:18:12
@ShmzTa2o ありがとうございます。たとえば
園正造「市場均衡の安定條件」1944
repository.kulib.kyoto-u.ac.jp/dspace/handle/...
の20ページに「母式(行列)」が使われています。園は1886年1月1日生れ,すでに「行列」が定着しつつあっても元の語義に従った言葉を使いたかったのでしょう。
タグ:
posted at 22:27:00
#統計
* G-testは第一種の過誤が起こる確率が大きくなり過ぎるので使うべきではない。
* Yates補正版のχ²検定には現代では存在価値がないと思う。Fisher検定の方がまし。
* 補正無しのFisher検定は小サンプルで検定力が非常に弱くなる。そうなっても良い人だけが使うべき。 pic.twitter.com/WcTbzdM9XX
タグ: 統計
posted at 22:29:18
#統計
* log odds ratioの分布の正規分布による近似を使う検定(Wald)は色々計算するとあんまりよくないっぽい。
* 残りの補正無しのχ²検定、"(N-1)/N"倍補正入りのχ²検定、mid-P Fisher検定は悪くなさそう。
* "Simple is best."を重視するなら、補正無しχ²検定で大抵の場合は大丈夫だと思う。 pic.twitter.com/KZy6jW7ke7
タグ: 統計
posted at 22:29:21
#統計
* しかし、#R言語 で補正無しのシンプルなχ²検定と整合的な信頼区間を計算してくれるライブラリを見つけることができないでいる。
* Fisher (1962)の1ページ論文(既出)の方法を誰かすでにRで実装していたりしないだろうか?
* 私はFisherと独立に本質的に同じものを #Julia言語 で書いた。 pic.twitter.com/MkAFGmz859
posted at 22:33:22
#統計 私が探しているのは
12 6
5 12
という分割表について
P値 = 0.02752225
95%信頼区間 = [1.18116994, 19.48644647]
を同時に表示してくれるソフトやライブラリです。 pic.twitter.com/8BpC3gB1s7
タグ: 統計
posted at 22:55:09
@genkuroki Stataのcciコマンドで、cornfieldオプションをつけると出せました。p値は標準出力だと小数点下4桁までですが、内部的には、p=0.02752225と算出していました。 pic.twitter.com/izQaFh3Dzg
タグ:
posted at 23:10:04