Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
Favolog ホーム » @genkuroki » 2020年04月01日
並び順 : 新→古 | 古→新

2020年04月01日(水)

非公開

タグ:

posted at xx:xx:xx

えなみん | IRC回った @lovely_SZcranes

20年4月1日

掛け算の順序の多様性を認めないのは、物の数え方の多様性を認めないことにもなりそう。

タグ:

posted at 00:29:47

非公開

タグ:

posted at xx:xx:xx

あおじるPPPP @kale_aojiru

20年4月1日

条件付確率()だのベイズの定理()だの学んでなくても、その意味するところは全く難しくないので、感度や特異度と偽陰性・偽陽性あたりの話が数字付きで理解できる程度には数学の素養積んでおいたほうがいいよね

タグ:

posted at 00:51:12

招き猫 @kyounoowari

20年4月1日

現役の財務省が真犯人と思ってはいけない。官僚と付き合ったことがある人は官僚世界の隠然とした先輩後輩関係に気づく

財務省の力は元財務省の人たち、公的機関や、銀行や、マスコミなどに天下りした人たちによる仕事ですよ。 twitter.com/smith796000/st...

タグ:

posted at 00:56:17

toshᴉzumi @toshizumi1225

20年4月1日

サンプルサイズが小さい場合の"PHC(仮説が正しい確率)"とそれに対応するp値。とりあえずphcは「意図1」と「意図2」が一致するというのは確認できたと思うけどこれで合ってるかどうかわからない。 pic.twitter.com/6nE5gO6vRB

タグ:

posted at 01:17:04

toshᴉzumi @toshizumi1225

20年4月1日

極端にサンプルサイズが小さい場合も。phcはp値と比べて中間的?中立的?な感じかと思ったけどよくわからんな…。 pic.twitter.com/1iXOJWGNQw

タグ:

posted at 01:17:05

ceptree @ceptree

20年4月1日

黒柴犬かわいいな

タグ:

posted at 02:02:45

yasudayasu @yasudayasu_t

20年4月1日

たとえば昨年に失業して既に所得が少なかった人は「所得・収入の大幅な減少」の要件を満たせないから給付は貰えないけど、新型コロナの影響で、失業期間が予想以上に長期化して困窮化する可能性は高いよね。 / “現金給付「所得・収入の大幅減が要件」 自公が経済対策提言 …” htn.to/3k5cyfD9xj

タグ:

posted at 02:08:01

黒木玄 Gen Kuroki @genkuroki

20年4月1日

@phasetrbot 差分化の仕方を変えれば挙動も当然変わってしまいます。 pic.twitter.com/EJLcgVdPP1

タグ:

posted at 02:16:21

toshᴉzumi @toshizumi1225

20年4月1日

priorかんけいなかったな

タグ:

posted at 02:16:37

黒木玄 Gen Kuroki @genkuroki

20年4月1日

自動生成、ほんとよくできているよな。
まさにろくでもないオレそのものだ。

----以下は自動生成----

ベイズ云々と言うのをやめた方が安全なようです。
markov.cordx.net/genkuroki

タグ:

posted at 02:25:08

黒木玄 Gen Kuroki @genkuroki

20年4月1日

小学生レベルの割合の問題を扱うときには細心の注意が必要です。
markov.cordx.net/genkuroki

タグ:

posted at 02:29:52

Jun TAKAI @J_Tphoto

20年4月1日

仮にリーマンショック級止まりの経済的落ち込みだったとして年間1万人自殺者が増え10年続く。死者は10万人。
倍なら20万人。ひょっとしてこのまま経済の底が抜ければ、街に浮浪児が溢れてる世の中になっても不思議じゃない。
新型コロナウイルスで亡くなる人の数がそこに何割かプラスされる。

タグ:

posted at 02:31:42

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#Julia言語 で似たようなことをやってみました。

nbviewer.jupyter.org/gist/genkuroki...
1D wave equation with forced vibration

気楽にアニメーションを作る所まで行けます。

あと現代的なプログラミング言語では「数値」ではなく、「函数」をパラメータとみなす発想がお得。続く

twitter.com/phasetrbot/sta... pic.twitter.com/3aPElUNEiX

タグ: Julia言語

posted at 04:40:56

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#Julia言語

nbviewer.jupyter.org/gist/genkuroki...

中央で正弦波での強制振動、両端でDirichlet境界条件 pic.twitter.com/ODRItvSS1h

タグ: Julia言語

posted at 04:40:57

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#Julia言語

nbviewer.jupyter.org/gist/genkuroki...

中央で正弦波での強制振動、両端でNeumann境界条件 pic.twitter.com/lBM4dRLk23

タグ: Julia言語

posted at 04:40:57

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#Julia言語

nbviewer.jupyter.org/gist/genkuroki...

中央で三角波での強制振動、両端でDirichlet境界条件

中央での強制的な動きと両端での境界条件は函数で与える実装になっているので、同じコードを使って異なる条件の数値解を容易に得られます。 pic.twitter.com/feVOSuFxm0

タグ: Julia言語

posted at 04:40:58

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#Julia言語 現代においてはこの程度の数値計算は、「プログラミング」ではなく「高級電卓の延長」のような感覚で行えるわけです。

nbviewer.jupyter.org/gist/genkuroki...
のコードは計算の効率化のために複雑になっている部分が少しだけあって、それもやめればさらに楽になる。

タグ: Julia言語

posted at 04:46:26

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#Julia言語

Julia言語 何はともあれ add してみた。

これは面白そうです。

階層ベイズでWAICやLOOCVを計算するときに数値積分が必要になるので使うことがありそうな気がします。

github.com/machakann/Doub...

twitter.com/machakann/stat...

タグ: Julia言語

posted at 05:04:26

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 P値を使う【「伝統的な」統計学】と豊田秀樹さんの「仮説が正しい確率」(phc)の関係については、このツイートがぶら下がっているスレッドで詳しく説明されています。

豊田さんはP値を攻撃していますが、彼のphcは対応するP値の近似値になっています。

twitter.com/RakT1a869LnEHn...

タグ: 統計

posted at 05:21:39

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 P値を使った検定を止めて、対応するP値の近似値になっている「仮説が正しい確率」(phc)を使えばよいとする議論を豊田秀樹さんはここ数年間ずっとやっている感じ。

こうなってしまった理由は、P値サイドを戯画化して、アンフェアな議論を行ってしまっていることです。アンフェアな議論は有害。

タグ: 統計

posted at 05:24:01

黒木玄 Gen Kuroki @genkuroki

20年4月1日

読んだ↓

www.jsph.jp/covid/files/ga...

COVID-19への対策の概念
新型コロナウイルスに関連した感染症対策に関する厚生労働省対策推進本部クラスター対策班
東北大学大学院医学系研究科・押谷仁
(2020年3月29日暫定版)

タグ:

posted at 05:34:34

Kirk Borne @KirkDBorne

20年4月1日

Good starting point to learn about the Julia Language in #MachineLearning#Algorithms, Applications, Open Issues: arxiv.org/abs/2003.10146
——————
#BigData #DataScience #AI #Coding #DataScientists
————
+Learn more #JuliaLang and do more using this book: amzn.to/3bDpEDZ pic.twitter.com/fABiFqQ8gp

タグ: AI Algorithms BigData Coding DataScience DataScientists JuliaLang MachineLearning

posted at 05:37:20

Hiroshi Nishiura @nishiurah

20年4月1日

読みましたー。いま、残念ながら「持ちこたえている」という表現はできず、楽観視もできる状況になく、それについては本日付け予定の発表をお待ちください。1/3 twitter.com/katu196911/sta...

タグ:

posted at 05:38:11

Hiroshi Nishiura @nishiurah

20年4月1日

対応についてもクラスタ対策に頼らず様々なオプションを想定することが必要になっており、ご指摘の行動が制限される事態も実際に検討されています。こちらも発表資料に入る予定です 2/3

タグ:

posted at 05:38:11

Hiroshi Nishiura @nishiurah

20年4月1日

確かに東京都での受け答えの受け取られ方の話は、発信側が十分でなかったとも理解すべきと思いました。皆さんの力を必要とする場合も視野に入れて今後の対応を検討していますので是非必要時にお力を下さい。3/3

タグ:

posted at 05:38:12

ceptree @ceptree

20年4月1日

奥村先生のサイトを参考にプロットしてみた

COVID-19 番外編1
oku.edu.mie-u.ac.jp/~okumura/pytho...

2019 Novel Coronavirus COVID-19 (2019-nCoV) Data Repository by Johns Hopkins CSSE
github.com/CSSEGISandData... pic.twitter.com/dnizGzd15w

タグ:

posted at 06:21:00

数学女子 @phasetrbot

20年4月1日

@genkuroki ありがとうございます。

タグ:

posted at 06:23:13

遅行指数 @voo_glb

20年4月1日

Julia言語でpythonのwith open(path) as f:みたいな構文はまだないのかな?

タグ:

posted at 06:23:58

宮島正 @yasuokajihei

20年4月1日

Confirmed coronavirus cases by selected countries(Julialang)
pgi-jcns.fz-juelich.de/pub/doc/covid-... twitter.com/ceptree/status...

タグ:

posted at 06:28:00

非公開

タグ:

posted at xx:xx:xx

EARLの医学ツイート @EARL_med_tw

20年4月1日

COVID-19への対策の概念 クラスター対策班
東北大学・押谷仁 (2020年3月29日暫定版)
www.jsph.jp/covid/files/ga...

このスライドを見て、現在多数の院内感染が発生している東京都台東区の永寿総合病院のクラスターが屋形船クラスターから繋がっていたことを知りました。クラスター班の執念すごいですね

タグ:

posted at 08:40:48

ケフっち@Deterministic @__cheph__

20年4月1日

朝からブラウザでgmail、google calendar、MS Outlook、LaTeX用にVS Code、Julialang用にatomを立ち上げる。いつもの流れ。

タグ:

posted at 08:55:51

ケフっち@Deterministic @__cheph__

20年4月1日

紳士の嗜みとして「1からはじめるJuliaプログラミング」をポチった。そうだよな #julialang は1からだよな。

タグ: julialang

posted at 09:21:45

数学女子 @phasetrbot

20年4月1日

Linuxやプログラミング言語のパッケージ管理をしている人、何をどう考えても世界平和に貢献しているし、全員にノーベル平和賞贈って欲しい。

タグ:

posted at 12:17:36

ケフっち@Deterministic @__cheph__

20年4月1日

計算と確認は #julialang で作図は #pgfplots で、が基本スタイルになってきたな。

タグ: julialang pgfplots

posted at 13:14:55

Miura Hideki @miura1729

20年4月1日

型が強い・弱いなら、Elixir, Python, Ruby, JSは強い型だし、Juliaに至ってはコンパイル言語で静的に変数に型が付く奴じゃん

タグ:

posted at 14:25:32

朝日新聞仙台総局 @asahi_sendai

20年4月1日

仙台市内のパブ「HUB仙台一番町四丁目店」を利用した男女4人が、新型コロナウイルスに感染したことが分かりました。県内の感染確認はこれで11人目になります。

郡市長は定例会見で、パブについて「クラスターの可能性が濃厚」と話しました。16:30から改めて臨時の会見を開きます。

タグ:

posted at 14:28:33

らすまる @las_mal

20年4月1日

統計学が瀕死かどうかは誰が判断したのだろう。もし仮に統計学が瀕死なのであれば、その原因はp値でもなければベイズでもないと思う。そう、統計学者の多くが営業下手で、高校生に「こんなに楽しい学問なんだよ!こっち来なよ!」と言ってこなかったことにあると思う。

タグ:

posted at 14:36:32

らすまる @las_mal

20年4月1日

どうしても瀕死の学問を救いたかったら、ジャンプに統計が活躍するマンガを新連載するか、深夜アニメで統計得意な女の子が無双する話を流してもらうのが良いのではないか(冗談です)。

タグ:

posted at 14:38:30

BUNTEN @bunten

20年4月1日

お肉券だお魚券だという議論をしている与党の面々に聞かせたい話。 / 2件のコメント b.hatena.ne.jp/entry/s/diamon... htn.to/3FWPzWLGfH

タグ:

posted at 15:19:14

黒木玄 Gen Kuroki @genkuroki

20年4月1日

@phasetrbot #数楽 1次元での波動方程式の差分化を、c=1, Δt=Δx=hの場合の

u(t-h, x) + u(t+h, x) = u(t, x-h) + u(t, x-h)

で与えると、波動方程式のexact解

u(t, x) = f(x+t) + g(x-t)

が差分化のexact解にもなっています。

折角なので、この辺も数値的に確認すると楽しいと思います。

タグ: 数楽

posted at 15:21:15

黒木玄 Gen Kuroki @genkuroki

20年4月1日

コロナ経済対策が「ベーシックインカム的」であるべき理由
山崎元
diamond.jp/articles/amp/2...
【対象者を絞って」、「ピンポイントで必要な人に」等と言って議論に時間を掛けようとする政治家は、与野党を問わず、自らが有害な役割を果たしていることに気づいてほしい。】

まったくその通りだと思う。

タグ:

posted at 15:27:04

Hiroyasu Kamo @kamo_hiroyasu

20年4月1日

『コンピュータは数学者になれるのか?』といかにも啓蒙書っぽい題名で、実際、啓蒙書です。断じて教科書ではありません。ただし、啓蒙書は教科書よりも易しいとは限りません。#こんな時こそ本を読もう www.seidosha.co.jp/book/index.php...

タグ: こんな時こそ本を読もう

posted at 15:27:50

市村弘(梅本弘 または ローガン梅本) @kerpanen

20年4月1日

Anna Sokolska horseback archer - AMM Archery Team youtu.be/SMJTejZJHwk @YouTubeさんから

タグ:

posted at 15:50:01

市村弘(梅本弘 または ローガン梅本) @kerpanen

20年4月1日

ポーランドの女性射手。騎射の妙義、特に騎乗で弓を左手から右手に持ち替えて、右側の的を射てるのがすごい。一見の価値がありますよ。

かつての中東の弓騎兵は、これができるのが当たり前だった、と言う話もあります。いくら弓が小型で取り回しがいいと言っても、こんな連中と騎射戦はできませんね。 twitter.com/kerpanen/statu...

タグ:

posted at 15:54:05

黒木玄 Gen Kuroki @genkuroki

20年4月1日

3/21は「仙台で聖火見物5万人」の日で、その前後で宮城県外から大量の人が仙台に来て去って行った。

潜伏期間的にそのときの影響が見えて来る頃だと予想していました。宮城県内だけではなく、県外でも実際に影響が観測されている。 twitter.com/asahi_sendai/s...

タグ:

posted at 15:56:26

積分定数 @sekibunnteisuu

20年4月1日

3乗和も撃破されてしまったw

タグ:

posted at 15:57:21

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 #Julia言語

添付画像は論文

www.ncbi.nlm.nih.gov/pubmed/32046819

と同じデータと本質的に同じ方法で推定した潜伏期間の予測分布のグラフです。予測分布のプロットは自前で行いました。ソースコード↓

nbviewer.jupyter.org/gist/genkuroki... twitter.com/genkuroki/stat... pic.twitter.com/h1HVpzWPVv

タグ: Julia言語 統計

posted at 16:03:55

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 推定結果に影響はないのですが、その論文におけるlooパッケージの使い方は間違っていると思う。

この件では特に十分なピアレビュー抜きで公開されている論文が多くなっていると思われ、その分だけ統計処理を間違っているものの割合は増えていると思う。

タグ: 統計

posted at 16:07:09

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 「論文に書いてある推定結果を自分で再現できるかどうか」を確認する作業を沢山の人達がしてくれるとよいと思いました。

私は統計学ど素人なので上で紹介した程度のことしかできません。

タグ: 統計

posted at 16:11:51

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計

www.mhlw.go.jp/stf/seisakunit...
【WHOの知見によれば、現時点で潜伏期間は1-14日(一般的には約5日)とされており、また、これまでのコロナウイルスの情報などから、未感染者については14日間にわたり健康状態を観察することが推奨されています。】

添付画像は私によるプロット。 pic.twitter.com/q8hFuPGlq4

タグ: 統計

posted at 16:20:46

ceptree @ceptree

20年4月1日

Julia、structと関数に同じ名前つけて多重ディスパッチ(?)できるのか

タグ:

posted at 16:31:34

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 解説

#R言語 のlooパッケージ

www.rdocumentation.org/packages/loo/v...

はベイズ統計における予測分布の誤差の大きさの指標(一個抜き出し交差検証LOOCVと広く使える情報量基準WAIC)を計算してくれます。

これによって異なるモデルの予測誤差を比較できます(ただし確率的に間違うのでギャンブルになる)。 twitter.com/genkuroki/stat...

タグ: R言語 統計

posted at 16:45:28

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 しかし、StanなどのMCMCパッケージに与える「モデル」だけで予測分布は決まらず、階層ベイズのケースでは追加の情報が必要になる。

だから、Stanの使い方は間違っておらず、推定の手続き自体は正しくても、異なるモデルの異なる予測分布の選択でlooパッケージの使い方を間違う可能性が高い。

タグ: 統計

posted at 16:45:35

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 例えば、

z ~ p₃(z)
w_k ~ p₂(w_k|z)
Y_k ~ p₁(Y_k|w_k) (k=1,…,n)

型の階層モデルの正しい予測分布は、確率モデル

p(y|z) = ∫ p₁(y|w)p₂(w|z) dw

の事後分布平均とするべきである場合が大部分であり、looパッケージを使うときには積分のコードを手で入れてやる必要が生じます。

タグ: 統計

posted at 16:50:41

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 手計算または数値積分が必要になる場合が大部分であることをlooパッケージのエンドユーザーが十分に認識できている場合はまれだと思う。

異なるモデルの異なる予測分布の誤差の相対比較は場合によっては重要になるかもしれないので、そういう場合には注意した方が良いです。

タグ: 統計

posted at 16:54:14

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 「異なるモデルの異なる予測のどれがもっともらしいか」をテクニカルな詳細を知らない人であっても容易に得られるようなソフトウェア群が整備されれば素晴らしいと思うのですが、現時点ではそうなっていません。

相当に賢いアイデアを出さないとそういうパッケージを作るのは難しいと思う。

タグ: 統計

posted at 16:57:29

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 パラメータzでyが

p(y|z) = ∫ p₁(y|w)p₂(w|z) dw

で確率的に決まるモデルは

z~p₃(z)
Y_k~p(Y_k|z)

と書けるのですが、p(y|z)を直接扱えなくても、観測されない内部パラメータw_kを含むモデル

z ~ p₃(z)
w_k ~ p₂(w_k|z)
Y_k ~ p₁(Y_k|w_k)

で代用できます。続く twitter.com/genkuroki/stat...

タグ: 統計

posted at 17:08:57

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 続き。モデルをそのように書き直しても、ベイズ統計のMCMC法は有効に使える。おそらく、これがStanなどのMCMCパッケージがよく使われるようになった理由です。

looパッケージの使い方を間違っていると思われる論文での潜伏期間の推定でもStanを使っています。

タグ: 統計

posted at 17:11:15

Hiroyasu Kamo @kamo_hiroyasu

20年4月1日

@sekibunnteisuu その優秀な方、数学的帰納法はご存じですか?

タグ:

posted at 17:14:34

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 その論文で使っているデータは88人分の「暴露開始日」「暴露終了日」「発症日」の3つの数値です。観測されない内部パラメータは「暴露開始日」「暴露終了日」の間の「感染日」がいつかです。Stanでの推定では観測データがない「感染日」は内部パラメータ "w_k" として扱われます。

タグ: 統計

posted at 17:15:38

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 ベイズ統計でモデルを作るときには、

 観測によって判明していないことはモデル内ではランダムに決まっている

と考えてモデルを作ります。

「暴露開始日」「暴露終了日」の間の「感染日」はいつなのか分からないので、「感染日」は「暴露開始日」「暴露終了日」の間の一様分布で~続く

タグ: 統計

posted at 17:19:01

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 続き~ランダムに決まっていると考えてモデルを作ります。やっていることがものすごく大雑把で、逆に言えば気楽に丼勘定でモデルを作っている。

「感染日」は「暴露開始日」「暴露終了日」の間の一様分布でランダムに決まっているだけだと~続く

タグ: 統計

posted at 17:22:41

積分定数 @sekibunnteisuu

20年4月1日

@kamo_hiroyasu 多分知らないと思います。少なくとも私は教えていない。
直観的にわかっている可能性はあります。

タグ:

posted at 17:25:19

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 続き~、「感染日」を推定することができません。

そこでさらに「感染日」から「発症日」までの「潜伏期間」の長さがある特定の確率分布(論文でのガンマ、対数正規、Weibullの3通りの分布を考えている)でランダムに決まっていると考えます。続く

タグ: 統計

posted at 17:25:26

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 「感染日」が「暴露開始日」と「暴露終了日」の間の一様分布でランダムに決まっていたり、「感染日」から「発症日」までの「潜伏期間」がある特定の種類の確率分布に従ってランダムに決まっていると考えるのは、モデル内部の設定についてであり、現実がそうなっていると考えているわけではない。

タグ: 統計

posted at 17:27:38

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 ベイズ統計ではこう考える。

仮にモデル内部の仮想世界で現実の88人と同じ「暴露開始日」「暴露終了日」「発症日」を持つ人達が発生したなら、モデル内部はどのような様子になっているだろうか?

現実で得たデータがモデル内部で再現された場合にモデルを制限すれば、制限されたモデルは~続く

タグ: 統計

posted at 17:31:03

Hiroyasu Kamo @kamo_hiroyasu

20年4月1日

@sekibunnteisuu 数学的帰納法を直観的に理解している人なら、三乗和が高々四次の多項式Pで表せると仮定する。P(n)−P(n−1)とn^3を比較して係数を決定する。という手を思いつくかもしれません。

タグ:

posted at 17:34:30

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 ~現実を何らかの意味で近似していると期待できます。(実際にそうなっていることを数学的に証明できます!)

問題はその近似の良さの程度です。

LOOCVやWAICを計算すれば異なるモデルによる近似の誤差を(確率的に失敗するリスクを受け入れれば)相対的に比較できるのです。

タグ: 統計

posted at 17:34:54

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 以上の解説では、「主観確率」だの「信念」だのそういう非科学的な事柄を一切持ち出さずにベイズ統計の典型的な使い方を説明していることに注意!

モデルはモデルに過ぎず、現実ではありません。

そして、誤差が相対的に小さなモデルを選ぶと考えておけば、非科学的事柄を排除できるわけです。

タグ: 統計

posted at 17:38:46

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 件の論文では、潜伏期間の分布として、ガンマ、対数正規、Weibullの3通りの分布のどれがもっともらしいかをlooパッケージで判定しているのですが、私の理解では論文のその部分は間違っています。

間違っていることに気付くと不安になります。

そこで3通りの予測分布をプロットしてみた。続く pic.twitter.com/myMP84bH8z

タグ: 統計

posted at 17:42:22

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 3通りの予測分布を見ると似たり寄ったりです。不確定要素が沢山ある中での丼勘定でこの3つを区別するのは時間の無駄でしょう。WHOも14日間様子を見ると言っていて、それとも推定結果は一致しているように見える。

もしかしたら、以上の解説は実践的なベイズ統計の良い解説になっていないか? twitter.com/genkuroki/stat...

タグ: 統計

posted at 17:47:16

非公開

タグ:

posted at xx:xx:xx

積分定数 @sekibunnteisuu

20年4月1日

@kamo_hiroyasu Snを与えてanを求める問題をいくつかやらせると気づくとは思うのですが、敢えてそうはしませんでした。

ちなみに今はy=x^2のグラフの面積をやらせています。
「正確な値が無理なら、それに近い値を」と言ってある。
細かく刻んで小数の計算をしている。なかなかいい感じ^^

タグ:

posted at 17:48:28

nekoumei @nekoumei

20年4月1日

今の今まで知らなかったんだけど、nbextensionsのVariable Inspectorめっちゃ便利じゃん RStudioみあるensekitt.hatenablog.com/entry/2017/11/...

タグ:

posted at 17:55:20

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 ベイズ統計でのモデルのデータによる制限は「条件付き確率分布」として定義されます。

モデル内で可能な事象を「現実で得たものと同じデータが(モデル内で)生成された場合」に制限して得られる条件付き確率分布を考える。

ベイズ統計の肝は「ベイズの定理」ではなく、条件付き確率分布の方。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 18:27:35

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 ベイズ統計に限らず、統計学で使用するモデルは現実をぴったり記述できなくても全然問題ない。数理統計でのありがちな基本定理は、

適当にゆるい条件を満たす任意のモデルによる推定結果は、サンプルサイズ→∞のとき、そのモデルの範囲内でベストの推定結果に近付く

というもの。続く

タグ: 統計

posted at 18:31:55

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 モデル自体がダメだと、そのモデルの範囲内でのベストの推定結果が現実の予測として大外ししていたり、サンプルサイズ→大での推定の収束が遅くなったりします。

以下のリンク先は、モデルの範囲内でのベストの推定結果が大外ししている場合です。予測分布(predictive distribution)が大外れ。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 18:36:56

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 残差が正規分布に従わない場合であっても最小二乗法による推定はサンプルサイズ→∞でうまく行くのですが、残差の分布が正規分布から程遠い場合には推定の収束は遅くなり、正しいモデルと比較すると誤差が大きくなります。最小二乗法はBLUEであるという定理に実質的な価値はほとんどないと思う。

タグ: 統計

posted at 18:41:53

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 最小二乗法は実質的に正規分布モデルなので、残差が正規分布に従っていないように見える場合には不適切な推定法になります。

モデルを使った推定の基本は「サンプルサイズ→大でモデルの範囲内でベストの結果に近付く。モデルが不適切だとベストの結果に近付くのも遅くなる」だと思う。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 18:46:32

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 サンプルサイズ→大での推定の収束が遅くなるケースとして、モデルのパラメータが無題に多い場合があります。

現実の統計分析では自由にサンプルサイズを増やせず、得られたデータだけで勝負する必要があります。そのとき、無駄に複雑でパラメータ数が多いモデルを使うと失敗する。

タグ: 統計

posted at 18:53:36

にのぴら @nino_pira

20年4月1日

@nekoumei これ入れるとnotebook超絶重くなるので 気をつけてください
「df.head()の実行時間5msなのに、表示に3s程度かかるのは何故や!?」となっていた原因がこいつだった経験が個人的にあります。。。

タグ:

posted at 18:55:19

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 得られたデータのサイズに応じた「解像度」でしか真っ当な推定結果は得られないのです。

その辺の事柄もモデルの種類を適当に制限すれば数学的に証明できます。

以下のリンク先は多項式回帰で多項式の次数を無駄に上げて推定に失敗している場合。

twitter.com/genkuroki/stat... twitter.com/genkuroki/stat...

タグ: 統計

posted at 18:57:39

にのぴら @nino_pira

20年4月1日

@nekoumei 五月雨式ですいません汗
こちらが参考リンクです。。。。
github.com/ipython-contri...

タグ:

posted at 18:58:55

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 以上で出て来た例には、ベイズ統計を使った場合と最尤法を使った場合の両方が含まれています。

ベイズであるか否かによって基本的な考え方が変わるわけではないことはもっと強調されてしかるべきだと思います。

現実には20世紀の統計学の黒歴史を踏襲したベイズ統計の解説の方が普及している。

タグ: 統計

posted at 19:01:24

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 20世紀に「主観確率に基くベイズ統計」を科学の世界から排除しようとした人達は正しかった。その辺を曖昧にしたまま、ベイズ統計が復活したと面白おかしく語る本もあるので要注意。

ベイズ統計全体を排除しようとした人達はベイズ統計の数学的に良い性質を見逃すという痛恨の誤りを犯していた。

タグ: 統計

posted at 19:06:57

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 注意:以下のリンク先の動画は、サンプルサイズを大きくしながら推定が収束する様子をプロットしたもの__ではない__です。

最尤法の解を探索する途中の様子を動画にしたものです。尤度を最大化するパラメータを探す過程で、新たな構造が「発見」されるごとに汎化誤差がポコっと大きくなる。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 19:25:04

koume @koume_nouka

20年4月1日

そいや今日、風疹の予防接種のクーポンが、特に申し込んだりも何もしてないのに届いたんだけど、自治体は普通に色んな情報もってるやん…って思ったよ

タグ:

posted at 19:29:08

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 尤度を最大化するパラメータの探索を途中で打ち切って、尤度を最大化(その対数の-1倍=training errorを最小化)しない方が、汎化誤差(=generalization error=予測誤差+定数)が小さくなる場合があります。

尤度は単にデータへの適合度の指標に過ぎず、単純に「もっともらしさ」とは言えない。

タグ: 統計

posted at 19:29:22

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#統計 直上の「尤度」の説明やもっと上の方の「ベイズ統計」の説明は、普及してしまっている解説を否定するような内容になっていることに注意して下さい。

多分、大学の教育でも統計学について、伝統的に普及してしまっているおかしな考え方を堂々と教え続けている。

これ、世界的に大問題だと思う。

タグ: 統計

posted at 19:31:58

黒木玄 Gen Kuroki @genkuroki

20年4月1日

#Julia言語 では

open(filepath) do f
base64 = base64encode(f)
display("text/html", """<$(tag) src="data:image/gif;base64,$(base64)"/>""")
end

のように書けます。do構文を使う。解説↓

giordano.github.io/blog/2019-02-2...
Julia do-block vs Python with statement

docs.julialang.org/en/v1/manual/f... twitter.com/voo_glb/status...

タグ: Julia言語

posted at 19:56:04

optical_frog @optical_frog

20年4月1日

さらに概念的整理: 「必要なのは仕事ではない,お金だ」("What they need, instead, is money.") www.nytimes.com/2020/04/01/opi...

タグ:

posted at 20:07:51

ケフっち@Deterministic @__cheph__

20年4月1日

ロジスティック回帰分析でSASが叩き出すc統計量(たぶん普通のAUROC)と自分で #julialang で計算した値とが合わずにイライラする。

タグ: julialang

posted at 20:26:44

ちくわ @pavlov469

20年4月1日

「今日はJuliaを書くぞ!」と意気込んでPCを開き,本のPDF見ながらノートに手計算し,そのまま寝る

タグ:

posted at 20:29:39

ちくわ @pavlov469

20年4月1日

Juliaにはテキストの数式展開してひとりでウンウン唸ることの大切さを教えてもろてる

タグ:

posted at 20:35:02

井上純一(希有馬)新刊『逆資本論』発売中 @KEUMAYA

20年4月1日

日本には一律現金支給できる余裕がある(低インフレ〜デフレという物価と長期国債の利回りの低さ)
やる理由もある(消費増税の失敗とコロナショック)
全国民に配るノウハウもある(マスク二枚)

やれないんじゃなくて、やらないんです。
なぜかは分かりません。

タグ:

posted at 21:39:08

よこえもん @yokoemon2112

20年4月1日

お陰さまで科研・基盤(C)「Julia言語を用いた新しい計算機数論システムの開発とその応用」が採択されました。
今年35歳なので、採択率の高い若手研究にも出せたのですが、背水の陣で基盤に通ったことに感謝。5年間 Julia 漬け(and 布教活動)になると思いますので、皆様のご協力をお願い致します。

タグ:

posted at 21:58:04

ʇɥƃıluooɯ ǝıʇɐs @tsatie

20年4月1日

やっと気がついた。#Julialang やのうて #python#SymPy で因数分解してたのやな。ふむ。たまにしか使わないと色々直ぐには分からない。

タグ: Julialang python SymPy

posted at 22:04:01

ʇɥƃıluooɯ ǝıʇɐs @tsatie

20年4月1日

ラッパーかける?事であたかも #Julialang がって形にしてくれると助かるのやけど... twitter.com/tsatie/status/...

タグ: Julialang

posted at 22:04:50

fumo @fumokmm

20年4月1日

Julia言語なんてのもあったな。計算が得意なんだっけ?

タグ:

posted at 22:05:07

おばけ @triwave33

20年4月1日

すげぇJuliaネタで科研費取れるんだ。

タグ:

posted at 22:11:10

おばけ @triwave33

20年4月1日

よくわかってないんだけれど、Juliaの実行速度は2回目(一度コンパイルした後)の方が圧倒的に早いですよね。
バッチ(not REPL)で例えば100万iterationの処理をしたい場合って、最初に短いiter.でコンパイルさせる処理書いといて、2回目に本番のiter.回すんですか?

タグ:

posted at 22:12:54

ʇɥƃıluooɯ ǝıʇɐs @tsatie

20年4月1日

コロナのおかげで #超算数 撲滅のための資料が整うかも twitter.com/aixcheck/statu...

タグ: 超算数

posted at 22:41:45

非公開

タグ:

posted at xx:xx:xx

セクスィ・ナカナカピエロ @NakanakaPierrot

20年4月1日

買っちゃったけど、この本は信用できる?
瀕死の統計学を救え! ―有意性検定から「仮説が正しい確率」へ― 豊田 秀樹 www.amazon.co.jp/dp/4254122551/...

タグ:

posted at 23:00:52

セクスィ・ナカナカピエロ @NakanakaPierrot

20年4月1日

最近、統計の本のどれが良くてどれが悪いのか、よくわからなくなっちゃって聞いてみました!

タグ:

posted at 23:03:31

おばけ @triwave33

20年4月1日

Juliaのcatとhcatで実行速度が大違い問題、このあたりが関係してるのかな?hcatはLazyArrayというものに相当するらしい。
#JuliaLang

github.com/JuliaArrays/La...

twitter.com/triwave33/stat...

タグ: JuliaLang

posted at 23:12:19

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました