Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
Favolog ホーム » @genkuroki » 2016年10月20日
並び順 : 新→古 | 古→新

2016年10月20日(木)

OokuboTact 大久保中二病中年 @OokuboTact

16年10月20日

@bampaku  そうですか、残念。ウイキペディアの「3囚人問題」の参考文献にいっぱい載っているのですが  ja.wikipedia.org/wiki/3%E5%9B%9...

タグ:

posted at 23:53:32

万博@盲学校マジック @bampaku

16年10月20日

@OokuboTact うーん、読んだことないと思います。

タグ:

posted at 23:51:56

OokuboTact 大久保中二病中年 @OokuboTact

16年10月20日

@bampaku  万博さんは、「3囚人問題」に関する心理学者の論文を読んだことありますか?

タグ:

posted at 23:48:45

飯田 善 @iidamasaru

16年10月20日

文春や新潮、その他報道されている情報を読んだかぎりでは、渡辺竜王の危機感やそれを受けての行動は極めて真っ当なものであると考えます。問題はその後の連盟の中途半端な対応。当事者が納得していない状況で確実な根拠もなく一方的な処分を下したのは極めてまずい。

タグ:

posted at 23:27:38

黒木玄 Gen Kuroki @genkuroki

16年10月20日

Re:RT 適切にポンチーする方が難しい感じがする。

タグ:

posted at 23:23:43

えびふらい@大合神クジラちゃん @ebifrier2

16年10月20日

詳細についてですが、10月22日(土) 15:00~19:00に放送を予定しています。一連の疑惑について関心のある方は是非ご視聴ください! また会場の人数に余裕がありますので、もし放送に出たいという方がいましたら気軽にご連絡下さい(特に開発者の方やプロ棋士の方歓迎です) twitter.com/mtmtlife/statu...

タグ:

posted at 22:15:59

読書猿『独学大全』14刷26万部、『文章 @kurubushi_rm

16年10月20日

【一行数学史】1874 15パズル

4×4のボードの上で15枚の駒を空いたマス目を利用して動かし目的の形にするパズル。
任意の可能な配置へ80手以内で変形できるが、「14と15 を入れ替えた状態を元に戻す」ことはできない。この問題に懸賞金がかけられたことで15パズルは普及した。 pic.twitter.com/fPzHgZPWkS

タグ:

posted at 22:14:32

大谷 dandori 洋介 @dandori

16年10月20日

来日中のIOCのバッハ会長が、書道を体験し「五輪精神」と書いた、というニュースをやっていて、そんな難しい漢字を書かさなくても、と思って見たら、予想だにしない上手さだった。 pic.twitter.com/EPRBvdKMvN

タグ:

posted at 21:38:16

gotogen @gotogen

16年10月20日

三浦九段の出場停止が発表された日が境だとすると、その前にも後にも様々な情報が入ってきていますし、その真偽を考え続けています。現状自体はいくつか考えていた想定のひとつですが、実際に起こったことによって受けたショックは想定外で、自分でもびっくりしました。

タグ:

posted at 21:34:16

gotogen @gotogen

16年10月20日

たとえば今回の三浦九段の一件はかなり前から問題視されており、何人か集まればだいたいその話題になります。はっきりと疑念や不満を言って感情を露にする棋士、それを諌める棋士、何も口にせず眉をひそめる棋士…その誰もが、言いようのない不安と戦っているように感じられました。

タグ:

posted at 21:22:00

天むす名古屋 Temmus @temmusu_n

16年10月20日

#掛算 この季節に定期的に出ているのか、ベネッセの掛算広告sho.benesse.co.jp/cp/math/sho2/。冒頭の惹句【かけ算の意味を理解して
九九を暗記できるから、
しっかり使いこなせるようになります
】で宣言されている通り、掛算の順序とかけ算の意味を同義に考えて指導する方針だ。

タグ: 掛算

posted at 21:05:44

松浦 健太郎 @hankagosa

16年10月20日

情報量規準使うのは万策尽きてからのお楽しみ。最後のデザートです。

タグ:

posted at 18:59:50

松浦 健太郎 @hankagosa

16年10月20日

現代人は分かりやすくて白黒つけれてラクなのに慣れすぎて、1次元的に判断できるものに溺れすぎてる気がする。★の数だとか、p値だとかAICとか。いったん封印して何ができるか考えてみるといいかも。ポンチー封印して麻雀練習するのに似てる。

タグ:

posted at 18:53:03

松浦 健太郎 @hankagosa

16年10月20日

ありがとうございます!Box-Mullerは完全に誤植ですm(_ _)m twitter.com/h_okumura/stat...

タグ:

posted at 18:32:04

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#将棋 続き。いわくつきの仕掛けの局面は添付画像の通り。 pic.twitter.com/EW0djsiK4u

タグ: 将棋

posted at 18:09:36

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 多次元正規分布とカイ二乗分布の関係とは「s次元の台を持つ多次元正規分布の確率密度函数の指数函数部分がexp(-y/2) (yはx_i-μ_iの斉次2次式)のとき、yに対応する統計量は自由度sのカイ二乗分布に従う」という結果のこと。これをカイ二乗分布の定義だと思ってもよい。

タグ: 数楽

posted at 18:03:12

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。カイ二乗統計量の形がそのままで良い理由は「分割表の分布がポアソン分布の直積における条件付き確率分布になっていること」と「多次元正規分布とカイ二乗分布の関係」の二つの事柄に分解される。前者は分布の式の形から明らか。後者の理解には線形代数が必要。

タグ: 数楽

posted at 17:58:10

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。しかし、多項分布や分割表のケースでは縦横の総和に制限がついてその分だけ自由度が下がる。自由度が下がってもΣ(O-E)^2/Eの式の形はそのままでよいのはどうしてなのだろうか?ピアソンのカイ二乗検定を理解していると思っている人達は説明できるだろうか?続く

タグ: 数楽

posted at 17:54:39

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 カイ二乗統計量に関する話の続き。(O-E)/√E型の統計量はOが平均Eのポアソン分布に従い、Eが大きければ標準正規分布に近似的に従うので、その二乗は自由度1のカイ二乗分布に近似的に従う。そのような二乗統計量をr個足すと(独立なら)自由度はrになる。ここまでは簡単。続く

タグ: 数楽

posted at 17:51:15

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#将棋 竜王戦第1局ではいわくつきの局面に渡辺竜王が誘導しているように見える。😱

タグ: 将棋

posted at 17:40:53

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#将棋
shogidb2.com/games/bcd93d97...
shogidb2.com/games/10d3d7cc...
A級順位戦▲三浦九段VS△渡辺竜王の第31手目
竜王戦第1局▲丸山九段VS△渡辺竜王第29手目
がほぼ同じ局面。前者は渡辺竜王がフルボッコされており、後者はする側。

タグ: 将棋

posted at 17:37:49

黒木玄 Gen Kuroki @genkuroki

16年10月20日

これはひどい話だな。>公立小学校司書「今年度から ラノベが禁止になった」 - Togetterまとめ togetter.com/li/1038842 @togetter_jpさんから

タグ:

posted at 16:55:27

HAYASHI Tomohiro @SokoranoKumasan

16年10月20日

本格的なプリンよりも、ゲル化剤でぷるぷるにされたプッチンプリンの方が好きで、チョコレートは光沢剤テラテラのチョコベビーとか明治アーモンドチョコとかが大好きなんですよね。昔から、甘さよりも食感が好きなのかも知れない。
オッサンになってるのに、未だにこの辺のお菓子が好き。

タグ:

posted at 16:49:56

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 人生は有限なので「論理的にも直観的にも全然理解していないが、使えてはいる」ということがあってもよいと思う。しかし、その場合には「自分は間違っているかもしれない」と常に不安に思い続ける必要があると思う。不安に思い続けることに成功していれば大して問題にならない。

タグ: 数楽

posted at 15:56:40

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 そして、私の経験では論理的な面倒を避けることを正当化したがる人は直観的にも明瞭に理解していないことが多い。明瞭な直観抜きでどのように数学的道具を使っているのだろうか?「論理も直観も捨ててよい。使えればよい」というのはかなり危ない。俗説やデマの拡散の側にまわるかも。

タグ: 数楽

posted at 15:54:59

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 Σ_{i,j}(O_{ij}-E_{ij})^2/E_{ij}型のカイ二乗統計量を理解するためには「ポアソン分布の直積における条件付確率分布」という発想をすると易しくなる。ピアソンのカイ二乗検定は、結論を認めて使うのではなく、きちんと直観的に理解してから使うべきだと思う。

タグ: 数楽

posted at 15:46:45

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 twitter.com/genkuroki/stat...
平均Eのポアソン分布に従う確率変数Oに対して(O-E)/√EはEが大きなとき標準正規分布で近似される。この結果を分割表で使うには、分割表の確率分布がポアソン分布の直積の条件付き確率分布になっていることを使えばよい。

タグ: 数楽

posted at 15:41:43

@noraneko0406

16年10月20日

@meglog2012 @Nobubon_law @bengo4topics 以前いた学校でも、「,」を使いたがるところはありましたが、全然大した問題ではないのに、通達するって、、、しかもその教頭、確固たる理由も説明できないんでしょうね。

タグ:

posted at 15:24:59

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 サンプルの推定分布を
Z_n(x_1,…,x_n)=∫p(x_1|w)…p(x_n|w)φ(w)dw
の形で与えるのがベイズ推定法。この確率分布によるサンプル生成は、まずパラメーターwを分布φ(w)に従って生成して、xの分布p(x|w)による独立試行をn回実行する。

タグ: 数楽

posted at 14:07:30

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 サンプルX_1,X_2,…,X_nの推定分布Z_n(x_1,…,x_n)が与えられていて、適切なコンパチビリティを満たしていれば、その次のX_{n+1}の予測分布がp_n(x)=Z_{n+1}(X_1,….X_n,x)/Z_n(X_1,…,X_n)の形で得られる。

タグ: 数楽

posted at 14:01:45

Haruhiko Okumura @h_okumura

16年10月20日

「本書では安易にモデル選択をすることに警鐘を鳴らす意味でも情報量基準を使う議論はしない」(p.24)いいぞいいぞ!

タグ:

posted at 13:53:59

Margaret @子どもを理不尽に慣れ @20margaret12

16年10月20日

娘にいじめっ子の罪の冤罪を着せた教頭が、PTAの文書は全て「、」ではなく「, 」を使用するよう通達していた。当初は疑問に思いつつも従っていたけど、やっぱりあの教頭は最初からおかしなヤツだったんだなと今は納得。 twitter.com/nobubon_law/st...

タグ:

posted at 13:44:59

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 Z_nを中心に説明することの利点:Z_nたちはベイズ推定法における推定結果のすべての情報を持っています。統計力学での類似物は分配函数。BIC系の情報量規準の理解にもZ_nの役割の理解が必須。Z_nの役割を知ればベイズの定理で肝腎のことが理解不可能なことも明らか。

タグ: 数楽

posted at 13:34:09

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き〜しかも、その推定結果(未知である真の確率分布の独立試行によって生成されるサンプルの確率分布の推定結果)のZ_nは決して真の分布とは一致しないものです。この事後分布の定義の有用性をベイズの定理を使って論理的に導くことは不可能。その辺についてずさんな解説が多い。

タグ: 数楽

posted at 13:13:53

奥山雄大(茨城県在住関西人) @yokuyama

16年10月20日

@windowmoon @acoela お金がキビシーですが、とりあえずイルミナのリードだけでも得ようかなとは考え中です。

タグ:

posted at 13:13:32

windowmoon @windowmoon

16年10月20日

@acoela @yokuyama 交雑した祖先種の血を引いてる種ですが、時間が経ってるので別物になってしまっている可能性もありますけどね。いずれにしろその2種のゲノムも欲しいですね。

タグ:

posted at 13:05:48

奥山雄大(茨城県在住関西人) @yokuyama

16年10月20日

@acoela はい。ぜひそれをやりたいと思っています。しかし、トランスポゾンがサブゲノム間で異なるというのは全く発想がありませんでした。言われてみれば確かに、2倍体種の種分化後にコピー数増加が起きた場合シーケンスベースでそれらが区別出来るはずで、まさに画期的な方法だと思います!

タグ:

posted at 13:05:26

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。もちろん、サンプルX_1,…,X_nから定まる事後分布φ_n(x)=p(X_1|w)…p(X_n|w)φ(w)/Z_n(X_1,…,X_n)を中心に説明することもできました。ベイズの定理で分母は真の確率(密度)なのですが、この式ではその推定結果になっている。しかも〜

タグ: 数楽

posted at 13:05:00

Keisuke_Hitachi @kei_sleep

16年10月20日

@acoela ありがとうございます。自分がやっていた遺伝子の転写調節領域の保存性等見てみようと思います。

タグ:

posted at 13:02:55

彦坂暁/Hikosaka Akira @acoela

16年10月20日

@yokuyama 祖先種が現生していて、それと比較できるというのは良いですね。

タグ:

posted at 13:02:50

彦坂暁/Hikosaka Akira @acoela

16年10月20日

@kei_sleep 全体としてみると、祖先種Sのサブゲノムより祖先種Lのサブゲノムの遺伝子の方がよく保持されていて、発現も強いという傾向があります。conserved noncoding elementsやメチル化の比較等も行われていますので、興味があれば見てみてください。

タグ:

posted at 12:57:53

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。上の方では、ベイズ推定をパラメーターwの事後分布の更新を経由せずに、周辺尤度という名の確率密度函数Z_n(x_1,…,x_n)=∫p(x_1|w)…p(x_n|w)φ(w)dwを用いて説明した。このZ_nをサンプルを生成する確率分布の推定結果とみなすのでした。続く

タグ: 数楽

posted at 12:56:48

奥山雄大(茨城県在住関西人) @yokuyama

16年10月20日

@acoela はい。十分あり得ると思います。植物と動物の違いなのかもしれませんが、とにかくゲノム再構成が酷そうな印象です。実はサブゲノムが由来する2倍体種が現生して、それらは今では別属に分類されるほど違うのですが、交雑した当初は互いにかなり近縁だった可能性はあります。

タグ:

posted at 12:54:58

彦坂暁/Hikosaka Akira @acoela

16年10月20日

@yokuyama 了解致しました。これはまさに私が担当したところなので、お役に立てるのであれば幸いです。

タグ:

posted at 12:45:09

彦坂暁/Hikosaka Akira @acoela

16年10月20日

@yokuyama 面白いですね。祖先種同士の近縁性が影響しないでしょうか? アフリカツメガエルでは2種の祖先種が分岐してから交雑するまでかなり(千数百万年)の時間が経っていたらしいので、サブゲノム間の組換えができなくなるほど染色体が分化してしまったのかもしれません。

タグ:

posted at 12:43:06

Keisuke_Hitachi @kei_sleep

16年10月20日

@acoela ツメガエルゲノム論文の出版おめでとうございます。まだプレスリリースしか読んでないのですが、サブゲノムの方の発現が少ない?とのことですが、サブゲノムの転写調節領域が欠損したり、DNAメチル化が増加していたりするのでしょうか?

タグ:

posted at 12:42:45

奥山雄大(茨城県在住関西人) @yokuyama

16年10月20日

@acoela ありがとうございます!もうひとつはトランスポゾンを利用したサブゲノムの識別法についてで、ぜひ同じような手法を自分も使えたらと思っていますが、こちらはもう少し論文を精読した後でお尋ねしたいと思います。

タグ:

posted at 12:36:48

奥山雄大(茨城県在住関西人) @yokuyama

16年10月20日

@acoela と言いますのも、こちらの材料だと明らかに異なるサブゲノムに由来すると考えられる重複遺伝子のセットが、連鎖関係にあったりすることがあるもので、それはどういうことなのか、よくあることなのかが気になっているためです。ちなみに染色体数はきちんと倍になってます。

タグ:

posted at 12:34:14

彦坂暁/Hikosaka Akira @acoela

16年10月20日

@yokuyama 染色体内での逆位等は何箇所か見られますが、トランスポゾンを指標にみる限り、サブゲノムの間での組換えはほとんど起きていないと思います。仮にあったとしても、ごく小規模だと思います。

タグ:

posted at 12:31:08

奥山雄大(茨城県在住関西人) @yokuyama

16年10月20日

@acoela ありがとうございます!もちろん全く急ぎません。

タグ:

posted at 12:27:17

奥山雄大(茨城県在住関西人) @yokuyama

16年10月20日

@acoela ひとつめは,サブゲノム間のシンテニーについてです。Fig.1を拝見したところ、かなりLS染色体間のシンテニーは保存されているように見受けられましたが、染色体の転座などはあまり起きていないと見ていいのでしょうか?

タグ:

posted at 12:25:33

彦坂暁/Hikosaka Akira @acoela

16年10月20日

@yokuyama 簡単なことならすぐ答えられると思いますが、難しい質問だと少しお時間を頂くかもしれません。明日の1コマの講義の準備をしているところですので…。すみません。

タグ:

posted at 12:24:32

彦坂暁/Hikosaka Akira @acoela

16年10月20日

@hiro_h サブゲノムの進化が非対称になるのが、どのくらい普遍的な現象なのか、とても興味があるところです。

タグ:

posted at 12:21:56

奥山雄大(茨城県在住関西人) @yokuyama

16年10月20日

@acoela 論文、ざっとですが大変興味深く拝見致しました。といいますのも僕も異質4倍体のゲノムを持つ植物の一群を扱っていて、まさにゲノムシーケンスを試みているためです(は言え、小さいチームですのでここまで高精細のものは困難ですが)。2つ質問があります。もしお時間があれば。

タグ:

posted at 12:18:34

彦坂暁/Hikosaka Akira @acoela

16年10月20日

当初の予定より随分長くかかってしまいましたが、無事に出版されてほっとしました。共同研究者の皆さんの多大な努力に、深く敬意を表します。

タグ:

posted at 12:17:29

【非公式】ひろ@猫もふ欠乏症 @hiro_h

16年10月20日

@acoela 魚で、重複した遺伝子の発現が異なる旨のポスターを見たこともあるので、一般に非対称なのが得なのかもしれませんね…

タグ:

posted at 12:17:27

ノフ @Nobubon_law

16年10月20日

弁護士はなぜ文章に「、」ではなく「,」を使いたがる? 弁護士39人の見解割れる|弁護士ドットコムニュース www.bengo4.com/saiban/1135/12... @bengo4topicsより
裁判の書面の中でもビジネスルールに近いものがあるのか…(驚愕)

タグ:

posted at 12:11:42

彦坂暁/Hikosaka Akira @acoela

16年10月20日

このL/Sの区別を基にして、共同研究者の皆さんによる詳しい解析が行われ、L由来のサブゲノムの方が二倍体種であるネッタイツメガエルのゲノムに良く似ており、S由来のサブゲノムの方でより多くの遺伝子が失われていることが分かりました。また遺伝子の使われ方に差があることも分かりました。

タグ:

posted at 12:09:34

彦坂暁/Hikosaka Akira @acoela

16年10月20日

このようにしてサブゲノムを区別してみた結果、とても面白いことが分かりました。2種の祖先から受け継いだ対応する染色体(同祖染色体という)同士を比べると、必ず一方の祖先種(祖先種Lと呼ぶ)由来の染色体が、他方の祖先種(祖先種Sと呼ぶ)由来の染色体よりも長いということでした。

タグ:

posted at 12:08:14

彦坂暁/Hikosaka Akira @acoela

16年10月20日

実際にそのような都合の良いトランスポゾン化石が存在するかどうかは、調べてみるまで確信はありませんでしたが、運良くそのようなトランスポゾン化石を3種類、見つけることができました。これが見つかった時はとても喜びました。

タグ:

posted at 12:07:25

彦坂暁/Hikosaka Akira @acoela

16年10月20日

そのアイディアは、2つの祖先種が互いに分かれていた時期にのみ、その一方の種だけで転移・増幅していたトランスポゾンの「化石」を見つけ、それをマーカーとして2つのサブゲノムを区別するというものでした。

タグ:

posted at 12:06:16

彦坂暁/Hikosaka Akira @acoela

16年10月20日

私はツメガエルのトランスポゾン(転移因子、動く遺伝子)の研究をしてきたので、これを用いてサブゲノムを区別できないかと考えました。

タグ:

posted at 12:05:45

彦坂暁/Hikosaka Akira @acoela

16年10月20日

アフリカツメガエルゲノムは、この問題に迫る有力な材料になると期待されました。解析を行う前提として、ゲノムのどの部分がどちらの祖先種に由来するのかを明らかにする必要があります。この共同研究で私が主に担当したのは、各祖先種に由来するゲノム(サブゲノム)を区別して見分ける作業です。

タグ:

posted at 12:04:38

彦坂暁/Hikosaka Akira @acoela

16年10月20日

たとえば脊椎動物の共通祖先において2回の全ゲノム重複がおき、それが脊椎動物の新奇性の進化の基盤となったと考えられています。したがって、全ゲノム重複のあとで、合体した2セットのゲノムがどのように進化していくのかは、進化学的にも非常に興味深い問題です。

タグ:

posted at 12:03:29

彦坂暁/Hikosaka Akira @acoela

16年10月20日

アフリカツメガエル(Xenopus laevis)は、異種交配と全ゲノム重複により、異なる2種の祖先ゲノムを合わせもった「異質四倍体」だとされていました。全ゲノム重複は生物の飛躍的な進化に結びつく機構の一つと考えられています。

タグ:

posted at 12:02:46

彦坂暁/Hikosaka Akira @acoela

16年10月20日

私も参加した、国際アフリカツメガエル・ゲノムプロジェクトによるゲノム解析論文が出版されました。共同プレスリリース: www.s.u-tokyo.ac.jp/ja/info/5056/

タグ:

posted at 11:51:28

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。その疑問を解消するためには「未知である真の確率分布に絶対に一致しないはずの設定を使うことによって未知の確率分布を効率よく推定できそうだ」ということの数学的証拠について知るしかないと思います。それが結構難しいことなので、ニセ哲学的でずさんな議論が流行する。

タグ: 数楽

posted at 09:24:51

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。その定義を見れば、ベイズ統計の導入時によく聞く「未知である真の分布は一つに決まっているのに、それを推定するための確率モデルのパラメーターの確率分布を考えてよいのか?」という疑問がわくのは当然だと思う。続く

タグ: 数楽

posted at 09:21:41

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 「サンプルを生成するたびに確率分布φ(w)にしたがって異なるパラメーターwを生成し、そのパラメーターwで決まる確率分布p(x|w)による独立試行でサンプルを生成している」と推定することに他ならないからです。未知である真の確率分布はサンプルを生成するごとに変わらない。続く

タグ: 数楽

posted at 09:17:35

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 未知の確率分布の独立試行で生成されたサンプルの確率分布をZ_n(x_1,…,x_n)=∫p(x_1|w)…p(x_n|w)φ(w)dwだと推定するのがベイズ推定法の正体なのですが、この定義を見た瞬間に違和感を感じる方が普通だと思う。なぜなら、この推定は〜続く

タグ: 数楽

posted at 09:14:36

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き
watanabe-www.math.dis.titech.ac.jp/users/swatanab...
に具体例があります。特異点がない正則な確率モデルでn=10000としても、まるで特異点がある場合のような事後分布の形になっている例が示されている。「n→∞なら特異点はないとみなせる」は現実にはフィクション。

タグ: 数楽

posted at 08:27:50

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 広中の特異点解消定理を使うことは数学的にも興味深いことですが、確率モデルが未知の確率分布についてたとえ正則であったとしても、nが有限の実験的なケースを適切に扱うためにも必要なことだったということのようです。

タグ: 数楽

posted at 08:23:02

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 サンプルサイズn→∞で成立する結果を有限のnに適用するときには当然注意が必要。n→∞で特異点の影響から逃れることができても有限のnではそうではないかもしれない。nが有限の実践的な場合には特異点の影響を考慮する必要がある。これも渡辺澄夫さんの発見だと思います。

タグ: 数楽

posted at 08:19:27

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 未知の確率分布を含まない確率モデルを使って得た予測分布のもっと複雑な例についてはリンク先の下の方の「具体的な例」を見てください。そこには予測分布の精度を高めるための事前分布の調節の仕方も説明されています。
watanabe-www.math.dis.titech.ac.jp/users/swatanab...

タグ: 数楽

posted at 08:13:15

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 カイ二乗分布しているかもしれない未知の確率分布を正規分布だと推定しようとすることはバカげていますが、推定したい未知の確率分布を含まない確率モデルでの推定がどういう感じになるかをつかむためにそのような例を出しました。

タグ: 数楽

posted at 08:04:53

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。例えば、確率モデルとして正規分布を採用すれば、適当な緩い仮定のもとで、予測分布はn→∞で未知の確率分布と平均と分散が等しい正規分布に近付く。添付画像は自由度5のカイ二乗分布とそれに平均と分散が等しい正規分布。 pic.twitter.com/P3UsU3H5OH

タグ: 数楽

posted at 08:01:21

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。そこそこ緩い仮定のもとで、未知の確率分布が独立生成したサンプルに基いて作った予測分布がサンプルサイズn→∞の極限で採用した確率モデルと事前分布のもとでのベストの推定結果に近付くことを証明できます。これが渡辺澄夫さんの定理の一つです。

タグ: 数楽

posted at 07:55:11

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 もとの話に戻る。出発点として採用する確率モデルp(x|w)と事前分布φ(w)は未知の確率分布をシミュレートするために人間が不確かな憶測によって準備するものなのですが、それらに条件付き確率(やベイズの定理)の式を機械的に適用してどれだけ妥当な推定が得られるのでしょうか?

タグ: 数楽

posted at 07:52:06

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 注意:以上の設定には、複雑な階層ベイズモデルの話も含まれています。設定がシンプル過ぎて、階層ベイズを含んでいないように見えるかもしれませんが、含んでいます。実践では複雑なことをしていても数学的記号法では数行で書けるくらいシンプルになるのは普通のことです。

タグ: 数楽

posted at 07:44:12

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。予測分布と未知の分布の違いの漸近挙動に基いて推定の妥当性を評価しようとするための道具が、最尤法版ではAICなどで、ベイズ推定版はWAICなどで、一個抜き交差検証LOOCVもその仲間。

タグ: 数楽

posted at 07:39:44

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 条件付き確率の式を機械的に適用すると、サンプルX_1,…,X_nが得られた後の次のX_{n+1}の確率分布の推定結果はp_n(x)=Z_{n+1}(X_1,…,X_n,x)/Z_n(X_1,…,X_n)になります。これをサンプルに基いて作った予測分布と呼びましょう。続く

タグ: 数楽

posted at 07:34:23

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。未知の分布が生成したサンプルX_1,…,X_nに基いてその推定がどれだけ妥当だったかを知るために、周辺尤度Z_n(X_1,…,X_n)の漸近挙動を利用するのがBICやWBICなどの立場です。続く

タグ: 数楽

posted at 07:28:10

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。x_1,…,x_nの確率分布Z_nをZ_n(x_1,…,x_n)=∫p(x_1|w)…p(x_n|w)φ(w)dwと定める。未知の確率分布で生成されたサンプルx_1,…,x_nの確率分布の推定としてZ_nを採用するのがベイズ推定法です。続く

タグ: 数楽

posted at 07:17:57

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。未知の確率分布(密度函数)q(x)によるサンプル生成をシミュレートするために、パラメーターw付きのxの確率分布p(x|w)とパラメーターwの確率分布φ(w)を任意に準備する。よいものを準備したいのだが、準備した時点ではよいものを選べたかどうかは不明。続く

タグ: 数楽

posted at 07:09:54

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 ベイズ推定法では、まずサンプルが未知の確率分布の独立試行で生成されていると仮定する。(この仮定は相当に強いのですが、独立性の仮定を外しても普遍的に通用する道具はまだない。) 次に未知の確率分布をシミュレートするためにパラメータ付き確率分布とパラメータの確率分布を準備する。

タグ: 数楽

posted at 07:00:59

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 どんなに優れた人であってもかなり致命的な感じで大事なことをひどく誤解していることがある。これは極めて普遍的な法則なのに、そういうことはあまりないかのようになっていると思う。難しいのはこの法則を自分自身に適用することだ。自分の頭を使うだけでは適用は無理だと思う。

タグ: 数楽

posted at 06:34:41

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 しかも、驚くべきことに、ベイズ統計についてそのようなつまらない怪しげな解説した人自身が、解説を聞いた人達による「ベイズ統計は怪しい」という感想が正しいことを認めていたりする場合も見つかる。それ、マッチポンプだろう!学生は大学での授業の注意するべきだ。

タグ: 数楽

posted at 06:28:35

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。正しい推論を導くはずが無さそうなことをやっているのに、どうしてベイズ推定法は有用なのだろうか?

私はこのようなストーリーにわくわくするのだが、ベイズ統計に関する俗流の解説はこういう面白そうな話をせずに、つまらない怪しげな話をしている。

タグ: 数楽

posted at 06:21:54

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。未知の確率分布を推測するために人為的に仮説を設定して、あたかも条件付き確率が定まっているかのごとく考え、ベイズの定理の式を機械的に適用していく。出発点の仮説は人間が勝手に設定したものなので、ベイズの定理の式の機械的適用は正しい推論には当然ならないだろう。続く

タグ: 数楽

posted at 06:17:41

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 ベイズ統計の仕組みについて解説する前に、確率分布が既知である場合を仮に考えて、条件付き確率やベイズの定理について説明しておくことは必要なことだと思う。しかし、実際にベイズ統計を適用するのは、未知の確率分布に切り込むために人為的な仮説を設定している場合である。続く

タグ: 数楽

posted at 06:12:47

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 ベイズ統計の仕組みに関する解説がまともかそうでないかは、ベイズの定理のような平易な定理の式の機械的適用がどうして有効なのかについてベイズの定理に頼らずに説明しようとしているかどうかで判定可能だと思う。ほとんどの解説はアウトなんじゃない?どうしてそんなことになったのか?

タグ: 数楽

posted at 06:07:29

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 続き。だから、未知の分布を推測するために人為的な仮説(事前分布だけではなく、確率モデルの設定も仮説に含まれる)を利用するときに、ベイズの定理の式を適用することの有用性を理解するためには、ベイズの定理の正しさに頼り切らずに、別の議論が必要になる。続く

タグ: 数楽

posted at 06:04:00

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 未知の分布が不明でかつ正しいかどうか不明な仮説を用いるケースはベイズの定理を適用できる前提が満たされておらず、ベイズの定理と同じ式の適用は正しい推論を与える保証はない。(現実にはほぼ絶対に正しい推論にならないと考えるべき。)続く

タグ: 数楽

posted at 06:00:25

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 再紹介
twitter.com/genkuroki/stat...
ベイズ統計に関する解説が「まとも」か「まともでない」かの境目の一つは、ベイズの定理の適用が正しい推論になるケースとそうでないケースを明瞭に区別しているか、していないか。続く

タグ: 数楽

posted at 05:56:36

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 算数レベルの具体的計算をほとんど何も知らずに一般的にどのようなことが成立しているかを勉強しようとするのはちょっと早過ぎると思う。

タグ: 数楽

posted at 05:44:43

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 WAICについて勉強するためには広中の特異点解消定理の証明について学ぼうとする人がいたとすると、その意気は素晴らしいですが、証明を学ぼうとする前に当然やるべきことをやっているかのチェックが必要。直接の計算で確認できる例をどれくらいしっているか?これ大事。

タグ: 数楽

posted at 05:40:43

黒木玄 Gen Kuroki @genkuroki

16年10月20日

#数楽 WAICの計算例を追加
ZIPモデルのWAICを計算してみた ito-hi.blog.so-net.ne.jp/2016-10-08-1

タグ: 数楽

posted at 05:36:26

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました