黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2016年11月04日(金)

Osaka.stanもう30人埋まってるの…嘘だろ…清水先生偉大すぎる。個人的には文系向けの数式の説明が聞きたい。力量不足で本では取り上げられなかった部分で、今後の参考にしたい…|『StanとRでベイズ統計モデリング』読書会 atnd.org/events/83097
タグ:
posted at 22:53:54


似鳥鶏 『育休刑事』角川文庫版発売中! @nitadorikei
申し訳ありませんがエスタックイブの「風邪でも、絶対に休めないあなたへ。」っていうコピーほんとやめてください。風邪薬で一時的に症状を抑えてもウィルスは周囲にバラ撒いてます。風邪をひいた人は休むべきなのです。病気を流行らせ周囲に迷惑をかける行為をCMで勧めないでください。
タグ:
posted at 22:24:00


@sekibunnteisuu @genkuroki 思い切り出遅れましたが、λが違うポアソン分布を足し合わせてもポアソン分布にはならないってのと、ポアソン分布たちのλがΓ分布に従う混合分布を考えると負の二項分布になるという事ですね。それでホームランの数がそこそこ合ったと。
タグ:
posted at 22:09:28

非公開
タグ:
posted at xx:xx:xx







@sekibunnteisuu @labidochromis
補足。安打だとμ/Nが2~3割と大きいのでポアソン分布での近似はまずい。
米大リーグでは統計学をかなり細かく利用しているようですが、日本のことは知りません。
タグ:
posted at 16:56:33

@genkuroki @labidochromis 「調子がいい」とか「スランプ」だとかは本当にあるのか、データを取らないと分からないように思います。ランダムでもそう見えてしまうことがあるでしょうし。
タグ:
posted at 16:54:24

@genkuroki @labidochromis なるほど。しかし、野球のデータを分析する専門家みたいな人、年俸を査定する人とか、対戦相手や自分のチームの状況を研究して戦略を立てる人とか、統計学的な定量的分析とかしているものなのでしょうかね?
タグ:
posted at 16:52:07

@sekibunnteisuu @labidochromis 「年間打席数がNで毎打席ごとに独立に確率μ/Nでホームランを打つ」だと二項分布なのですが、Nが大きければポアソン分布で近似されます。ポアソン分布の方が計算が楽なのでどうせどんぶり勘定なら積極的に近似した方が得。
タグ:
posted at 16:44:02

@sekibunnteisuu @labidochromis 現実には同じピッチャーに続けて複数回打席に立つと「目が慣れる」のような効果が発生するので独立ではないとした方がいい部分はあるかもしれない。個人のホームランはポアソン過程からどれだけ離れているんでしょうかね?
タグ:
posted at 16:37:56

@sekibunnteisuu @labidochromis 「年間打席数がNで毎打席ごとに独立に確率μ/Nでホームランを打つ」が「年間打席数Nで毎打席ごとに独立に投手i毎に異なる確率μ_i/Nでホームランを打つ」ならば独立性は保たれたままで打席ごとに分布が違う設定。
タグ:
posted at 16:35:29

@sekibunnteisuu @labidochromis 続き。ガンマ分布(個人差)+ポアソン分布(個人ごとのホームランの出方のモデル)=負の二項分布による推定結果はスライドのp.41。グラフを見るとポアソン分布(p.38)より改善してますが、p.39との比較でどうか?
タグ:
posted at 16:32:03

@sekibunnteisuu @labidochromis 続き。個人差の分布として採用したガンマ分布(p.39のグラフ)ですでにかなり現実のホームラン数の分布(p.37のグラフ)に近いように見えるのですが、ガンマ分布+ポアソン分布による推定の方がいいのかどうかが私の疑問。
タグ:
posted at 16:29:40

@genkuroki @labidochromis 対戦相手の投手が弱くて連続ホームランとかありえるとすると、独立とか行かないようにも思いますが、どうなんだろうか?安打だとその傾向はもっと顕著になりそうな気がする。安打ともなると独立ならポアソン分布というよりも二項分布かな?
タグ:
posted at 16:28:13

@sekibunnteisuu @labidochromis www.slideshare.net/simizu706/waic のp.37以降は、個人差無しのポアソン分布(p.38のグラフ)は現実のホームラン数の分布(p.37)からほど遠く、個人差を入れるともっとフィットするという話。
タグ:
posted at 16:26:34

@sekibunnteisuu @labidochromis 「年間打席数がNで毎打席ごとに独立に確率がμ/Nでホームランを打つ」という設定なら個人のホームラン数の分布は確かにポアソン分布で近似できるのだが…。
タグ:
posted at 16:23:26

@genkuroki @labidochromis いずれにしても、そんな具合にランダムに起きているのか、そうでないかの推定が出来るというようなイメージは何となくつかめました。
タグ:
posted at 16:21:41

@genkuroki @labidochromis 一人の選手が、ホームランを打ってから次にホームランを打つまで何打席を要するかの統計も取れば、調子がいいとか悪いとかが本当にあるかどうか分かるかと思ったけど、相手のピッチャーが優秀だと打てないとかなりそうなので、補正が必要かな?
タグ:
posted at 16:19:51

@sekibunnteisuu すでに @labidochromis さんが説明していますが、ポアソン過程とは「1/N時間毎に独立に確率μ/Nで電話が来る」のN→∞での極限。1時間で電話の来る回数がkになる確率はμ^k/(k! e^μ)になる。平均μ、標準偏差√μ.
タグ:
posted at 16:18:38

@genkuroki @labidochromis ありがとうございます。これがポアンカレ分布に従っていないと言うことは、ホームランを打つかどうかがランダムでたまたま運がよかった人がホームラン王になるということではない、と判断できると言うことでしょうかね。
タグ:
posted at 16:17:18

@sekibunnteisuu @labidochromis なんとなく、「ふつうの人」は「個人の実力でホームラン数が決まっている」と考えがちだと思う。個人のホームラン数はポアソン過程でよく説明できるのかな?標準偏差が√(ホームラン数)だと結構大きいと思うのだが。
タグ:
posted at 16:10:11

@sekibunnteisuu @labidochromis p.37,38のグラフはそういうことだと思います。p.37は横軸がホームラン数で縦軸が人数(5本幅)。p.38は「全員同じ個人差無しのポアソン分布」で推定した結果。
タグ:
posted at 15:57:37


SNSの使い方について「玄関に貼り出しても恥ずかしくないツイートを…」と説教するよりも、中高生には「親にバレてるよ」の方が効果的なのでは?と思い、書きました!読んでね!
「母親はどこまで息子のTwitterを監視しているのか?」
omocoro.jp/kiji/95233/
タグ:
posted at 14:52:03

@sekibunnteisuu @labidochromis これ、個人差+ポアソン分布による推定なんですが、個人差だけでの推定とどれだけ精度が違うんだろうか?
タグ:
posted at 13:32:13

@sekibunnteisuu @labidochromis そこそこもっともな推定ができるという話が www.slideshare.net/simizu706/waic の後半の話。
タグ:
posted at 13:21:57

@sekibunnteisuu @labidochromis それでは、選手ごとにホームラン数の期待値は違うと仮定するが、各選手はポアソン分布にしたがってホームランを打つと仮定して現実の分布に近い分布を出せるのか?続く
タグ:
posted at 13:17:13

@sekibunnteisuu @labidochromis 続き。選手全員の1シーズンに打つホームラン数の期待値は同じだと仮定して、ポアソン分布を適用すると全然合わない。まあ、選手ごとに打つホームラン数の期待値は違うので当たり前。続く
タグ:
posted at 13:14:34

@sekibunnteisuu @labidochromis 微妙に違う話になってしまうのですが、
www.slideshare.net/simizu706/waic
のp.37からプロ野球選手ごとのホームラン数の分布の推定の話があります。ホームランは稀に出るのでポアソン分布でまず推定してみる。続く
タグ:
posted at 13:12:34


#数楽 twitter.com/kikumaco/statu...
以上の話では、わざと話を面白くするために、モーメント母函数ではなく、モーメント達から対数正規分布が一意に決まらない話を紹介した。モーメント母函数と特性函数(逆フーリエ変換)が解析接続で繋がっていれば確率分布が一意に決まる。
タグ: 数楽
posted at 12:08:24


#数楽
twitter.com/kikumaco/statu...
確率分布の(逆)フーリエ変換(特性函数)からもとの確率分布は一意に決まる。
しかし、対数標準正規分布と異なる確率分布ですべてのモーメント達が等しいものを具体的かつ容易に作れる。詳しくはこのツイートの返答連鎖。
タグ: 数楽
posted at 11:49:13





#数楽 続き。「高次モーメント達の増大度が大き過ぎなければモーメント達でもとの確率分布は一意に決まる」という型の定理があります、簡単な説明が www.math.tohoku.ac.jp/~kuroki/LaTeX/... の注意10.12の後半にあります。続く
タグ: 数楽
posted at 11:09:19



#数楽
twitter.com/tsujimotter/st...
モーメントたちからもとの確率分布が一意に決まらない場合がある。例えば対数正規分布と異なる分布でモーメントがすべて等しいものを容易に作れる。解説が www.math.tohoku.ac.jp/~kuroki/LaTeX/... の注意10.12にある。続く
タグ: 数楽
posted at 10:59:02

tsujimotter 日曜数学者 @tsujimotter
統計不勉強なので知らないんですが、モーメント母関数が決まると確率分布って一意に定るんでしたっけ。どうなんだっけ。
タグ:
posted at 10:45:27

@labidochromis 結局あきらめました。連続した時間の中で瞬間的に起こる出来事がポアソン分布にならないなら、その出来事は互いに独立ではない、ということにはなりそうですが、独立でないならポアソン分布にならない、かどうかよく分からないです。
タグ:
posted at 10:24:17


アドビにおける機械学習: 声版のPhotoshop。録音した人の声を合成してその声で好きなセリフを言わせることが可能になる技術。 #AdobeMAX pic.twitter.com/AoikjChZH0
タグ: AdobeMAX
posted at 07:21:03

@gameryouiku 同感です。ただ、当人中心に考えれば同化と調節という概念でよいと思うのですが、環境側の変容も考える必要があると思いますので Arnold SameroffのThe Transactional Model of Developmentも参考になると思います。日本語文献ないですが。
タグ:
posted at 00:12:02