黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2016年11月05日(土)
#喫煙 が肺がんの原因である事は良く知られています。一方 #COPD の原因である事を知らない人は多いでしょう。COPDは治療法がありません。COPD:chronic obstructive pulmonary disease (慢性閉塞性肺疾患まんせいへいそくせいはいしっかん) twitter.com/fdatobacco/sta...
posted at 22:42:23
データ解析・統計・機械学習のRSS @datasci_blogs
【Logics of Blue】 Rによる機械学習:caretパッケージの使い方 ift.tt/2eJrRAE
この記事では、R言語を使って機械学習法を効率的に実装することのできるパッケージ「caret」について説明します。
ニューラルネットワークにSV…
タグ:
posted at 22:17:15
この有名な言葉は、エルデシュではなく友人のAlfréd Rényi(アルフレッド・レニイ)が言った、というのは聞いていたが、はっきりエルデシュの文章の中で見いだせた。
エルデシュの膨大な論文のほとんどはレニイ研究所のサイトで読める:
www.renyi.hu/~p_erdos/
タグ:
posted at 20:55:15
「A. Renyiが『数学者はコーヒーを定理に変える機械である』と言った」
というエルデシュ本人による文章は
P Erdős, "Child Prodigies", Math. Competitions 8 (1995), 7–15.
最終ページ第2段落: pic.twitter.com/MzljLKTOIm
タグ:
posted at 20:46:59
まともな話だが間にネタが挟まるのもコクの一種か / 乱数にコクを出す方法について - Togetterまとめ togetter.com/li/1044668 @togetter_jpさんから
タグ:
posted at 20:24:16
頭おかしい(褒め言葉) RT @hak7a3: TeXでCコンパイラ作ったよー github.com/hak7a3/8cc.tex #texconf16 記念(自分は行ってない)
タグ:
posted at 18:34:27
須山敦志 Suyama Atsushi @sammy_suyama
ベイズ学習では確率分布は「不確かさ」を表現するために使われます。
ベイズの定理を紹介した後にいきなり
Θ*=argmax(p(X|Θ)p(Θ))
なんてのが良く出てきますが、一体なんのために確率使ったんだろう、っていう気持ちになります。
タグ:
posted at 16:51:48
須山敦志 Suyama Atsushi @sammy_suyama
ベイズの定理には「最大化する」とか「最小化する」なんて言葉は一言も書いてありません。変分ベイズなどの一部の近似手法では最適化が登場しますが、それ以外で「最適化」っぽい言葉(argmaxとか)が出てきたらそれらは全部勘違いです。
タグ:
posted at 16:49:09
須山敦志 Suyama Atsushi @sammy_suyama
かの人工知能の大御所でさえ、ベイズ推論を「確率が高いものを選ぶ」と言ってしまっていますね。。。
タグ:
posted at 16:44:25
Unity でレイマーチングするシェーダを簡単に作成できるツールを作ってみた - 凹みTips tips.hecomi.com/entry/2016/10/... こちらのツールで1シーン作ってみました。素晴らしすぎる! #unity #unity3d #shader #demoscene pic.twitter.com/ghIOpJsd00
タグ: demoscene shader unity unity3d
posted at 12:29:17
時々みる「かけ算の順序」の問題 (@genkuroki www.math.tohoku.ac.jp/~kuroki/LaTeX/... )かと思ったら、もっとすごい理由だった…。(ネタ元は鍵)→ 小2算数で『8×7+17=73』を担任教師が不正解にした驚愕の理由 vipper-trendy.net/sansuu-huseikai/
タグ:
posted at 11:57:48
@genkuroki さんの逆正弦法則の話の経路の数とカタラン数の話からそういや三次元とかでも?とか思ってググると何やら面白そうな話がある。とはいえゆっくり遊んでる時間がないから備忘録。全くもう備忘録ばかりで紙と鉛筆で遊ぶ時間がが、、、
タグ:
posted at 10:51:47
続き。監視ママ曰く、息子のキメ顔がいつも同じでキモい。ルーキーズみたいな顔。
ルーキーズを画像検索www
www.google.co.jp/search?q=%E3%8...
タグ:
posted at 10:00:37
引用続き
【監視ママ:私は家では『ネットに疎いふり』をしているので、まさか母親が見ているなんて夢にも思っていないでしょう。】
このおかあさん、すんげえ楽しそう。
タグ:
posted at 09:48:48
毎年、4月になると言っていたこと。(1)カルトの勧誘に気をつけること。(2)ツイッターで鍵をかけずに発言することは全世界への情報発信になること。全世界に自分より狡猾なやつがどれだけいるかを恐れた方が良い。しかもその狡猾なやつは身近にいるかもしれない。
タグ:
posted at 09:44:38
引用続き
【セブ山:〜複数アカウント〜が当たり前〜『すべて』とは言い切れないのでは?
監視ママ:いえ、すべてです。言い切れます。本アカウントから闇アカウントまで、さらに彼女と一緒に使っている共同アカウント、果ては歌詞アカウントまですべて知っています。】gkbr
タグ:
posted at 09:37:54
.
.@yukatan @genkuroki @omocoro 常に全校生徒すべては無理ですが、必要な時にはちょっと検索して二、三人たどれば大体把握できます。ツイッター鍵でも友人の返信でわかる場合や他のSNSにあげていた例もあります。
タグ:
posted at 09:35:45
母親はどこまで息子のTwitterを監視しているのか?|オモコロ omocoro.jp/kiji/95233/
【監視ママ:高校3年生です
セブ山:思春期真っ只中ですね。そんな息子さんのTwitterはどの程度、監視されているんですか?
監視ママ:すべてです】www
タグ:
posted at 09:34:39
グソクムシのティーバッグ、アマゾンでも扱いを開始いたしました。www.amazon.co.jp/dp/B01MRE9F9B pic.twitter.com/TVOZxpIBw2
タグ:
posted at 09:30:29
2016年11月04日(金)
Osaka.stanもう30人埋まってるの…嘘だろ…清水先生偉大すぎる。個人的には文系向けの数式の説明が聞きたい。力量不足で本では取り上げられなかった部分で、今後の参考にしたい…|『StanとRでベイズ統計モデリング』読書会 atnd.org/events/83097
タグ:
posted at 22:53:54
似鳥鶏 『育休刑事』角川文庫版発売中! @nitadorikei
申し訳ありませんがエスタックイブの「風邪でも、絶対に休めないあなたへ。」っていうコピーほんとやめてください。風邪薬で一時的に症状を抑えてもウィルスは周囲にバラ撒いてます。風邪をひいた人は休むべきなのです。病気を流行らせ周囲に迷惑をかける行為をCMで勧めないでください。
タグ:
posted at 22:24:00
@sekibunnteisuu @genkuroki 思い切り出遅れましたが、λが違うポアソン分布を足し合わせてもポアソン分布にはならないってのと、ポアソン分布たちのλがΓ分布に従う混合分布を考えると負の二項分布になるという事ですね。それでホームランの数がそこそこ合ったと。
タグ:
posted at 22:09:28
非公開
タグ:
posted at xx:xx:xx
@sekibunnteisuu @labidochromis
補足。安打だとμ/Nが2~3割と大きいのでポアソン分布での近似はまずい。
米大リーグでは統計学をかなり細かく利用しているようですが、日本のことは知りません。
タグ:
posted at 16:56:33
@genkuroki @labidochromis 「調子がいい」とか「スランプ」だとかは本当にあるのか、データを取らないと分からないように思います。ランダムでもそう見えてしまうことがあるでしょうし。
タグ:
posted at 16:54:24
@genkuroki @labidochromis なるほど。しかし、野球のデータを分析する専門家みたいな人、年俸を査定する人とか、対戦相手や自分のチームの状況を研究して戦略を立てる人とか、統計学的な定量的分析とかしているものなのでしょうかね?
タグ:
posted at 16:52:07
@sekibunnteisuu @labidochromis 「年間打席数がNで毎打席ごとに独立に確率μ/Nでホームランを打つ」だと二項分布なのですが、Nが大きければポアソン分布で近似されます。ポアソン分布の方が計算が楽なのでどうせどんぶり勘定なら積極的に近似した方が得。
タグ:
posted at 16:44:02
@sekibunnteisuu @labidochromis 現実には同じピッチャーに続けて複数回打席に立つと「目が慣れる」のような効果が発生するので独立ではないとした方がいい部分はあるかもしれない。個人のホームランはポアソン過程からどれだけ離れているんでしょうかね?
タグ:
posted at 16:37:56
@sekibunnteisuu @labidochromis 「年間打席数がNで毎打席ごとに独立に確率μ/Nでホームランを打つ」が「年間打席数Nで毎打席ごとに独立に投手i毎に異なる確率μ_i/Nでホームランを打つ」ならば独立性は保たれたままで打席ごとに分布が違う設定。
タグ:
posted at 16:35:29
@sekibunnteisuu @labidochromis 続き。ガンマ分布(個人差)+ポアソン分布(個人ごとのホームランの出方のモデル)=負の二項分布による推定結果はスライドのp.41。グラフを見るとポアソン分布(p.38)より改善してますが、p.39との比較でどうか?
タグ:
posted at 16:32:03
@sekibunnteisuu @labidochromis 続き。個人差の分布として採用したガンマ分布(p.39のグラフ)ですでにかなり現実のホームラン数の分布(p.37のグラフ)に近いように見えるのですが、ガンマ分布+ポアソン分布による推定の方がいいのかどうかが私の疑問。
タグ:
posted at 16:29:40
@genkuroki @labidochromis 対戦相手の投手が弱くて連続ホームランとかありえるとすると、独立とか行かないようにも思いますが、どうなんだろうか?安打だとその傾向はもっと顕著になりそうな気がする。安打ともなると独立ならポアソン分布というよりも二項分布かな?
タグ:
posted at 16:28:13
@sekibunnteisuu @labidochromis www.slideshare.net/simizu706/waic のp.37以降は、個人差無しのポアソン分布(p.38のグラフ)は現実のホームラン数の分布(p.37)からほど遠く、個人差を入れるともっとフィットするという話。
タグ:
posted at 16:26:34
@sekibunnteisuu @labidochromis 「年間打席数がNで毎打席ごとに独立に確率がμ/Nでホームランを打つ」という設定なら個人のホームラン数の分布は確かにポアソン分布で近似できるのだが…。
タグ:
posted at 16:23:26
@genkuroki @labidochromis いずれにしても、そんな具合にランダムに起きているのか、そうでないかの推定が出来るというようなイメージは何となくつかめました。
タグ:
posted at 16:21:41
@genkuroki @labidochromis 一人の選手が、ホームランを打ってから次にホームランを打つまで何打席を要するかの統計も取れば、調子がいいとか悪いとかが本当にあるかどうか分かるかと思ったけど、相手のピッチャーが優秀だと打てないとかなりそうなので、補正が必要かな?
タグ:
posted at 16:19:51
@sekibunnteisuu すでに @labidochromis さんが説明していますが、ポアソン過程とは「1/N時間毎に独立に確率μ/Nで電話が来る」のN→∞での極限。1時間で電話の来る回数がkになる確率はμ^k/(k! e^μ)になる。平均μ、標準偏差√μ.
タグ:
posted at 16:18:38
@genkuroki @labidochromis ありがとうございます。これがポアンカレ分布に従っていないと言うことは、ホームランを打つかどうかがランダムでたまたま運がよかった人がホームラン王になるということではない、と判断できると言うことでしょうかね。
タグ:
posted at 16:17:18
@sekibunnteisuu @labidochromis なんとなく、「ふつうの人」は「個人の実力でホームラン数が決まっている」と考えがちだと思う。個人のホームラン数はポアソン過程でよく説明できるのかな?標準偏差が√(ホームラン数)だと結構大きいと思うのだが。
タグ:
posted at 16:10:11
@sekibunnteisuu @labidochromis p.37,38のグラフはそういうことだと思います。p.37は横軸がホームラン数で縦軸が人数(5本幅)。p.38は「全員同じ個人差無しのポアソン分布」で推定した結果。
タグ:
posted at 15:57:37
SNSの使い方について「玄関に貼り出しても恥ずかしくないツイートを…」と説教するよりも、中高生には「親にバレてるよ」の方が効果的なのでは?と思い、書きました!読んでね!
「母親はどこまで息子のTwitterを監視しているのか?」
omocoro.jp/kiji/95233/
タグ:
posted at 14:52:03
@sekibunnteisuu @labidochromis これ、個人差+ポアソン分布による推定なんですが、個人差だけでの推定とどれだけ精度が違うんだろうか?
タグ:
posted at 13:32:13
@sekibunnteisuu @labidochromis そこそこもっともな推定ができるという話が www.slideshare.net/simizu706/waic の後半の話。
タグ:
posted at 13:21:57
@sekibunnteisuu @labidochromis それでは、選手ごとにホームラン数の期待値は違うと仮定するが、各選手はポアソン分布にしたがってホームランを打つと仮定して現実の分布に近い分布を出せるのか?続く
タグ:
posted at 13:17:13
@sekibunnteisuu @labidochromis 続き。選手全員の1シーズンに打つホームラン数の期待値は同じだと仮定して、ポアソン分布を適用すると全然合わない。まあ、選手ごとに打つホームラン数の期待値は違うので当たり前。続く
タグ:
posted at 13:14:34
@sekibunnteisuu @labidochromis 微妙に違う話になってしまうのですが、
www.slideshare.net/simizu706/waic
のp.37からプロ野球選手ごとのホームラン数の分布の推定の話があります。ホームランは稀に出るのでポアソン分布でまず推定してみる。続く
タグ:
posted at 13:12:34
#数楽 twitter.com/kikumaco/statu...
以上の話では、わざと話を面白くするために、モーメント母函数ではなく、モーメント達から対数正規分布が一意に決まらない話を紹介した。モーメント母函数と特性函数(逆フーリエ変換)が解析接続で繋がっていれば確率分布が一意に決まる。
タグ: 数楽
posted at 12:08:24
#数楽
twitter.com/kikumaco/statu...
確率分布の(逆)フーリエ変換(特性函数)からもとの確率分布は一意に決まる。
しかし、対数標準正規分布と異なる確率分布ですべてのモーメント達が等しいものを具体的かつ容易に作れる。詳しくはこのツイートの返答連鎖。
タグ: 数楽
posted at 11:49:13
#数楽 続き。「高次モーメント達の増大度が大き過ぎなければモーメント達でもとの確率分布は一意に決まる」という型の定理があります、簡単な説明が www.math.tohoku.ac.jp/~kuroki/LaTeX/... の注意10.12の後半にあります。続く
タグ: 数楽
posted at 11:09:19
#数楽
twitter.com/tsujimotter/st...
モーメントたちからもとの確率分布が一意に決まらない場合がある。例えば対数正規分布と異なる分布でモーメントがすべて等しいものを容易に作れる。解説が www.math.tohoku.ac.jp/~kuroki/LaTeX/... の注意10.12にある。続く
タグ: 数楽
posted at 10:59:02
tsujimotter 日曜数学者 @tsujimotter
統計不勉強なので知らないんですが、モーメント母関数が決まると確率分布って一意に定るんでしたっけ。どうなんだっけ。
タグ:
posted at 10:45:27
@labidochromis 結局あきらめました。連続した時間の中で瞬間的に起こる出来事がポアソン分布にならないなら、その出来事は互いに独立ではない、ということにはなりそうですが、独立でないならポアソン分布にならない、かどうかよく分からないです。
タグ:
posted at 10:24:17
アドビにおける機械学習: 声版のPhotoshop。録音した人の声を合成してその声で好きなセリフを言わせることが可能になる技術。 #AdobeMAX pic.twitter.com/AoikjChZH0
タグ: AdobeMAX
posted at 07:21:03
@gameryouiku 同感です。ただ、当人中心に考えれば同化と調節という概念でよいと思うのですが、環境側の変容も考える必要があると思いますので Arnold SameroffのThe Transactional Model of Developmentも参考になると思います。日本語文献ないですが。
タグ:
posted at 00:12:02