黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2017年12月24日(日)
何とかしたい方はちゃんとした産婦人科を受診することが1番大切です。
生理痛は和らげるべきものではありません。
完全に無くすべきものです。 twitter.com/seiritu1017/st...
タグ:
posted at 23:54:07
twitter.com/sugar57527/sta...
掛け算の順序で市教委と話し合ったときも、教え方や採点に対して意見があればまず担任に、そのあと校長に、とか言われた。それじゃあ問題は顕在化しないでいいように丸め込まれるのがオチ。
タグ:
posted at 23:49:57
昼間、嫁様が「旅人算って何のこと?」からググりはじめて、「お弁当を忘れて家を出たたかし君にお母さんが追いつくのはどこ?」的アレの中学お受験的呼び名だとわかったのだけど、そのいちいち名前のついた無数のバリエーションに地獄を垣間見た気分になるなど。例→ juken-sansu.net/tabibito/ #超算数
タグ: 超算数
posted at 23:00:33
@genkuroki ちなみに市街地距離を使う識別をしたい場合には分布形状からすべて違う用語で説明をするのでしょうか。「○○距離」という言い方をしてよければ、「市街地距離を使った」「マハラノビス距離を使った」「ユークリッド距離を使った」という言い方だけで済みます。その分野での説明の簡潔さの問題です
タグ:
posted at 22:59:48
@akinori_ito * 混合正規分布の各山ごとに別のマハラノビス距離が定義される。
* 混合正規分布の各山ごとに別の内積が定義される。
後者の文字数の方が少なくてかつみんな知っている内積という用語だけですみます。
タグ:
posted at 22:55:57
@akinori_ito 情報量的には
1つ山の正規分布の山の形状
=分散共分散行列
=内積
=そのノルム
=その単位球面
です(2つ目の等号の理解は正規分布の理解そのもので特に重要)。そこにさらに「マハラノビス距離」を付け加える必要はないと思います。しかしすでに広まった言い方なので使ってもよいとは思います。
タグ:
posted at 22:53:16
@genkuroki 距離ベースのパターン認識を考えると、距離尺度を変えることで識別全体の枠組みを変えることができるので、数学的にはその距離尺度自体に特別な名前をつけるほどではないとしても、ちょっと違う距離にそれぞれ名前がついていてくれたほうが使う方は楽です
タグ:
posted at 22:47:36
@akinori_ito 内積を与えることは ||x||=1 で定義される「単位円」を与えることとも同じなので、各山を違う「単位円」で表示していると言っても良いです。「単位円」と言いながら一般には斜めに傾いた楕円になる。そういう図はプレゼンテーションでよく見ます。「マハラノビス距離」という用語はいらない。
タグ:
posted at 22:42:22
@genkuroki 「マハラノビス距離による識別」というのは通常「クラスごとに異なる共分散を使った識別」ということを含意しています。「マハラノビス距離」という言い方を使わずに表記することは不可能ではありませんが、不便じゃないかなあ。
タグ:
posted at 22:42:15
@akinori_ito それはクラスターごとに二つの異なる距離を使っていることが原因です。
多変量正規分布の混合分布の各山ごとに別の内積のノルムがあるだけ。
「山ごとに別の内積があるだけ」なので、「マハラノビス距離」と言う必要はないと思います。
タグ:
posted at 22:36:19
@genkuroki しかしd(x,p_c1,Σ_c1)とd(x,p_c2,Σ_c2)でΣ_c1 ≠ Σ_c2 の場合にはBが超平面にならないことがあります。一般には2次の超曲面です
タグ:
posted at 22:23:49
@genkuroki クラスの数が2つのとき、d(x,y)がユークリッド距離ならばBは超平面です。d(x,y)がマハラノビス距離であってもd(x,p_c1)とd(x,p_c2)が同じ共分散を使えばやはりBは超平面です
タグ:
posted at 22:21:30
@genkuroki 入力ベクトルxをクラスc1またはc2に分類するときに、それぞれのクラスの代表点p_c1, p_c2を用意し、距離尺度dを使ってd(x,p_c1)とd(x,p_c2)を計算して、xを値が小さいクラスに分類するということをよくやります。B={x|d(x,p_c1)=x(x,p_c2)}が識別境界です
タグ:
posted at 22:18:49
数学とコンピュータⅡ advent calendarの投稿記事です。遅くなって申し訳ございませんでした。Python使用予定でしたが、すでに沢山のscriptが存在するので、Rで書きました。
連分数とplain RSA暗号の攻撃について|内場 崇之|note(ノート) note.mu/utaka233/n/n08...
タグ:
posted at 22:12:38
@akinori_ito 識別境界の定義がわからないのですが、識別境界がノルム||・||によって
||x|| = c
のような式で表されるならば、Euclidノルムでは円周(や球面)になります。
定義がどうであれ、「直線」と「2次曲線」の違いが出る理由は座標とは別にノルムの使い方に違いがあるからでしょう。
タグ:
posted at 22:11:40
@genkuroki このスライドの6ページ以降とか(きれいな図があります) research.cs.tamu.edu/prism/lectures...
タグ:
posted at 18:56:16
@genkuroki Euclid距離とMahalanobis距離は空間を線形変換しただけなのはその通りなのですが、パターン認識で距離尺度をMahalanobis距離にしてクラス固有の共分散行列を使うとEuclid距離とは識別境界の形が変わります。Euclidの識別境界は直線ですがMahalanobisだと2次曲線です
タグ:
posted at 18:52:44
「PyCallパッケージの入れ方」は非常に有り難いですね。多くのJuliaコードの紹介でいきなりusing PyCallとやるとエラーメッセージが出てしまう。この辺りがJuliaビギナーの生死の分かれ道かもしれないですね。 twitter.com/genkuroki/stat...
タグ:
posted at 16:08:22
ポアソン分布とRule of Three(統計学ワード) noirvan13.xsrv.jp/2017/12/24/%e3... pic.twitter.com/4x9VI6AOX5
タグ:
posted at 15:01:44
Python@IMFも認めた!日本の財政 @65Python
日本経済新聞「大機小機」でマトモな論者のひとり「カトー」氏のコラムです。
(大機小機)教育論議に論理と実証を:日本経済新聞 www.nikkei.com/article/DGKKZO...
タグ:
posted at 13:51:12
#統計 #JuliaLang
nbviewer.jupyter.org/gist/genkuroki...
ロジスティック分布の2通りの正規分布近似の比較
を更新した。
左側がKL情報量の意味でのロジスティック分布の最良正規分布近似の場合で、右側はsupノルムによる最良近似の場合。前者の方がロジスティック分布だと誤認してもらいやすい。 pic.twitter.com/B6Oi9ZujLr
posted at 13:01:17
#超算数 oshiete1.nifty.com/qa5520251.html
>【3.14の円周倍】になっちゃうんです。
「【3.14の直径倍】になっちゃうんです。」の間違い。つまらないミスで面白さが半減しているのが残念。「直径倍」に修正して読むと、じわじわくる。
タグ: 超算数
posted at 12:24:41
超算数(掛け算の順序等)の話題見てると、小学生の算数に式と答しか回答させないのが問題な気がしてきた。算数とは別に、言葉で説明させる数学が小学生にも必要なのではという気が。
タグ:
posted at 12:03:54
普通は、率で見ますけどね。
//…低所得層でも高負担な、税(公的保険料含む)負担率pic.twitter.com/1za8GYrQ7U twitter.com/Isseki3/status...
タグ:
posted at 11:50:46
「ニコ生シノドス」第1回「ホメオパシー騒動とニセ科学論争の行方」 - 荻上チキ×菊池誠×久保田裕|WEBRONZA - 朝日新聞社の言論サイト webronza.asahi.com/science/articl...
タグ:
posted at 11:50:44
“(カトー)”安定の日経の良心 / 他1コメント b.hatena.ne.jp/entry/s/www.ni... “(大機小機)教育論議に論理と実証を :日本経済新聞” htn.to/5VGnVDDr
タグ:
posted at 11:41:38
非公開
タグ:
posted at xx:xx:xx
#統計 赤池さんが
AIC (an information criterion の略記)
とはっきり書いている件(笑)については次のリンク先を参照。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 11:34:55
#統計
ismrepo.ism.ac.jp/index.php?acti...
統計的推論のパラダイムの変遷について
で赤池さんは「頻度主義 vs. ベイズ主義」というくだらない対立図式の原因は「理解が足りないこと」であったことを明らかにしています。現代の大学においても変な講義が結構あるので要注意。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 11:27:22
#統計 で、その赤池弘次さん自身による解説を我々は以下のリンク先のリンク先で読めます。日本語圏の関係者は必読だと言って過言じゃないと思う。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 11:22:17
#統計 Kullback-Leibler情報量がそのような意味を持っていることは、Sanovの定理(有限集合上の確率分布の場合にはとても易しい定理、証明は中心極限定理より易しい)と呼ばれています。私による解説が次の場所にある。
genkuroki.github.io/documents/2016...
タグ: 統計
posted at 11:08:42
これは全面的に支持。
・教育論議には論理と実証が欠けている
・「選択と集中」政策は負の効果しかなかった
・予算削減には断固として反対し有効に反論すべきだった twitter.com/kiyoshi_fujii/...
タグ:
posted at 10:54:18
#統計 Kullback-Leibler情報量(divergence)の意味での「距離」とL^∞距離(supノルムでの距離)の違いについては以下のリンク先を参照。
KL情報量の意味での「距離」は、確率分布pによる確率分布qのモンテカルロシミュレーションを行うときに適切な「距離」です。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 10:48:12
#統計 #JuliaLang #Anaconda #Jupyter
私によるAnaconda+色々のインストールの記録が次のリンク先にあります。
nbviewer.jupyter.org/gist/genkuroki...
これを見れば、Anaconda3のJupyterで、Python3, Julia, R, Ruby を使う方法がわかります。
タグ: Anaconda JuliaLang Jupyter 統計
posted at 10:42:08
#統計
www.procrasist.com/entry/23-dista...
を書くことには大変な手間がかかったと思う。
GitHubでは大量にJupyter notebooksが公開されている。
github.com/hokekiyoo/adve...
WindowsユーザーがちょっとPython+Jupyterを試してみたいならAnacondaをインストールするのが楽だと思う。
タグ: 統計
posted at 10:38:17
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
Robert Geller; ロバート・ @rjgeller
TBSサンデーモーニングは先週政府が公表した北海道の沖合の巨大地震予言を揺るがない真実のように報道した。
ファクトチェック:
1。予言は間違った「周期説」モデルに基づいているので無視すべきだ。
2。日本は地震国で、いつでもどこでも不意打ちに大地震発生があり得る。 pic.twitter.com/I4VgEtdoPU
タグ:
posted at 09:55:56
#統計 数学を教える職業の人は
www.procrasist.com/entry/23-dista...
のまとめを読んで、自分が数学を教えた人達がこういうものを将来必要とする可能性について知っておいた方がよいと思う。
どれだけ知っている?
知らないことが出て来たら素直に自分の無知を認めることが大事。
タグ: 統計
posted at 09:55:15
斉藤ひでみ・現職教師(西村祐二) @kimamanigo0815
内田良さんと何度かお話する機会があって、感じたのは、この人は名誉欲とか金銭欲で動いているのではないということだ。辛い立場に立たされている人の為に、という気持ちのみで、諸々の活動をなさっている。
信頼できるし、尊敬に値する。
僕もそうありたいと思う。 twitter.com/RyoUchida_RIRI...
タグ:
posted at 09:36:15
#統計
twitter.com/genkuroki/stat...
機械学習に登場する権威的な響きを持つ用語の多くは特別に名前を付ける必要がないほど数学的に単純な概念を意味するに過ぎない。
科学者や技術者は、つまらない権威を否定し、権威的な響きをするものを嫌い、単純でぶっちゃけた話をすることで社会貢献できる。
タグ: 統計
posted at 09:23:01
#統計 コメント
* ユークリッド距離とマハラノビス距離はどちらもユークリッド内積のノルムで定義された距離であり、「マハラノビス距離はユークリッド距離の特別な場合に過ぎず、座標の取り方の違いしかない」という理解をできると楽になる。続く
twitter.com/hokekiyoo/stat...
タグ: 統計
posted at 09:17:20
(大機小機)教育論議に論理と実証を:日本経済新聞 www.nikkei.com/article/DGKKZO...
日経は下らないと切り捨てるブロガーでも、大機小機のカトー氏の記事は人気あり
タグ:
posted at 06:04:23
これ微妙に実害を業界に及ぼすケースがあって、その手の薄い本や薄い記事に限って会社のお偉いさんの目に留まりやすく、周回遅れの内容を信じ込んだお偉いさんの号令で社内がめちゃくちゃになるみたいなこともあるらしいと聞く。内容が正しくても周回遅れの話題を流布させるのは勘弁
タグ:
posted at 01:25:52
薄い本とか薄い記事みたいな一般メディアで機械学習とか統計学の話題が出てきて問題に思うのは内容の真否もさることながら「最新の内容か否か」(周回遅れでないかどうか)という点。例えば2年前とかに既出の話題をさも「つい最近自分が見出した」みたいに堂々と書き立てる自称識者が結構多くてだるい
タグ:
posted at 01:22:17
#数楽 もちろん楕円函数なども普通に使えます。以下のリンク先ではヤコビの楕円函数を使って楕円曲線暗号で使われている楕円曲線のEdwards形式(の実型)をプロットしています。
twitter.com/genkuroki/stat...
タグ: 数楽
posted at 00:17:12
#数楽 WolframAlphaの使用例は私のtwilogに沢山あります。真似すれば色々出来るようになると思います。
twilog.org/genkuroki/sear...
タグ: 数楽
posted at 00:05:10
#数楽 高木貞治『解析概論』にある**定**積分の問題をWolframAlphaさんは**不定**積分のレベルで解いてくれます。
twitter.com/genkuroki/stat...
タグ: 数楽
posted at 00:03:45