Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
並び順 : 新→古 | 古→新

2018年03月23日(金)

Hideyuki Tanaka @tanakh

18年3月23日

そもそも30ノード程度ならば、DPで厳密解をそれなりに求められるはずなんで、普通のマシンで1分もせずに厳密解が求まるぐらいだと思うんですよね。なんていうか、比較対象を(意図的に?)ずらして、実際の成果をわかりにくくするのは、なんていうか、評価するのも難しくなるだけだと思うんだけど…。

タグ:

posted at 23:33:29

Hideyuki Tanaka @tanakh

18年3月23日

まず8億年というのは、ブルートフォースでの話だろうけど、枝狩りをすればはるかに速くなるだろうし、アニーリングで求めるのは実質的には近似解だから、秒数の比較に何の意味があるのだろうとか、スパコンでも疑似焼きなましすればわずか30ノード程度なら普通に1秒でそれなりに良い解出ると思う。

タグ:

posted at 23:33:29

Hideyuki Tanaka @tanakh

18年3月23日

>組み合わせ最適化問題の代表例が(略)「巡回セールスマン問題」だ。(略)30都市だと1京×1京通りと、総当たりだとスパコンでも8億年かかる。これがデジタルアニーラ、アニーリングアプローチだと最適に近いルートを1秒以内に見つけることができる。

同じ問題解いてないのにこの比較はなあ(´・_・`)

タグ:

posted at 23:33:28

チキささ @c_ssk

18年3月23日

七生養護学校で起きたこと soafrica.exblog.jp/19275285/ 高校の性教育授業にイチャモンつけた古賀俊昭都議は、この裁判で損害賠償を命じられている。教員が知的障害を持つ生徒たちに向けて考え抜いた授業を罵り、当時の校長を降格させた男。

タグ:

posted at 22:24:05

Podoro @podoron

18年3月23日

@noricoco と読書については真逆の結果が出ている点が興味深いです。
御著書やインタビュー記事等では、読解力と読書の関係について、PISA研究などの先行研究との相違には触れていらっしゃらないですが、RSTプロジェクトではこの結果の違いについてどう考えていらっしゃるのかお聞き願えますでしょうか。3/

タグ:

posted at 22:13:40

Podoro @podoron

18年3月23日

@noricoco RSTとPISAが測る「読解力」の違いは情報研の資料でも触れられていますが、www.nii.ac.jp/news/release/2...
測っている「読解力」が異なり、「読書」についてもアンケート内容が異なるとは言え、RST・PISA成績のどちらもSESとは相関が有る一方で、RST成績は読書と相関なし、PISA成績はSES以上の強い相関、2/

タグ:

posted at 22:12:37

Podoro @podoron

18年3月23日

@noricoco RST論文と著書読ませて頂きました。「読解力と読書の関係」についてですが、RST成績は「読書が好きかどうか」との相関はなかったとの結果ですが、一方で、PISAの「読解力」の成績は「読書習慣(reading engagement)」と強い相関があるという研究結果をOECDが出しています。1/www.oecd-ilibrary.org/education/read...

タグ:

posted at 22:12:10

積分定数 @sekibunnteisuu

18年3月23日

@genkuroki @hideokotani @y__hiroyuki @odg1967 「正方形は長方形ではない」とすると混乱する子はいないのでしょうか?
教科書の定義はどう見ても、正方形は長方形の条件を満たしています。

↓に教科書の画像あり
togetter.com/li/1207866

タグ:

posted at 22:11:05

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@hideokotani @y__hiroyuki @odg1967 私のツイログを検索して下さい。正確な引用+解説が大量にみつかるはずです。

私からも質問させて下さい。

もしかして、学習指導要領解説算数編が従うべき素晴らしい内容だと思って引用したんですか?

学習指導要領解説算数編がはクズ著作物ではあるが従うべきだと誤解していたのなら問題無し。

タグ:

posted at 21:46:09

Sadayuki Furuhashi @frsyuki

18年3月23日

ほう、PostgreSQLがLLVMベースのJITを備えるとな。それは良いアイディアなのでは。そのままLLVM IRをcudaコードにコンパイルしたり、いっそ共有バッファをグラフィックメモリに置いちゃうとかしたら面白いのでは。

タグ:

posted at 21:39:08

小谷英生 @hideokotani

18年3月23日

@genkuroki @y__hiroyuki @odg1967 当初の話とのマッチングがズレているので、もう僕の話とは関係がなくなったのですが、せっかくなので教えて下さい。「ひどい」とは具体的にどういう意味でしょうか??

タグ:

posted at 21:22:34

Nerd Akiba @rabbi_akiba

18年3月23日

借金を次世代に残すなと言いつつ、目の前の若者を締め上げ、萎縮させて少子化を加速させてる。それが分からない人々がいかに多いことか twitter.com/genkuroki/stat...

タグ:

posted at 21:11:47

@1uo

18年3月23日

@tmiya_ 【基本的な計算問題】
答だけを回答欄に書く。

タグ:

posted at 20:55:55

非公開

タグ:

posted at xx:xx:xx

@1uo

18年3月23日

@tmiya_ 【式ではなく考え方】
#超算数 のように式に
意味があって順番固定、
その解答を求めてない。
そんな #忖度 はしない。
式で表現できないなら、
文章で書いて良いです。
-
解答例の公表と説明会、
採点基準は公表される。
守秘義務違反ではない。

タグ: 忖度 超算数

posted at 20:53:57

積分定数 @sekibunnteisuu

18年3月23日

@ysmemoirs 例題を1問だけ出してすぐ下にやり方が書いてあったら、「最初に問題を出して,そこから解法を浮かび上がらせるようにする体裁」ではないでしょうね。

試行錯誤・虱潰しで何とか解くというのを沢山やるなかで効率的な方法を浮かび上がらせる、としないと。

タグ:

posted at 20:49:36

@1uo

18年3月23日

@tmiya_ 【入試説明会では】
「考え方」は「答」
の2倍の配点します。
「考え方」が空白で
「答」があってれば
「答」の得点はある。
「考え方」の記入は、
採点者を無知と考え、
ていねいに説明する。
問題にある数字から
始めて計算の過程は
式または文章で表記、
飛ばしていれば減点。
そのように説明した

タグ:

posted at 20:46:51

dc1394 @dc1394

18年3月23日

plumbeneの計算の自動化のために、初めてJuliaを使ってみたけど、Juliaって構文はRubyに似てるのね。(配列のインデックスが1から始まることを除けば)使いやすい言語だと思った。

タグ:

posted at 20:44:49

黒木玄 Gen Kuroki @genkuroki

18年3月23日

その問題について同時に読むべきなのは以下の2つ

gendai.ismedia.jp/articles/-/54755
政府統計「失業率急低下」は本当なのか? エコノミストが検証
安達 誠司

traindusoir.hatenablog.jp/entry/2018/02/...
アベノミクス以降の労働力率
ラスカルの備忘録

以下のリンク先のスレッドで紹介した。
twitter.com/genkuroki/stat...

タグ:

posted at 20:40:28

黒木玄 Gen Kuroki @genkuroki

18年3月23日

最近の話題でゆるく興味を持っていることは、「我々が見ていた失業の指標は雇用に関する現実の状況をうまく表現できていないのではないか?」という疑問。

完全失業率が数字の上では相当に下がって来たのに物価水準が好調に上昇する気配がない。見るべき数字が見えていないのではないか?

タグ:

posted at 20:40:28

斉藤久典 @saitohisanori

18年3月23日

フジテレビが国会議員を集めて「日本の借金をなくすには?」という、とんでもない放送をやってる。バカすぎる。

タグ:

posted at 20:39:49

黒木玄 Gen Kuroki @genkuroki

18年3月23日

消費税率引き上げの悪影響がそのまんま残っている点は安倍政権の大失策。あれは何としても防ぐべきだったんじゃないか?しかし、終わったことはどうにもならない。

で、何が怖いか。

自民党内部にいる緊縮財政+反金融緩和路線の有力者達。そういう人達が政権トップに立ったらどうするの?

タグ:

posted at 20:33:36

黒木玄 Gen Kuroki @genkuroki

18年3月23日

自己RT終了。現在の我々なら、私がどうなることを心配していたかがわかると思う。その通りになっていると思う。

お金を十分に刷れば雇用に好影響があることは安倍晋三氏とは何も関係がない。誰がやってもそうなる。緊縮気味の安倍政権のもとでも就業者数が増えまくっている。金融政策の影響は巨大。

タグ:

posted at 20:30:37

黒木玄 Gen Kuroki @genkuroki

18年3月23日

自分のツイログを検索したら、リフレ政策の意味で「アベノミクス」という言葉を使うことへの不快感の表明を繰り返していて面白かったので、自己RTしまくります。2014年終わり頃の話。

それから3年ちょっとたちましたが、是々非々でないクズな攻撃に巻き込まれて、恐ろしく怖い状況になっている。

タグ:

posted at 20:24:17

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@Zoukers ちょっと遅れてしまいましたが、補足、ありがとうございます。
就業者数が増えているという点は非常に重要ですよね。

完全失業率は就職をあきらめる人が増えても下がるし(民主党政権時代)、就職率は人口要員でも上がる可能性がありますが、就業者数の上昇はそれでは説明できない。

タグ:

posted at 20:17:38

Kohta Ishikawa @_kohta

18年3月23日

いつも言ってるけど、コードは1行いくらで計算されるのに、式変形が1行いくらにならないのは割とマジでおかしいと思う。1行でコード数百行分くらい高速化したりするのに。

タグ:

posted at 20:13:28

とーふや @toofuya

18年3月23日

@genkuroki 娘(もうすぐ小4)が小学校や塾で習ってくることを微妙に調整せざるを得ず、なかなか大変です。(でも、それもまたいい教育かなとも思いますけども)

タグ:

posted at 19:47:52

Baatarism/ちゃんぷるー @baatarism

18年3月23日

“「花粉を水に変えるマスク」根拠論文を批判したら医学部教授から集団訴訟と脅された「騒動」 - 左巻健男&理科の探検’s blog” htn.to/AgNTXf

タグ:

posted at 19:08:59

けろっと @kerotto

18年3月23日

掃除ロボットのウィークポイント pic.twitter.com/fYVdROWYN9

タグ:

posted at 18:50:38

非公開

タグ:

posted at xx:xx:xx

にしもん @d_nishiyama85

18年3月23日

人々、Julia言語を数値計算から始めがち

タグ:

posted at 18:22:48

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@hideokotani @y__hiroyuki @odg1967 私は子供が直接見る算数教科書の2011年版を6社全部確認したのですが、「教科書自体がひどい」という結論以外になりようがない。私が見逃していた大量のやばい部分をみんなに教えてもらった。

* 学習指導要領解説算数編



* 算数教科書とそのマニュアル本

の内容がひどい。

タグ:

posted at 18:22:44

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@hideokotani @y__hiroyuki @odg1967 学習指導要領の記述は正方形も長方形に分類できる子を否定していません。否定しているなら、あのひどい教え方を学習指導要領のせいにできますが、それは不可能です。

タグ:

posted at 18:20:55

ゆーさぼ @Yu_3105_5

18年3月23日

パッとjulia見たけど俺みたいなR言語かじりにも優しいっぽいこれ

タグ:

posted at 18:17:38

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@hideokotani @y__hiroyuki @odg1967 私がよく知っている小学生は、小2算数教科書にある定義を声に出して呼んで、「正方形は角がみんな直角だから長方形!」と繰り返し喜んで言ってました。かわいいものです。

twitter.com/genkuroki/stat...

タグ:

posted at 18:15:01

小谷英生 @hideokotani

18年3月23日

@genkuroki @y__hiroyuki @odg1967 返信ありがとうございます!仰る通りですが、学習指導要領本体でも「身の回りにあるものの形についての観察や構成などの活動を通して」とあります。www.mext.go.jp/a_menu/shotou/...

タグ:

posted at 18:13:48

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@hideokotani @y__hiroyuki @odg1967 おそらく、教師個人を責めても、算数に関するデタラメな教え方の問題は解決できず、算数教育界での上位に属する人達をきちんと批判しないとどうにもならないと思います。

教師に算数の教え方を指南する立場の人達が、独自の非常識な算数もどきの分野を作成して、教える仕組みになってしまっている。

タグ:

posted at 18:10:04

TibicenLeibniz @ucciuccini

18年3月23日

電気ひざ掛けの上がお気に入りで、ワシのヒザの上でゴロゴロいいながらモミモミをするふく猫。おかあちゃんの記憶がよみがえるか? pic.twitter.com/4NR4j7CmhA

タグ:

posted at 18:09:41

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@hideokotani @y__hiroyuki @odg1967 子供の保護者達は以下の事実に注意を払うべきです。

* 学習指導要領解説算数編の内容はひどい。
* 教師はそれに従う義務はない。
* 教育関係者は学習指導要領とその解説を混同している。
* 算数教科書のマニュアル本の内容はひどい。
* 教育関係者はそれを根拠にひどい教え方をしている。

タグ:

posted at 18:06:19

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@hideokotani @y__hiroyuki @odg1967 さらに某教育委員会は、さらに従う義務が皆無であることが明瞭な、算数の教科書のマニュアル本(教科書出版社の著作物)も引用して来ました。

私は、一般人の目に触れることがない教科書のマニュアル本の内容がひどいことも知っていたので、言いくるめられずに済みました。

タグ:

posted at 18:03:03

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@hideokotani @y__hiroyuki @odg1967 私が教育委員会にある件について問い合わせたら、「学習指導要領によれば」と書きながら、それとは全く異なる文書である学習指導要領解説を引用した回答が返って来て呆れたことがあります。

学習指導要領解説算数編はひどい内容なので、従う義務がないのに従うのは馬鹿げています。

タグ:

posted at 18:00:43

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@hideokotani @y__hiroyuki @odg1967 文科省のウェブサイトに、学習指導要領解説は文科省のいち著作物に過ぎず、学習指導要領と同様の拘束力を持つと誤解されないように「指導書」から「解説」というタイトルに変えたとはっきり書いてあります。

twitter.com/genkuroki/stat...

タグ:

posted at 17:56:22

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@hideokotani @y__hiroyuki @odg1967 twitter.com/hideokotani/st...

そのリンク先は学習指導要領ではなく、その学習指導要領解説に過ぎません。

学習指導要領と学習指導要領解説は厳密に区別されるべき文書です。

学習指導要領解説は文科省のいち著作物に過ぎず、教師はその内容に従う必要はありません。

証拠に続く

タグ:

posted at 17:53:15

非公開

タグ:

posted at xx:xx:xx

吉田弘幸 @y__hiroyuki

18年3月23日

正しく教えることで混乱を来すのであれば,教える時期を検討し直すか,混乱を覚悟して正しく教えるべきと言うのが私の意見です。
そうしないと,正しく理解した生徒までが誤解したり,わざと間違えるようになります。

タグ:

posted at 17:35:09

吉田弘幸 @y__hiroyuki

18年3月23日

学習指導要領も読みました。そこには細かい扱い方は記載されていません。
そして,教科書には正方形の正しい定義が示されています。ところが,例題や業者テストではわざわざ「誤り」の解答が示されているのは不可解です。その理由を知りたいと思っています。

タグ:

posted at 17:35:09

吉田弘幸 @y__hiroyuki

18年3月23日

丁寧な説明をありがとうございます。
うちの子は,習い始めの頃は正方形も長方形に分類していました。しかし,学校の授業が進むに連れて教科書や周りに合わせて正方形は長方形ではないと扱うようになりました。これを問題視していますが,教員の責任ではなく制度(政策)に問題があると思っています。 twitter.com/hideokotani/st...

タグ:

posted at 17:35:08

北大IT研究会 HUIT @huitgroup

18年3月23日

今日は、
先週からの企画の参加者の制作物を見せ合い、コードの簡単な説明をしました。

・カプセルネットワーク
・Rustで書くWebサーバ
・Juliaでdeeplearning + tensorflowチュートリアル
・フリマWebサイト

4/6(金)に発表・説明・コードレビューするので、興味のある方はぜひ見学に来てください!

タグ:

posted at 17:32:02

Haruki Nishimura @imp_aa

18年3月23日

Juliaでcpu12コアとかなのにコア数以上のプロセス(30個とか)追加して並列計算させたら内部で何が起きるんだろう。

タグ:

posted at 17:05:33

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 こんな感じで、回帰モデルを含む p(y|x,w) 型の一般的な確率モデルでAICを正当化することは易しい。だから、「回帰モデルにおけるAICの使い方について質問しているのではない」と言った。

よくわからないのは、時系列モデルでのAICの使い方について。みんな理解せずに使っていたりしないか?

タグ: 統計

posted at 17:00:02

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 以上の議論は、データとしてはランダマイズされていない説明変数のX_i達を確率分布 p(x) を任意に選んでランダマイズすることによって、データ (X_i,Y_i) を (x,y) に関する確率分布の独立試行で生成されたとみなすことに相当している。p(x)の取り方の恣意性はモデル選択に影響しない。

タグ: 統計

posted at 17:00:01

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 異なる p(y|x,w) で同じ p(x) を使うことにすれば、その第2項

-2Σ_{i=1}^n log p(X_i)

は p(y|x,w) によらない共通のゆらぎ成分とみなせ、AICの比較におけるモデル選択に影響しない。だから、モデル選択では第2項の

AIC[p(y|x,w)]

を使えば十分。これで p(y|x,w) のAICを正当化できた。

タグ: 統計

posted at 17:00:01

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 そこで任意の確率分布 p(x) を持って来て、p(x,y|w)=p(y|x,w)p(x) によって(x,y)の確率分布を作って、これのAICの標準的定義

AIC[p(x,y|w)] = -2Σ_{i=1}^n log p(X_i, Y_i|w^*) + 2d

を考える。これは

AIC[p(x,y|w)] = AIC[p(y|x,w)] - 2Σ_{i=1}^n log p(X_i)

と変形できる。

タグ: 統計

posted at 17:00:01

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 仮のAICの定義を

AIC[p(y|x,w)] = -2Σ_{i=1}^n log p(Y_i|X_i,w^*) + 2d

とする。ここで

w^* = arg max Σ_{i=1}^n log p(Y_i|X_i,w^*).

これだと説明変数という名のパラメーターも動くので「異なる確率分布の尤度の和」を使っていることになる。

タグ: 統計

posted at 17:00:00

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 以下で回帰の場合のAICの定義と解釈の仕方について説明します。

より一般に、説明変数xとパラメーターw (w内のパラメーターの個数はd個とする)を持つyの確率分布p(y|x,w)を考えます。データは説明変数xとyの組(X_1,Y_1),…,(X_n,Y_n)になる。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 17:00:00

非公開

タグ:

posted at xx:xx:xx

非公開

タグ:

posted at xx:xx:xx

OokuboTact 大久保中二病中年 @OokuboTact

18年3月23日

今日の日経平均の下がり方が話題だけど、しかしここ半年の為替が円高傾向の方向がヤバいと思う。10円くらい円高 pic.twitter.com/fg45bBTF8U

タグ:

posted at 16:52:58

非公開

タグ:

posted at xx:xx:xx

非公開

タグ:

posted at xx:xx:xx

非公開

タグ:

posted at xx:xx:xx

非公開

タグ:

posted at xx:xx:xx

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 統計学的には、AICの絶対的値には意味がなくて、それらの差だけが意味を持っているのだから、最初から「AICの差」で統一的に考えるべきだった。そうした方が数学的にも自然だった。

タグ: 統計

posted at 16:31:54

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 数学の本を字面通り忠実に読んでそれを受け入れるような読み方はよくないといつも強調しているのですが、やはり難しい。いつでも、どの段階でも「ああ、本当に何もわかってなかった」と感じ続けなければいけない。逆に言えば「以前よりちょっと理解が進んだ」ということなので嬉しいのですが。

タグ: 統計

posted at 16:28:37

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 真の分布q(y)はパラメーター数0の確率モデルとみなせ、その対数尤度の-2倍はそのAICそのものです。だから、「共通のゆらぎ」を引くという発想にするのではなく、「AICの差」になっていることに気付くべきだった。気付けばより自然な一般化は易しいです。

タグ: 統計

posted at 16:28:36

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 数学的に強烈な「わかってなかった」感が伴うのは以下のリンク先の発言の「AICから共通の揺らぎを引いたもの」。「共通の揺らぎ」は真の分布q(y)の対数尤度の-2倍のことです。

より自然に聞こえる定式化はこのスレッドの文脈の意味での「AICの差」の方です。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 16:28:36

非公開

タグ:

posted at xx:xx:xx

非公開

タグ:

posted at xx:xx:xx

デス原子力塩太郎 @pmx003_the_o

18年3月23日

“「道徳の教材は江戸しぐさの真偽を教えるものではない。正しいか間違っているかではなく、礼儀について考えてもらうのが趣旨だ」” これが文科省の正式解答だっつーんだから語るに落ちるとしか言いようがない / “それは偽りの伝統 教材に…” htn.to/i4GKiC

タグ:

posted at 16:24:18

非公開

タグ:

posted at xx:xx:xx

まき @mash_2011

18年3月23日

@genkuroki @AS_Insects 黒木さんの仰る通りです。
本当にお体大事にしてください💦

タグ:

posted at 16:16:09

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@AS_Insects @mash_2011 >ゲホゲホ

ほんと、体は大事にして下さい。

タグ:

posted at 16:15:08

非公開

タグ:

posted at xx:xx:xx

非公開

タグ:

posted at xx:xx:xx

まき @mash_2011

18年3月23日

@AS_Insects @genkuroki 小包中納言さんはもうご自宅に戻られたのですか?まだ入院中では?😨💦
無理されませんよう💦

タグ:

posted at 16:11:19

非公開

タグ:

posted at xx:xx:xx

まき @mash_2011

18年3月23日

@genkuroki 黒木玄さんの仰る民主党政権時代の就業者数とは、大学生に限らない全年齢のお話ですか?

私は最初から書いている通り、そして先程も申し上げた通り、大学生(学部)の就職内定率がリーマンショック以降底まで落ちた後に好転した話をしています。
話が噛み合っていませんね👀💧

タグ:

posted at 15:41:13

杉山真大@震災被災者 @mtcedar1972

18年3月23日

@genkuroki だって、 #アベノミクスによろしく amzn.to/2GhPBgn の様な過激な緊縮財政と更なる負担増を甘受すべきという主張 midori-tomo.at.webry.info/201711/article... が少なからず受け入れられているからなぁ。

タグ: アベノミクスによろしく

posted at 15:37:28

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@mash_2011 民主党政権時代には就業者数が増えていません。

きちんと複数の数字をチェックすれば、本当に雇用が改善し始めたのは2013年以降である可能性が高いことがわかります。

民主党政権時代の失業率の低下は就職をあきらめる人が増えたことが原因。これもひどい話。

タグ:

posted at 15:29:06

まき @mash_2011

18年3月23日

@genkuroki さっき小包中納言さんからデータの出所についてお問い合わせを頂きましたので、こちらにも再掲させて頂きます。
よろしかったらご参考にしてください。
mobile.twitter.com/mash_2011/stat...

タグ:

posted at 15:27:55

まき @mash_2011

18年3月23日

@genkuroki 以上の通り、私は就職率がこれで十分とは申し上げていません。
十分かどうかの議論もしていません。

それなのに黒木玄さんが、まるで私がこれで就職率が十分と主張しているかのように議論をすり替えた上で私のツイートをおかしいと仰るのは、実に残念な態度ですね😢

mobile.twitter.com/genkuroki/stat...

タグ:

posted at 15:23:40

まき @mash_2011

18年3月23日

@genkuroki きくまこさんは安倍政権以降すなわち政権発足の2012年12月以降に劇的に好転していると仰っていますが、それは77.4%(2011年)→80.5%(2012年)の好転を指していると思われました。
しかしこの80.5%の好転は、2012年の2月の時点のデータであるため安倍政権発足より少し前の事だと指摘した次第です😊

タグ:

posted at 15:19:31

非公開

タグ:

posted at xx:xx:xx

まき @mash_2011

18年3月23日

@genkuroki 黒木玄さん、リプ頂き光栄です😊
15年位前にブログでトンデモ科学を指摘する記事を時々拝見していました。

ただ、お言葉ですが、私のツイートは、きくまこさんの以下ツイート(安倍政権以降に就職状況が劇的に好転)について述べたもので、十分という話はしていません。
mobile.twitter.com/kikumaco/statu...

タグ:

posted at 15:12:50

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 簡単なモデルによる最尤推定でサンプルの違いによってAICがどのようにゆらぐかに関してはリンク先のスレッドを見て下さい。予測誤差とAICのあいだにどのようなきれいな関係があるかについてすぐにわかるプロットが示されています。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 14:48:11

FXAce @Zoukers

18年3月23日

@genkuroki 安倍政権以降
トレンド
就業者数. 🔝
労働力人口 🔝

その上で失業率 ⤵️

民主党政権時は就職を諦めていた人が相当いたから.... pic.twitter.com/hfDEnD74DP

タグ:

posted at 14:41:16

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 ググってみて閉口したのは、Rなどのライブラリを使って、どういう意味でのAICを計算しているかがわからない状態でAICの数値だけを算出して使っているケースがたくさん見付かること。欲しいのはそういう情報じゃない。

タグ: 統計

posted at 14:41:05

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 定義:予測分布p(y)による真の分布q(y)の予測誤差D(q||p)の定義は

D(q||p) = ∫q(y)log(q(y)/p(y))dy.

汎化誤差G(q||p)の定義は

G(q||p) = -∫q(y)log(p(y))dy.

シャノン情報量S(q)の定義は

S(q) = G(q||q).

このとき G(q||p) = D(q||p) + S(q).

AICは最尤法における汎化誤差の推定量。

タグ: 統計

posted at 14:36:33

@kuri_kurita

18年3月23日

『何度も言ってきましたけど、雇用を犠牲にしていいから物価を下げようなんて志向は、資産価値を守りたいブルジョワ派の言い分で、少々のインフレを甘受しても雇用を増やそうというのが左派の志向だというのは「世界標準」です。共産党がこんな姿勢だなんて…』 matsuo-tadasu.ptu.jp/essay__110724....

タグ:

posted at 14:33:14

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 「AICやWAICを使えない」という理由で「交差検証」を使うと「この交差検証の結果ってどこまでどのように信頼できるんだ?」のような結果がよく得られることはたぶん数値実験を色々してみた人ならよく知っていると思う。

交差検証はやろうと思えばいつでもやれるのですが、結果の解釈は難しい。

タグ: 統計

posted at 14:32:20

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 参考情報

添付画像は
watanabe-www.math.dis.titech.ac.jp/users/swatanab...
より

文字化けは直していません。 pic.twitter.com/O6OfHuqRm4

タグ: 統計

posted at 14:28:22

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 回帰分析におけるAICの使い方の問題について質問しているのではないことに注意!

タグ: 統計

posted at 14:23:19

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 以下の3点セットを希望。

* 簡単な時系列モデル
* それのAICだと思っているものの定義
* 何の予測誤差を見ているつもりなのか

「AICを真の分布に最も近いモデルを選択するために使うことも普通」と言っても何も解決しない。その「普通」が正しいかどうかの問題。

タグ: 統計

posted at 14:21:04

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 AICは汎化誤差=予測誤差+定数の推定量なので、AICを使用している場合を見たら、「何の予測を見ているのか」が最初に知りたいことになります。

ググってみても、時系列モデルのケースで何をやっているのかよくわかりませんでした。誰か「何の予測を見ているのか」について教えて下さい。

タグ: 統計

posted at 14:16:25

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 AIC系の情報量規準は漸近論的にぎりぎりの線を攻めている情報量規準なのでモデル選択の失敗確率を0にはできないのですが、予測精度の高い予測分布の(確率的な)選択には役に立つので有用な道具なのです。

BIC系の情報量規準とは性質が全然違う。

タグ: 統計

posted at 14:14:23

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 時系列モデルとAICについて色々ググってみたのですが、時系列モデル云々とは無関係に、AICを「正しいモデルの選択」のために使っている人達が容易に見付かることが非常に気になりました。

タグ: 統計

posted at 14:14:23

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 より正確に言えば、サンプルサイズn→∞でもAICがモデル選択に失敗する確率は全然0にならない(典型的な場合には十数パーセントの確率で失敗)。選択失敗確率が全然0でないことに注意を払った使い方なら個人的には問題ないと思います。

AICとBICを併用する方が無難だと思う。

タグ: 統計

posted at 14:09:25

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 まず、AICの利用の仕方として

* サンプルを生成した真の分布に近いモデルを選択するためにAICを使う

というのは**誤り**。

www.jstage.jst.go.jp/article/seitai...
粕谷英一
生態学における AIC の誤用
AIC は正しいモデルを選ぶためのものではないので正しいモデルを選ばない
2015

タグ: 統計

posted at 14:05:21

黒木玄 Gen Kuroki @genkuroki

18年3月23日

twitter.com/genkuroki/stat...

#統計 リンク先のリンク先であの信頼できる松浦さんが述べている疑問について私も色々ググって調べてみたのですが、松浦さんの疑問の方が非常にもっともであり、やはり松浦さんは信頼できるということがよくわかりました。

時系列モデルでのAICの利用って何をやっているの?

タグ: 統計

posted at 14:00:17

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 要するに全然理解していなかったということ。

タグ: 統計

posted at 13:57:17

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 以上のようなプロットを作るようになるまで紆余曲折があった。

汎化誤差やAICやWAICそのもののプロットをするよりも、
異なるモデルの汎化誤差の差、AICの差、WAICの差をプロットする方が、
数学的にも座標不変な量を見ているのできれいでかつ、
統計学的にも重要。

これがわかってなかった。

タグ: 統計

posted at 13:56:50

にしもん @d_nishiyama85

18年3月23日

それをちょっと変えて(ちょっと間違えて)
このように、次の q を今計算した p を使って計算すると
たまたまシンプレクティックな数値積分になって
エネルギー保存が exact になるというやつ。

(むかーし学部の講義で習った・・・) pic.twitter.com/ZZzTWJHZJI

タグ:

posted at 13:34:26

にしもん @d_nishiyama85

18年3月23日

正しい(?)オイラー法はこうだった・・・
各ステップで q も p も前のステップの値を使って計算ね。

そうするとエネルギー保存が悪くて、どんどん増大していってしまうというやつ。
👇は phase space のプロット #Julia言語 pic.twitter.com/kbARcZ384v

タグ: Julia言語

posted at 13:29:51

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 添付画像は少し上の方で紹介したケースの予測誤差の差とAICの差の差と和の分布のプロット。差にはカイ二乗分布の2倍が登場し、和はデルタ分布に近い分布になります。和がほぼデルタ分布になることは、予測誤差の差とAICの差の相関係数がほぼ-1であることを意味しています。 pic.twitter.com/HsGXwJmXBl

タグ: 統計

posted at 13:29:48

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 こういう話は「百聞は一見に如かず」の典型例なので、実際に自分で数値実験してみればすぐにわかることです。

有限のnでの様子はn→∞で成立する結果を証明するだけではわからないので、場合ごとに実際に計算してみる経験は非常に重要だと思います。

タグ: 統計

posted at 13:26:34

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 AIC = T + V, T = (最大対数尤度の-2倍), V = (パラメーター数の2倍)なのですが、真の分布を含む確率モデルと含まない確率モデルの最大対数尤度を比較すると、n→∞では真の分布を含むモデルの最大対数尤度の方が確実に大きくなります。Vの部分の違いを超える差が出る可能性が高い。

タグ: 統計

posted at 13:26:34

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 AICの導出条件に「確率モデルに真の分布が含まれている」という条件が入っているので、「確率モデルが真の分布を含んでいない場合にはAICは役に立たない」と即断してしまう人もいるかもしれませんが、それはひどい誤解です。

タグ: 統計

posted at 13:26:34

増田の准教授 @ProfMasuda

18年3月23日

行政でも大学でも、改革の一環で民間のノウハウを取り入れるなどという場合、なぜか民間ではすでに失敗に終わった部分が好んで導入される。当然、同じ結果になることが多い。

タグ:

posted at 13:20:07

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 BICの定義では「モデルのパラメーター数の log n 倍」を足すのですが、その項の正体はそれそのものであり、サンプルのゆらぎに影響されません。この点はAICとは全然違う。そもそもBICは参照しているKL情報量が異なります。

AICとBICは喧嘩するべき間柄ではなく、別の仕事をしている兄弟です。

タグ: 統計

posted at 13:18:32

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 AICの定義では「モデルのパラメーター数の2倍」を足すのですが、その項の正体は「モデルのパラメーター数の自由度を持つカイ二乗分布に従う確率変数の2倍の平均値」です(自由度νのカイ二乗分布の平均はν)。

AICの定義での最大対数尤度を-2n倍することはカイ二乗分布と相性がよいです。

タグ: 統計

posted at 13:15:07

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 しかも「正しいモデル選択の失敗」の意味は、「真の分布を含むより単純な確率モデルの選択」と解釈しても、「予測誤差が小さい方の予測分布の選択」と解釈しても漸近的には同じことになります。

AIC系の情報量規準はぎりぎりの精密な部分を見ているので使用するときには注意が必要。

タグ: 統計

posted at 13:11:14

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 予測誤差の差が漸近的にカイ二乗分布に従うことと、AICの差がそれに逆相関していることは、AICがモデル選択に失敗する確率がn→∞でも0にならないという有名な事実を正確に説明してくれます。

計算すると上のケースではn→∞の理想的な状況でも14%程度の確率でAICは正しい選択に失敗します。

タグ: 統計

posted at 13:06:34

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 一つ前の添付画像を見れば、きれいに左右対称になっていることがわかる。実際、予測誤差の差とAICの差の相関係数はほぼ-1です。ほぼ常に逆向きに同じ大きさでゆらぐ。

AICの差はモデル選択で使われる。しかし、AICの差がこのように分布することを見易くプロットした例は少ないと思う。

タグ: 統計

posted at 13:03:14

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 添付画像再掲

添付画像は、y=2+0.7ε (εは標準正規分布に従う)で生成したサイズn=64のサンプルを次数0と次数2の多項式による回帰の予測誤差の2n倍の差 KL_2 - KL_0 と赤池情報量規準の差 AIC_2 - AIC_0 の分布。ランダムに生成されたサンプルが変わるとそれらの値も変わる。 pic.twitter.com/RARpF7GkjZ

タグ: 統計

posted at 13:03:13

黒木玄 Gen Kuroki @genkuroki

18年3月23日

若い世代の人達は、自分のお母さん、お父さん、お婆さん、お爺さんに、自民党内にいる「増税賛成。財政赤字を減らす」とか「金融政策は出口政策を急ぐべきだ」と言っている人達の政策が実現すると非常に困ることをきちんと伝えるべきだと思います。

経済政策失敗の悪影響は若い世代に強く出ます。

タグ:

posted at 12:51:32

にしもん @d_nishiyama85

18年3月23日

はじめての Julia プログラミング(単振動)
(((´・_・`))) pic.twitter.com/TYD9eTBC9C

タグ:

posted at 12:50:10

黒木玄 Gen Kuroki @genkuroki

18年3月23日

現実にすぐそこにある巨大なリスクは、自民党内の次の総理大臣候補達が露骨に緊縮財政・金融引締を目指すことを明言しているように見えること。

これマジに怖いんですけど。

タグ:

posted at 12:45:54

黒木玄 Gen Kuroki @genkuroki

18年3月23日

政治の話が楽しい人達は多いようだが、以上で私が指摘したリスクが実現するようなことになったら、どのように責任を取るの?

経済政策については、「緊縮」反対、「出口」反対の立場を貫くことが無難。

まず、「財政赤字をきちんと増やして、金融緩和も強化するべきだ」と言ってから政治の話をして!

タグ:

posted at 12:31:06

黒木玄 Gen Kuroki @genkuroki

18年3月23日

2013年以降の金融政策で為替は大幅に円安に動き、株価も上昇しました。

2013年以降の金融政策の方針を逆転させると、急激な円高と株安になる可能性が高い。

金融政策の方針の逆転には雇用の悪化を招く大きなリスクがある。そのリスクが実現すると自殺だけで年間千人単位で人が無駄に死ぬだろう。

タグ:

posted at 12:26:33

黒木玄 Gen Kuroki @genkuroki

18年3月23日

リーマンショックで落ち込んだ分が回復傾向になるのは当然。

リーマンショックで米国発の金融ショックだったのに、米国より日本の方が大きなダメージを負った。そうなってしまった原因は政府と特に日銀の無策。

2013年以降の金融政策はそのときよりはずっとまし。個人的に全然不十分だと思うが。

タグ:

posted at 12:19:14

りさ @risa_hmm

18年3月23日

すごくわかる。資格試験勉強用の動画も耐えられなくて見なくなっちゃった。講義を受けるなら大丈夫なのだけど。
twitter.com/kurubushi_rm/s...

タグ:

posted at 12:17:24

elanlilac @elanlilac

18年3月23日

単位時間当たりの情報量は大事。 twitter.com/kurubushi_rm/s...

タグ:

posted at 12:14:10

激昂寺「ありがとうございます!」 @gekkoji_p

18年3月23日

モノタロウさんもバカの相手は大変だなぁw pic.twitter.com/uGG4CLjJWQ

タグ:

posted at 12:06:33

黒木玄 Gen Kuroki @genkuroki

18年3月23日

記録に残しておくためにスクショも貼り付けておく。右半分は

www.garbagenews.net/archives/20801...

より。ググればすぐに見つかる。

まきさんのおかしな指摘を共感を持ってRTする人達がいるようだ。非常に残念なことだと思う。 pic.twitter.com/yN8d3Y6AeO

タグ:

posted at 12:05:11

黒木玄 Gen Kuroki @genkuroki

18年3月23日

@mash_2011 @kikumaco @b27e66 @gishigaku @kous37 去年(2017年)3月の大学生の「進学+就職」率は1999年3月以降で最高。リーマンショック前の水準を超えている。

この数字は大学内での会議で閲覧される学生の進学・就職状況一覧とも整合的。

私はこれでもまだ不十分だと繰り返し言っている。

www.garbagenews.net/archives/20801... pic.twitter.com/stFUXxPwfD

タグ:

posted at 11:55:34

大栗博司 @PlanckScale

18年3月23日

ちなみに、一般相対性理論を修正すると、重力波が光速で伝わらなくなることがあります。最近の中性子合体からの重力波の観測で、光と重力波の速さの差の上限が小さくなり、一般相対性理論が長距離で修正されるという理論のいくつかが棄却されました。詳しくはこちら⇒dw.diamond.ne.jp/articles/-/22787 twitter.com/PlanckScale/st...

タグ:

posted at 08:43:08

非公開

タグ:

posted at xx:xx:xx

非公開

タグ:

posted at xx:xx:xx

Taku @Less_role

18年3月23日

@genkuroki 情報をいただきありがとうございました。IJuliaとPyplotを一度消去し、ご指摘いただいた方法でもう一度Pkg.addしたところ、無事動くようになりました。

タグ:

posted at 06:55:50

@1uo

18年3月23日

@tmiya_ 【元私立中高教諭】
#超算数 は入試では、
まったく意味がない。

「答」と「考え方」、
答が正解で加点した。
考え方は式と文章で
伝わる記述を求めた。
-
掛け算や足し算では、
その順序は関係ない。
自分の考えを相手が
理解できる説明する。
その力の有無を判定、
考え方はそれが目的。

タグ: 超算数

posted at 06:40:14

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 添付画像は、真の分布が1次で、推定モデルは1次と2次の場合 pic.twitter.com/jH9cuzG7CR

タグ: 統計

posted at 06:35:42

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 添付画像は、真の分布は0次で、推定モデルは0次と2次の場合。予測誤差(KL情報量)の2n倍の差 KL_2 - KL_0 が自由度2のカイ二乗分布に従っているように見える。その他にも情報満載。AICによるモデル選択に興味がある人は必見。 pic.twitter.com/IDqf8cBKJw

タグ: 統計

posted at 06:35:42

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 次を更新した。

nbviewer.jupyter.org/gist/genkuroki...
AICと予測誤差の分布

0次, 1次, 2次の多項式による回帰(最小二乗法=残差が正規分布のモデルで最尤法)の予測誤差とAICを計算してプロットしました。重要なのは異なるモデルのそれらの差のプロットです。

タグ: 統計

posted at 06:35:41

Valentin Churavy @vchuravy

18年3月23日

From the #python manual:
> Python is extensible: if you know how to program in C ...
docs.python.org/3.5/tutorial/a...

Well... The equivalent sentence for #JuliaLang would be:
> Julia is extensible: if you know how to program in Julia ...

タグ: JuliaLang python

posted at 05:12:01

Julia News @julialang_news

18年3月23日

AstroImages.jl — package for visualization of astronomical images www.juliabloggers.com/astroimages-jl... #juliabloggers

タグ: juliabloggers

posted at 03:56:41

Mosè Giordano @MoseGiordano

18年3月23日

I made this little thing in #JuliaLang: AstroImages.jl, package for visualization of astronomical images #astronomy #JuliaAstro giordano.github.io/blog/2018-03-2...

タグ: astronomy JuliaAstro JuliaLang

posted at 03:11:08

Julia Bloggers @juliabloggers

18年3月23日

DifferentialEquations.jl 4.1: New ReactionDSL and KLU Sundials www.juliabloggers.com/differentialeq... #julialang (Re-post)

タグ: julialang

posted at 02:59:09

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 あ、すみません、渡辺澄夫『ベイズ統計の理論と方法』の第4章定理15はr=dの場合の結果です。r<dの場合にも誰か証明を書くべきかも。

タグ: 統計

posted at 01:45:22

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 (2)にあたることは正則モデルではない場合(特異モデルの場合)にもベイズ推定法とWAICについて成立しています。渡辺澄夫『ベイズ統計の理論と方法』の第4章定理15の両辺を2n倍してみて下さい。その定理はWAICユーザーにとって重要な結果。WAICがどのように失敗するかを記述している。

タグ: 統計

posted at 01:43:05

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計

(2) モデルMとNのAICをそれぞれAIC_M, AIC_N と書くと、

(KL_M - KL_N) + (AIC_M - AIC_N) = 2r + o(1).

(3) ゆえに

(KL_M - KL_N) - (AIC_M - AIC_N) = 2χ^2(r) - 2r + o(1).

数値実験できれいにカイ二乗分布が出てくれば確認成功。

タグ: 統計

posted at 01:39:23

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 正則モデルであることはAICを使っているので暗黙の前提。

以上の設定のもとでn→∞で漸近的に以下が成立している。

(1) モデルMの予測誤差の2n倍KL_MとNのそれKL_Nについて、KL_M - KL_N はn→∞で漸近的に自由度rのカイ二乗分布に従う:

KL_M - KL_N = χ^2(r) + o(1).

タグ: 統計

posted at 01:39:22

nuts 88 @nutspapa88

18年3月23日

@junsaito0529 @genkuroki 大人として子供達の自由な発想をや疑問をどこまでを受け止められるかは、正確に分かっている自信があるかどうかではないかと思います

公立学校の先生の様子を数年前まで見ていた限り、雑用に取られて学ぶ時間は確保されていませんでした。良いとは思えませんが、そういう方向に向かってしまうのでは?

タグ:

posted at 01:34:42

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 より正確な設定の説明:Mは確率モデル

p(y|w_1,…,w_d)

(w_iはパラメーター)であるとし、Nを定数a_i達によって確率モデルNは

p(y|a_1,…,a_r,w_{r+1},…,a_d)

であるとする。サンプルを生成する真の分布は

p(y|a_1,…,a_d)

であるとする。このスレッドの内容はこの設定のもとでの話。

タグ: 統計

posted at 01:30:28

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 注意続き:短く言えば、以上で紹介した一般論は、対数尤度比検定の設定での話です。

タグ: 統計

posted at 00:27:36

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 注意:カイ二乗分布が出て来るためには、推定のために用意したモデルがサンプルを生成した真の確率分布を十分な精度で含んでいなければいけません。モデルMのパラメーター集合がモデルNのそれを低次元の部分として含んでいて、Nに真のモデルが含まれている場合に、以上の一般論が利用できます。

タグ: 統計

posted at 00:26:47

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 漸近論の証明はフォローできなくても、実際に自分が使うケースについて数値実験を十分にやっていて、n→∞での漸近論を有限のnで使ったときに何が起こるかを知っていれば、漸近論を適切に使うには十分だと思う。そして、証明をフォローしても有限のnのことはわからないので、数値実験は必須。

タグ: 統計

posted at 00:22:45

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 色々計算すると、漸近論の予言はnを十分に大きくすれば、ものすごくきれいに成立していることを確認できます。

そして、nが小さな場合も計算することによって、小さなnでどのように漸近論の予言が崩れて行くかも確認できる。nが小さな場合でも漸近論の利用はどこまで誤差を許すかで決まります。

タグ: 統計

posted at 00:20:13

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 添付画像は真のモデルが y = -1 - 0.4 x + 0.5 ε の場合に1次多項式(直線)と2次多項式による回帰を行った場合です。パラメーター数の差は1であり、自由度1のカイ二乗分布が出て来ているように見えます。 pic.twitter.com/s8DyUEV3yx

タグ: 統計

posted at 00:18:21

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 非常にきれいに自由度2のカイ二乗分布が出て来ている様子が見えます。出て来たカイ二乗分布の自由度は2つのモデルのパラメーターの差になっています。0次多項式と2次多項式による回帰のモデルのパラメーター数はそれぞれ2と4です。その差の2が出て来ている。これも漸近論が予言するところです。

タグ: 統計

posted at 00:18:20

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 単独のAICの絶対値は全く重要ではなく、異なるAICどうしの差だけがモデル選択で重要になります。AIC(モデル1) - AIC(モデル2) が重要。

添付画像は真のモデルが y=2+0.7ε (εは標準正規分布に従う誤差)の場合にの0次多項式(定数)と2次多項式による回帰の予測誤差とAICの差のプロットです。 pic.twitter.com/93l6aAHS5n

タグ: 統計

posted at 00:18:19

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 さらに

KL + (AIC - L_n(w_0)) = 8 + o(1)

も成立している。この公式より、予測誤差の2n倍であるKLとAIC-L_n(w_0)の相関係数がn→∞で-1になることもわかります。

nbviewer.jupyter.org/gist/genkuroki...

の cor(kl,aic0) が軒並み-1近くになっていることを確認して下さい。

タグ: 統計

posted at 00:18:19

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 添付画像は2次多項式の回帰でn=32の場合のプロット。 漸近論の予言から微妙にずれて来ています。しかし傾向は変わらない。

雑な使い方で良ければnは結構小さくなってそれなりに行けます。どこまで誤差を許せるかは場合ごとに違うので、小さなnについては自分で計算して確認するしかない。 pic.twitter.com/4eqIXJvB5d

タグ: 統計

posted at 00:18:18

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 漸近論はさらに、n→∞で

KL - (AIC - L_n(w_0)) = 2χ^2(4) - 8 + o(1)

が成立していることも予言します。ここで χ^2(ν)は自由度νのカイ二乗分布に従う確率変数です。これは予測誤差とAICの関係を明瞭にする重要な公式です。

添付画像は2次多項式の回帰でn=1024の場合のプロット。 pic.twitter.com/T461aPPdX8

タグ: 統計

posted at 00:18:17

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 重要なポイントは予測誤差の2n倍KLだけではなく、赤池情報量規準AICからモデルに依存せずにサンプルだけに依存するL_n(w_0)を引いた結果は、左右を逆転させたカイ二乗分布に従っているように見えることです。

漸近論はそのことも予言します。2次多項式での回帰でn=1024なら漸近論の予言通り!

タグ: 統計

posted at 00:18:17

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 以下では実現可能な正規モデルの枠内で考える。

漸近論は、n→∞で、予測誤差の2n倍KLはモデルのパラメーター数を自由度とするカイ二乗分布に従うことを予言します。

添付画像はn=1024で2次の場合(モデルのパラメーター数は4)です。nを十分大きくしたので漸近論が予言する通りになっている。 pic.twitter.com/t3iDP7Uug1

タグ: 統計

posted at 00:18:16

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 予測誤差はそのJupyter notebookでは「KL」と表わされています。AICそのものはサンプルに大きな影響を受けるので、モデルと無関係にサンプルから決まるL_n(w_0)を引いた結果のヒストグラムを描いています。 L_n(w_0)の定義は本質的に渡辺澄夫『ベイズ統計の理論と方法』と同じ。

タグ: 統計

posted at 00:18:15

黒木玄 Gen Kuroki @genkuroki

18年3月23日

#統計 新たに公開した

nbviewer.jupyter.org/gist/genkuroki...

では、大量に生成したサンプルごとに、0次、1次、2次の多項式による最小二乗法での回帰を行い、その予測誤差とAICを求めてヒストグラムを描いています。平面上の(x,y)の分布の予測分布を求める立場なので内容的に怪しいことはやっていません。

タグ: 統計

posted at 00:18:15

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました