Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
並び順 : 新→古 | 古→新

2020年05月08日(金)

ら @odashi_t

20年5月8日

僕は数値計算でもゴリゴリに誤差詰めてテストコード書くんですけど,そうすると結構ツールにバグを発見するので,それを気にしないで使っている世の中の研究者はバグった実験結果を論文に書いてるんだろうなあと思っています.

タグ:

posted at 21:37:10

ら @odashi_t

20年5月8日

GWはJAXでTransformerを実装していたら終わってしまった(途中でバックエンドのバグ再現と報告経由したりして大変だった)

タグ:

posted at 21:32:56

Hiroshi Shinaoka @HShinaoka

20年5月8日

x::Array{UInt16}を x::Array{UInt16,1}にすれば治った。

タグ:

posted at 20:35:49

Hiroshi Shinaoka @HShinaoka

20年5月8日

Julia (v1.4)の奇妙な挙動。struct内の配列の最大値を取ると型がANYになる。なぜだ? pic.twitter.com/Ea9xKRjnmD

タグ:

posted at 20:26:20

mtmt @mtmtlife

20年5月8日

ここでの△8四飛は、ほぼアヒルの使い手で、ネット将棋ではよくやられる。切れ負けでは非常に有力な作戦だと思われる。自分はここでノータイムで▲7五歩と突くことにしている。対して△7四歩▲9五角までで終了、を5回ぐらい経験。 twitter.com/tetsu_59/statu...

タグ:

posted at 20:23:21

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 続き。シード値を変えると別のランダムウォークが生成されるようにしているのに、【下降トレンド】なるものについて語ってしまったがために、まるで何も理解していないように見えるブログ記事とソースコードの組ができ上がってしまったのです。

以上では、できるだけ親切に説明したつもり。

タグ: 統計

posted at 19:06:06

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 件のブログ記事の追記(添付画像)の内容は本文と照らし合わせると相当に意味不明で、本文で【そこそこ適切に下降トレンドを予測できていることが分かります】と言いたければ、下降トレンドなるものを考えることに意味のある法則のクラスに真の法則が含まれている場合を扱う必要がありました。 pic.twitter.com/KQzpjJwdl1

タグ: 統計

posted at 19:06:05

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 何らかの法則に支配されていない単なる数列について予測を考えることは意味がない。少なくとも統計学的な予測でやりたいことではない。

統計学的予測について考えるときには、真の法則が十分に広いが扱い易い法則のクラスに含まれている状況を想定するのが普通だと思います。

タグ: 統計

posted at 18:57:54

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 あと、言うまでもないことだと思うが、

ランダムウォークとして生成したデータについて、ランダムウォークであることを忘れて(真の確率法則を忘れて)、単なる数列と化したデータ中の1~300期の値から301~360期の値の予測を考えることに意味がある

と考えるのは誤りである。続く

タグ: 統計

posted at 18:51:11

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 あと、「予測」と「予測の誤差」の意味を明瞭に説明しないと、理解不可能な解説になりがち。

「このコインを投げたら次に表が出る」という予測と「コインを投げたら表の出る確率は60%である」という予測では意味が全然違い。それぞれについて予測の誤差を別に定義する必要がある。

タグ: 統計

posted at 18:46:53

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 ~、上下に暴れまくる多項式になることを抑制すると(交差検証、正則化、etc.)、抑制前より予測の誤差が確率的に小さくなることのみを述べた上で、ランダムウォークの性質から自明であることにも触れれば(内容的にはつまらないが)問題は無かった。

タグ: 統計

posted at 18:37:52

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 set.seed(102)が原因でそのランダムウォークについては偶然そう見えているだけなのに、【そこそこ適切に下降トレンドを予測できていることがわかります】と書いてしまったことが、全てを台無しにしてしまった。

ランダムウォークについてトレンドなどと言わずに~続く

タグ: 統計

posted at 18:37:49

ceptree @ceptree

20年5月8日

表紙の図はルンゲ関数(的なやつ)にスプライン補間したときのやつか(p122のb)

タグ:

posted at 18:34:06

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 件のブログ記事を訂正するなら以下が必要だと思う:

(1) 【そこそこ適切に下降トレンドを予測できていることが分かります】の部分の全面撤回

(2) シード値が他の場合の例を十分に示して【トレンドを予測できて】いないことの証拠提出

(3) そもそもランダムウォークにトレンドがないことの解説

タグ: 統計

posted at 18:30:33

tdual(ティーデュアル)@Matri @tdualdir

20年5月8日

ってか、teamsもzoomみたいなバーチャル背景できるんやな。出来ないのgoogle meetだけか?🤔

タグ:

posted at 17:57:25

ceptree @ceptree

20年5月8日

JuliaからPythonを呼び出したいんですがその時の環境構築はどうすればいいですか

タグ:

posted at 17:30:59

(「・ω・)「ガオー @bicycle1885

20年5月8日

ちなみにJuliaを始めたい人にはこの本がオススメらしいです。
www.kinokuniya.co.jp/f/dsg-01-97843...

タグ:

posted at 17:05:04

非公開

タグ:

posted at xx:xx:xx

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 「チェリーピッキングをやっているように見える!」と最初からズバッと書いた方が良かったですかね?

さすがにそう思われちゃうのは困ると思うので、そういう印象を打ち消すだけ十分に自分の誤りを強く認めてくれると思っていたのですが、全然そうはならなかった。

タグ: 統計

posted at 17:02:50

(「・ω・)「ガオー @bicycle1885

20年5月8日

Pythonの環境構築で悩んでる人に大ヒントなんですが、Juliaって言語を使うと良いらしいですよ。

タグ:

posted at 16:59:46

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 いずれにせよ、ランダムウォークについて「そこそこ適切にトレンドを予測できていることが分かります」などと書いちゃうようだとまずいです。

そして、採用したのシード値の102の前に試したらしい101では「そこそこ適切にトレンドを予測できている」とは言えそうもないプロットが出来上がる。

タグ: 統計

posted at 16:59:23

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 シード値101の添付画像1のプロットでは「都合が悪いこと」は「そこそこ適切にトレンドを予測できている」と書けなくなることです。

「そこそこ適切にトレンドを予測できている」と書きたかったので都合の悪い101を捨てて、102を採用したのではないか?

もしもそうなら非常に印象が悪いです。 pic.twitter.com/3xAkxbqGvW

タグ: 統計

posted at 15:26:37

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 続き。添付画像1は件のブログ記事への追記で、添付画像2はシード値101の場合の私によるプロット。極値は2つ以上ある。

仮に添付画像2と同じプロットを見て、シード値101を却下して、次の102を採用したのだとすれば、「極値が2つ以上」とは異なる条件でそうしたということですよね。 pic.twitter.com/Fcmcqo8iGL

タグ: 統計

posted at 15:23:44

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 記録:添付画像1は

tjo.hatenablog.com/entry/2020/04/...

に今日追加された追記。添付画像2はシード値102の場合(ブログ記事の内容)。添付画像3はシード値101の場合。

あれれ?シード値101でも極値が2つ以上ありますね。

これと同じプロットをシード値101で再現できるかどうかを誰か確認して下さい!続く pic.twitter.com/JClg1w9MCy

タグ: 統計

posted at 15:05:31

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 昔読んだ本

www.amazon.co.jp/dp/4478001227
まぐれ―投資家はなぜ、運を実力と勘違いするのか
(Fooled by Randomness)
2008/2/1
ナシーム・ニコラス・タレブ (著), 望月 衛 (翻訳)

知識と経験が増えた今読み直したらどう感じるだろうか?

この翻訳書では参考文献欄が生き残っています!結構重要。

タグ: 統計

posted at 13:30:21

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 現実に出会う多くの場合には、添付画像1のようなプロットしか得られません。人間はノイズが生成した「トレンド」のように見える動きをトレンドだと誤解しがち。

ランダムウォークなのに【そこそこ適切に下降トレンドを予測できていることが分かります】と書いてしまうくらい人間は弱い。 pic.twitter.com/mkVF6869ce

タグ: 統計

posted at 13:20:33

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 添付画像1はランダムウォークの実現値を1つだけプロットしたものです。第18期以降は「下降トレンド」に乗ってしまったようにも見えます。

しかし、添付画像2のように沢山のランダムウォークを同時にプロットすると、その「下降トレンド」は偶然そう見えていただけだと分かる。 pic.twitter.com/tSzoUbrnrS

タグ: 統計

posted at 13:17:21

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 何らかの確率的な法則で生成されるデータは実現値を一つだけプロットしても法則性が見えないない場合がある。そういう場合には同じ確率法則で沢山のデータを生成して、同時プロットで比較してみるとよい。

ある程度広いクラスの確率法則全体で成立する普遍的な法則がないと「予測」は難しい。

タグ: 統計

posted at 12:54:46

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 上のプロット中の予測したい先の青線は60期分のランダムウォークです。各ステップで平均0分散20の正規分布で動く。そのようなランダムウォークを200本プロットしてみました。y = ±2√(20x) の内側にほぼ入ります。各時刻での期待値は初期値に等しくなる。

#Julia言語
nbviewer.jupyter.org/gist/genkuroki... pic.twitter.com/ZCg4P8oUZ1

タグ: Julia言語 統計

posted at 12:51:27

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 ランダムウォークの多項式フィッティングで何らかの方法で多項式の次数を下げておけば、擬似乱数のシード値をいじって、うまいこと【トレンド】にフィットしているプロットを作り易くなります。

そういう方向で役に立てたいならば、非常に適切なブログ記事だったかもしれませんね。😅

タグ: 統計

posted at 12:12:49

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 昔聞いたことがある笑い話なのですが、ランダムウォークで作った株価のチャートのように見えるプロットを見せて、とある投資家に「この株価は上がると思うか?」と聞いたら、チャートに怪しげな線を色々引いて「上昇トレンドに乗っているようだ」と答えた、というような話だったと思う。

タグ: 統計

posted at 12:10:29

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 注意:2つ前のツイートの添付画像のプロット中の黒線の実線は学習データを表しているのですが、学習データの239期以前の部分はプロットしていません。学習にはオリジナル通り1~300期のデータを使っている。予測先は301~360期の青線。実はランダムウォークです(笑)。

タグ: 統計

posted at 12:05:41

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 黒線(学習データ)&青線(予測先)はランダムウォークなのでその青線の【トレンド】に見えるものを赤線で予測することは、本質的に丁半博打(よりも劣化した何か)と変わりがありません(笑)。

タグ: 統計

posted at 11:56:55

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 set.seed(102)から出発して、1つではなく、沢山のプロットを描いていた部分をちょっと書き直して、見易くしました。

赤線で青線を【予測】しているらしいのですが、シアンの点線(学習で使えるデータの最終期の値)による青線の予測と比較してみて下さい。

gist.github.com/genkuroki/736a... pic.twitter.com/Z6ycZ5Ffn5

タグ: 統計

posted at 11:53:41

MURAKAMI Masayuki @munyon74

20年5月8日

すいません、今は復旧しております。

タグ:

posted at 11:46:36

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 件のブログ記事中で【そこそこ適切に下降トレンドを予測できていることが分かります】という結論が成立しているように見えるプロットが得られた理由は、set.seed(102)してあるからです。

他のシード値だと赤線が【トレンド】(笑)から外れまくる。

実際にやってみればすぐにわかります。 twitter.com/gavangavan/sta... pic.twitter.com/umeuhwAAbV

タグ: 統計

posted at 11:21:51

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 まさにその通りで、多項式や三角函数などどの函数系でフィッティングしていても、交差検証を使っていようがいまいが、ランダムウォークを扱っているのに、最終的な結論が

【そこそこ適切に下降トレンドを予測できていることが分かります】

だとアウトでしょう😅

twitter.com/ttkkmg/status/... pic.twitter.com/wTi1D9n1EL

タグ: 統計

posted at 11:15:43

Toshitaka Kumagai @ttkkmg

20年5月8日

@genkuroki 情報源をちょっとでも非対称なランダムウォークにすれば、1次式でやれば長期トレンドが浮き出てくる意味があるけど、次数増やすのは良くないね、というストーリーが作れるのではないかな、と思います(自分でやってみたい)。

タグ:

posted at 11:13:28

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 データはランダムウォークです。ソースファイル

github.com/ozt-ca/tjo.hat...

の添付画像に引用した部分を参照。

個人的には、ランダムウォークにトレンドがあると思っている時点でアウト。

gist.github.com/genkuroki/736a...

も参照。シード値を変えた場合も計算しています。

twitter.com/gavangavan/sta... pic.twitter.com/7hO92yiq6V

タグ: 統計

posted at 11:07:55

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 CVに限らず、フィッティングで使う多項式の次数を0次に近付け、定数項をデータの最終期の値に近付ければ、予測性能が上がります(笑)。

しかし、件のブログの方法では最適な予測値(データの最終期の値)からは大きく外れ易いです。

シード値を選んで予測できていると見せかけているだけ。 twitter.com/gavangavan/sta...

タグ: 統計

posted at 11:03:55

MURAKAMI Masayuki @munyon74

20年5月8日

【大阪大のみなさんへ】全学的なネットワーク障害が発生しており、学内・学外間の通信はほぼ途絶しているようです。マイハンダイだけでなく、大学のWebサイトなどもアクセスできません。 現在、対応しているということですので、しばらくお待ちください。

タグ:

posted at 11:03:12

黒木玄 Gen Kuroki @genkuroki

20年5月8日

Re:RT 私は自分ちの子には「理解しているのに注意不足のせいで計算ミスしても気にしなくてよい」と言っています。

タグ:

posted at 10:47:59

加藤公一, 가토우 기미카즈(はむかず) @hamukazu

20年5月8日

僕も、自分の娘には、計算ミスが多すぎるから理系のほうが向いているのではと言っている(数学科に行けとまでは言ってない)

タグ:

posted at 10:40:01

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 個人的には、ランダムウォークに「トレンド」なるものがあると思っている時点で理解度ゼロのままでブログ記事を書いたとみなされても仕方がないと思います。

しかも【そこそこ適切に下降トレンドを予測できていること】にするためのset.seed(102)付き!

twitter.com/genkuroki/stat...

タグ: 統計

posted at 10:36:37

mizuki_kanna07409 @kanna07409

20年5月8日

福島県が甲状腺検査延期 小中高校会場、9月以降に | 福島民報

もうこの際、止めましょうよ。 www.minpo.jp/news/detail/20...

タグ:

posted at 10:29:16

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 ぎゃばんさんの感想が私には普通に見える。

実際にランダムウォークの特殊なサンプルをわざわざset.seed(102)として生成している本人が【「ランダムウォークであること」を強調するなら~】と言い返せる感覚が理解できない。

ぎゃばんさん、サンキュ!

twitter.com/gavangavan/sta... pic.twitter.com/81G0XZD6YN

タグ: 統計

posted at 10:27:39

Toshitaka Kumagai @ttkkmg

20年5月8日

@genkuroki 多項式でも三角関数でも、正解が対称なランダムウォークなものにフィッティングで解析した時点で負け、ということではないのでしょうか。逆正弦法則などをチェックして、「こりゃーランダムウォークじゃないの?」というのを当てに行くことは本質的にできるのか、という難しい問題。

タグ:

posted at 10:14:23

@masui

20年5月8日

「CapsLockキーをいつ使う?」の答として「間違って押してしまったとき元に戻すのに使う」という答が多かった。それは便利!

タグ:

posted at 10:13:14

加藤公一, 가토우 기미카즈(はむかず) @hamukazu

20年5月8日

その先生、本気で才能を見込んでたんだと思いますよ。 twitter.com/873928ka/statu...

タグ:

posted at 10:12:59

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 ランダムウォークについて、その実現値y_1,…,y_mが得られているとき、m期より後の値(確率変数)Y_{m+1},…,Y_nの確率分布は、y_1,…,y_{m-1}の値によらず、y_mのみから決まります。

だから、y_1,…,y_m全体への多項式フィッティングでY_{m+1},…,Y_nを予測しても無意味。

タグ: 統計

posted at 10:09:14

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計

ランダムウォークの多項式フィッティングで『トレンド』を予測できているように見せるためにはデータ生成時に都合の良い擬似乱数のシード値の選択が必須(笑)

という話題への反応が以下のリンク先の記録だとすれば(違うかもしれないが)、ちょっと驚きですよね。

twitter.com/genkuroki/stat...

タグ: 統計

posted at 09:13:32

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 このスレッドの最初で「ランダムウォークの多項式回帰をやっているので引用しない方がよいです」と書いた理由は、「ランダムウォークの多項式回帰」をやるとたとえ次数が下がるように調整しても、都合のよい結果を得るためには「擬似乱数のシード値の選択」が必須になるから。実際にやっている。

タグ: 統計

posted at 09:10:09

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 なんか同じことを繰り返して言うだけのスレッドになっていますね。ごめんなさい。

まあ、でも、しかし、ランダムウォークの【下降トレンド】を【適切に~予測できていることが分かります】と書いてあるブログ記事が繰り返し引用される様子は放置できなかった。

さすがにそれはまず過ぎ。

タグ: 統計

posted at 08:40:04

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 「ランダムウォークの多項式フィッティング」という設定では、たとえ交差検証などの方法で調節しても、【そこそこ適切に下降トレンドを予測できている】などと言えるためには、データ生成時の擬似乱数のシード値の調整が必要。

で、実際にそれをやっている。😱

tjo.hatenablog.com/entry/2020/04/... pic.twitter.com/4wrgrpZGgB

タグ: 統計

posted at 08:35:54

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 これからコインを投げるときに「表と裏のどちらが出るかをぴったり当てること」(これは不可能)とpを具体的な確率の数値として「表の出る確率はpであると予測すること」は、当たり前に全然違います。

その辺の違いがどれくらいなのか分かっていないと、交差検証や情報量規準を誤用するだろう。

タグ: 統計

posted at 08:23:40

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 そのブログ記事を引用する前に、公開されているコードをset.seed(102)の102を色々変えて実行してみると良かったと思います。私がそれをやった結果が

gist.github.com/genkuroki/736a...

にある。添付画像はそこで表示されていないプロット。

詳しくはスレッド全体を参照

twitter.com/_ss939/status/... pic.twitter.com/plaqcJG9rK

タグ: 統計

posted at 08:18:02

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計

掲載されているset.seed(102)のプロットは【そこそこ適切に下降トレンドを予測できている】と言い張れるものになっているが、set.seed(100),set.seed(101)だと予測は大外れ。

そもそも、サンプルパスの分布が上下対称なランダムウォークなのに「下降トレンド」って何?

タグ: 統計

posted at 08:07:09

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 続き。y_{m+k} (1≦k≦n-m)の真の分布は平均y_m分散20kの正規分布であり、その真の分布から外れた予測は確率的にその真の分布による予測に劣る。

多項式フィッティングで多項式の次数が正になったり、0次であっても定数項がy_mと異なっていると、大外しする確率が無用に高い予測になる。

タグ: 統計

posted at 08:01:49

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 cumsum(rnorm(n, 0, 20))は平均0分散20の正規分布のサンプル

ε_1
ε_2

ε_n

から

y_1 = ε_1
y_2 = y_1+ε_2

y_n = y_{n-1}+ε_n

を作る。確定値をy_1,…,y_mとし、その後のy_{m+1},…,y_nを未知確率変数とみなすと、y_{m+k} (1≦k≦n-m)の分布は平均y_m分散20kの正規分布になる。 pic.twitter.com/vHLbxQLXq3

タグ: 統計

posted at 07:56:11

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 添付画像1にあるグラフははset.seed(102)の場合のランダムウォーク(添付画像2)に関するプロットなのに、【そこそこ適切に下降トレンドを予測できている】と書いてある!!!

上下対称のランダムウォークの「下降トレンド」!!!

set.seed(101),set.seed(100)では添付画像3,4のようになる。 pic.twitter.com/FdhZQ7Rrdk

タグ: 統計

posted at 07:43:10

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 記録

set.seed(102)の場合のプロットのみを掲載しておいてこれ😱

「ランダムウォークで生成されているデータに対して」それをやると、あたかも予測が当たっているように見えるプロットを得るために、都合のよい擬似乱数のシード値を選ばなければいけなくなる。 pic.twitter.com/gwPzqJ7A5t

タグ: 統計

posted at 07:24:39

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 記録

再度強調→ランダムウォークの多項式フィッティング(交差検証で調節)で予測が当たっているように見えるプロットを得るためには、サンプルパスの生成時の擬似乱数のシード値をうまく選択することが必須。そして実際にそれをやっている。 pic.twitter.com/EripLkAzCL

タグ: 統計

posted at 00:41:12

eval parse @evalparse

20年5月8日

This wouldn't have been possible without Thrift.jl and the foundational work in Parquet.jl

I managed to figure out the parquet format by reading the official docs and much of the source for Parquet.jl.

Thrift.jl is nifty for making writing thrift defn painless.

タグ:

posted at 00:35:01

eval parse @evalparse

20年5月8日

In preparation for writing a parquet writer in pure Julia live stream (www.youtube.com/watch?v=O-NE9q...)

I managed to manually write a parquet file using only #julialang and have it read successfully using Python and R arrow!

A pure Julia @ApacheParquet writer is coming! No C++ needed!

タグ: julialang

posted at 00:22:26

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 コイン投げの状況を考える。

この場合に日常用語的に「予測が当たる」とは「次に表が出るか裏が出るかを当てる」というような意味になります。

しかし、交差検証や情報量規準によって「予測誤差が小さくなるモデルを選ぶこと」はそれとは全然違うことをやっていることになります。

タグ: 統計

posted at 00:16:14

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 「予測分布をテストサンプルを生成する真の確率法則に近付けること」は「n期までデータからその後の値の実現値をぴったり予測すること」は異なります。

確率法則的にはぴったり予測できていても、特定の実現値と比較すると全然ダメに見えることが起こり得る。

関連↓
twitter.com/genkuroki/stat...

タグ: 統計

posted at 00:09:21

黒木玄 Gen Kuroki @genkuroki

20年5月8日

#統計 交差検証や情報量規準によるモデル選択が有効であることを示す数値的な例をコンピューターで作るには、予測分布をテストサンプルを生成する真の確率法則に近付けることを意識しないとダメです。

まさにその「真の確率法則に近付けること」が「汎化性能を上げること」なのですから。

タグ: 統計

posted at 00:01:42

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました