Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
並び順 : 新→古 | 古→新

2020年05月09日(土)

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 ランダムウォークの大部分が含まれる放物線の内側の様子については以下のリンク先の添付画像2を参照。

コードは #Julia言語 です。JuliaカーネルのJupyter notebookのスクショ。超高級電卓的に便利。

twitter.com/genkuroki/stat...

タグ: Julia言語 統計

posted at 23:52:16

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 ソースコードを公開してくれていたのですぐに問題があることが分かった。

①ランダムウォークらしきものと回帰曲線のプロットの後に「下降トレンドを予測できている」と書いてあるので、あれれと思った。

②ソースコードを見たら、予想通り、set.seed(102)のランダムウォークになっていた。 twitter.com/genkuroki/stat... pic.twitter.com/kgKdKWtR04

タグ: 統計

posted at 23:34:56

Katsushi Kagaya @katzkagaya

20年5月9日

著者はWatanabe(2018) MTBS を読まれているようなので、けっこう第二版でのアップデートもかなり期待しています。
b.hatena.ne.jp/entry/s/twitte...

タグ:

posted at 23:25:36

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 微小訂正版

❌何かかの→⭕️何らかの

😅😅😅 pic.twitter.com/eogS9pHqTS

タグ: 統計

posted at 23:22:27

みかん @disposez

20年5月9日

@genkuroki 見ていらっしゃるんですね!思いもつかなかった好手が秒で飛んでくるのが凄いですよね(゚Д゚;)w

タグ:

posted at 23:12:35

かなまろ @kanamaro_jl

20年5月9日

数値計算をしようと、C言語→C++→Python→Cython→Julia、と旅してきましたが、人に勧めるならJuliaですね。数学や物理のアイデアをすぐに試せる。

現状、日本語で書かれたJuliaの入門書はこの本しかない気がする。バランスよくまとまってて、よい足がかりになった(`・∀・´)

タグ:

posted at 23:07:22

Katsushi Kagaya @katzkagaya

20年5月9日

ただ、上の講演ではたとえばモデリングの適切さを真の分布に対してどのように評価するか、というモデル評価の観点はなかったように思いますので、注意です。著書のStatistical Rethinkingにはあります(第二版はまだ持っていないので不明ですが第一版にはあります)。

タグ:

posted at 23:04:20

TaKu @takusansu

20年5月9日

@shoyugi こういう物で良いでしょうか。

数直線は役に立つ?
8254.teacup.com/kakezannojunjo...

中学生・高校生の割合の理解に関する調査研究 の雑感の抜粋
8254.teacup.com/kakezannojunjo...

「到達目標」の設定の妥当性
8254.teacup.com/kakezannojunjo...

タグ:

posted at 22:57:14

かなまろ @kanamaro_jl

20年5月9日

Julia、完全に理解しました🙆‍♂️ pic.twitter.com/Eq6eGA2nFz

タグ:

posted at 22:45:56

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 手描きで解説を書いて来ました。 pic.twitter.com/5Cxf63dEJO

タグ: 統計

posted at 22:35:08

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 だから、件のブログ記事の読者は、TJOさんが理解度ゼロでないと信じ続けているならば、「どうしてすぐにばれるデタラメを書いたんだろうか?」と理由を考えたくなるでしょう。

そのように考える読者をゼロにしたければ理解度ゼロであったことを認め、そういう方向で訂正すれば良かった。

タグ: 統計

posted at 22:30:32

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 私もTJOさんにブログ記事を書くときに悪意があったとは思っていません。

ランダムウォークの多項式フィッティングと交差検証で【そこそこ適切に下降トレンドを予測できている】などと、理解度ゼロでもない限り、絶対に考えません。

続く

タグ: 統計

posted at 22:30:29

黒木玄 Gen Kuroki @genkuroki

20年5月9日

プリンタのノズルチェックパターンのテスト印刷で添付画像1のように、PGBKの黒がかすれもせずに全く印刷されていない状態になっていたので(印刷された状態は添付画像2を参照)、まるで正常に印刷されているかのように見えてしまったのだ!😭

この手のことでガチでハマったのは久しぶり。 pic.twitter.com/Fx2CX40zuM

タグ:

posted at 21:59:26

Turing (https://baye @TuringLang

20年5月9日

@ChrisRackauckas Thanks for the kind words.

タグ:

posted at 21:44:06

Dr. Chris Rackauckas @ChrisRackauckas

20年5月9日

Also of note is a lot of updates for DiffEqBayes Bayesian parameter estimation updates. @TuringLang is performing very well these days, being by far the most robust estimation backend while besting Stan by about 3x-5x on our benchmarks and tests. Major applause to them!

タグ:

posted at 21:37:10

Dr. Chris Rackauckas @ChrisRackauckas

20年5月9日

We are excited to announce in the new #SciML ecosystem update a bunch of releases around automated model discovery with SInDy, Koopman DMD, and reservoir computing techniques. High weak order SDE integrators and Sundials #julialang updates as well.

sciml.ai/2020/05/09/Mod...

タグ: julialang SciML

posted at 21:33:40

TaKu @takusansu

20年5月9日

@shoyugi #超算数
その文献は掲示板で取り上げた事があります。
目を通して貰えれば幸いです。
8254.teacup.com/kakezannojunjo...

タグ: 超算数

posted at 21:15:21

ごまふあざらし(GomahuAzaras @MathSorcerer

20年5月9日

なんかのJuliaパッケージかな〜っと思ったら
プリンターだったって落ち.大変そうだけれど見るがわはちょっとほっこり. twitter.com/genkuroki/stat...

タグ:

posted at 21:07:24

黒木玄 Gen Kuroki @genkuroki

20年5月9日

私の失敗。ノズルチェックパターン印刷の結果が添付画像のようになっているのを確認して、「あれ?正常に印刷される!どうしてPDFなどを印刷すると黒だけが出ないんだ?」と思って、強力クリーニングを連発するなどの問題を解決しない方向に進んでしまった。

最初からググればよかった!😭 pic.twitter.com/V65u3hVcnG

タグ:

posted at 21:04:23

(「・ω・)「ガオー @bicycle1885

20年5月9日

最適化の章は私が書いたんですけど、いいこと書いてあるらしいですね。

タグ:

posted at 21:01:28

黒木玄 Gen Kuroki @genkuroki

20年5月9日

今日、苦労したこと。プリンタMG7730の添付画像1の状態(PGBKの黒のみが全く印刷されない)を直した(添付画像2)。方法はプリンターヘッドを取り外して、お湯で丸洗い。ググると同じトラブルの情報が多数見つかる。黒だけが出ないトラブル。

youtu.be/AOcPCCNkL7Q pic.twitter.com/v1fwt2ypel

タグ:

posted at 20:46:34

ごまふあざらし(GomahuAzaras @MathSorcerer

20年5月9日

```julia
struct Goma x end
Base.:+(g1::Goma,g2::Goma) = Goma(g.x+g.y)
```

ゴマちゃんに足し算定義できるんだ!!!!

タグ:

posted at 20:43:14

yng @yana_phys

20年5月9日

「1から始めるJuliaプログラミング」を読んでるけど色々知らないことが書いてあって勉強になる。最適化とか今まではできるだけ型つけて関数にしておけば速くなるだろうくらいの雑な認識だった

タグ:

posted at 19:30:22

Katsushi Kagaya @katzkagaya

20年5月9日

統計学史や概念史的な理解が欲しい場合には、適当ではないのかもしれませんが、実験科学者が学ぶにはここで提案されている方向性でのベイズ統計モデリングを学ぶのが良いように思います。

タグ:

posted at 19:24:00

ゆー @Yd_yuzu

20年5月9日

ほんとにこれずっと不思議だったんだよな。何故か当たり前のように正規分布のモデルを使っているがどうして使っているのか誰も知らないみたいな気持ち悪さは間違いではなかったんやな twitter.com/genkuroki/stat...

タグ:

posted at 19:21:33

Nyoho @NeXTSTEP2OSX

20年5月9日

おいおいおい新型コロナにうつつを抜かしとる間に(3月頃)、MathJax 3として完全に生まれ変わっとるじゃないか!!!!!!! < What’s New in MathJax v3.0 — MathJax 3.0 documentation docs.mathjax.org/en/latest/upgr...

タグ:

posted at 19:21:20

Katsushi Kagaya @katzkagaya

20年5月9日

データではなく観測変数、パラメータではなく非観測変数、尤度やpriorやではなくたんに分布、posteriorではなく条件付分布としたらどうか、という提案が次の講演の中でなされていました。そしてすべての変数の結合確率分布を設計する、と。同意できる点が多かったです。
youtu.be/yakg94HyWdE

タグ:

posted at 19:14:36

Shisato @4310sy

20年5月9日

@Cpp_Learning ぼちぼち他の言語に手を出したいと考えてたので、参考になります。手を出す候補としては、Go, Rust, Kotlin, Juliaあたり。
各々でいろんな言語を触った感触を共有して、比較出来たら面白そうですね。

タグ:

posted at 18:53:46

yuyai @yuyargon

20年5月9日

@genkuroki ご指摘ありがとうございます.
主義や名前に捉われず,概念を理解するよう努めます!

タグ:

posted at 18:16:10

Lénaïc Chizat @LenaicChizat

20年5月9日

This video shows the evolution of the parameters (left) and the predictor (right) for a wide 2-layer ReLU neural network (gradient descent on logistic loss). I explain a bit of what's going on in this virtual talk I gave at MSRI (jt. work w/@BachFrancis) www.msri.org/workshops/928/... pic.twitter.com/lYZ3TWE63Z

タグ:

posted at 17:57:39

黒木玄 Gen Kuroki @genkuroki

20年5月9日

@sekibunnteisuu #掛算 リンク切れ回復

eprints.lib.okayama-u.ac.jp/ja/list/journa...
岡山大学算数・数学教育学会誌 : パピルス

eprints.lib.okayama-u.ac.jp/files/public/5...
岡山大学算数・数学教育学会誌 : パピルス11巻--算数的活動の内面化の過程を大切にした算数の授業 ―1年「たし算(1)」の指導を通して―

タグ: 掛算

posted at 17:56:24

Katsushi Kagaya @katzkagaya

20年5月9日

同感です。「アンチベイズ的言葉を使ってベイズ統計を学ぶにはコストがかかるのでは?しかしどうしたら良いかは分からない」 / htn.to/RjgKLn4vpi

タグ:

posted at 17:41:00

非公開

タグ:

posted at xx:xx:xx

ごまふあざらし(GomahuAzaras @MathSorcerer

20年5月9日

結果論として累積分布函数 cdf を作れればそれでOKっていうことになるんだけれど真面目に取り上げてる文献少なそうだったから書いてみた.まぁみんなAPI使えればいいってことなんでしょうけれど.

タグ:

posted at 16:56:54

tora8 @tora8enl

20年5月9日

左巻 健男さんの「ドキュメント スラップ名誉棄損裁判 EM菌 擁護者と批判者の闘い」はamazonだと新品3,000円だけど、セブンネットだと定価の200円で買える。たぶん版元から直仕入れているからかな?
勢いあまって書いてあるのでちょい読みづらいけど、出口某とか比嘉某がお〇かなのはよくわかる。 pic.twitter.com/9TgS7aVfuf

タグ:

posted at 16:49:01

ごまふあざらし(GomahuAzaras @MathSorcerer

20年5月9日

ダイレクトマーケット
受けたのでステマしようと思います.

www.amazon.co.jp/dp/433902905X

タグ:

posted at 16:46:58

TaKu @takusansu

20年5月9日

@hk40m 個人的には、分数を習った後は、「6÷4=1+2/4」という表記もいいと思っています。
「4」という情報を削るから問題が発生します。
分母を「4」にする事で分子を余りにし、目的に応じて約分をしないという選択も可能というのは、式についての認識も深めると思います。

タグ:

posted at 16:27:03

カイヤン @389jan

20年5月9日

例えば、数理モデルの啓蒙記事で過去データにフィットさせて外挿予測するという瑕疵をぼこぼこにしてた人が某については啓蒙のうえでしばしば過剰に簡単にしてしまうことはあると言ってるのとか

タグ:

posted at 16:11:39

非公開

タグ:

posted at xx:xx:xx

カイヤン @389jan

20年5月9日

某、普段はテクニカルな瑕疵に猛砲撃する界隈が全力で忖度して庇ってるの最高に気持ち悪いな

タグ:

posted at 16:07:22

へいほぅ @h3y6e

20年5月9日

Juliaをメインに用いる数値計算系の研究室があるの羨ましい #JuliaTokai

タグ: JuliaTokai

posted at 15:17:40

Shuhei Kadowaki @kdwkshh

20年5月9日

割り切ってアンダースコア使った方が小回り効くし。

タグ:

posted at 15:09:10

Shuhei Kadowaki @kdwkshh

20年5月9日

昨日のyoutube聞いた感じ`DataFramesMeta.@linq` 使うのあんまいいアイディアじゃないっぽいな。
確かにPipe.jlを使う方がDataFrames.jlのAPIだけを使えばよくてシンプルな気がする。
simple dataframe chaining while plotting:

gist.github.com/aviatesk/644d8...

#Julialang twitter.com/kdwkshh/status...

タグ: Julialang

posted at 15:06:59

(「・ω・)「ガオー @bicycle1885

20年5月9日

#JuliaTokai Clean Architectureってはじめて聞いた

タグ: JuliaTokai

posted at 14:57:27

へいほぅ @h3y6e

20年5月9日

最近触ってるGenie.jlだ #JuliaTokai

タグ: JuliaTokai

posted at 14:53:04

ごまふあざらし(GomahuAzaras @MathSorcerer

20年5月9日

#JuliaTokai

Matlab,必要な機能を得るのに追加料金かかるのか.
Juliaは無料っていうのはすごくありがたいみたい.

タグ: JuliaTokai

posted at 14:38:07

非公開

タグ:

posted at xx:xx:xx

非公開

タグ:

posted at xx:xx:xx

おばけ @triwave33

20年5月9日

Franklin.jl使ってみたくなる #JuliaTokai

タグ: JuliaTokai

posted at 14:20:03

黒木玄 Gen Kuroki @genkuroki

20年5月9日

Re:RT そもそも布マスク全然届かない。実は結構楽しみに待っているのだが。

タグ:

posted at 14:11:13

へいほぅ @h3y6e

20年5月9日

ブログ書くのにHugo使ってるけどFranklin.jl使ってもいいなぁ,数式がライトに書けるのよさそう #JuliaTokai

タグ: JuliaTokai

posted at 14:09:04

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 20世紀の統計学において主義と主義がぶつかり合っていた論争はどちらかと言えば黒歴史であり、現代の我々はそういうのから距離をおくべきだと思います。

watanabe-www.math.dis.titech.ac.jp/users/swatanab...
統計学入門
「主義」 を心配するみなさまに
東京工業大学 渡辺澄夫

タグ: 統計

posted at 14:06:47

へいほぅ @h3y6e

20年5月9日

ごまふあざらしさん #JuliaTokai

タグ: JuliaTokai

posted at 14:01:51

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 個人的な意見では、Fisherさんの "fiducial何某" に関わるのは時間の無駄だと思います。

原則として人の名前をつけなければいけないような「思想」の類は全部無視して問題ないと思う。

渡辺澄夫『ベイズ統計の理論と方法』に書いてあるような数学的な事柄の方がずっと大事。 twitter.com/nyanko05154144...

タグ: 統計

posted at 14:00:46

ばたっち(ばたにふ屋本店) @batanif

20年5月9日

新型コロナウイルスとともにさらに広がるニセ科学 - 左巻健男|論座 - 朝日新聞社の言論サイト webronza.asahi.com/national/artic...

タグ:

posted at 13:41:06

ごまふあざらし(GomahuAzaras @MathSorcerer

20年5月9日

#JuliaTokai

だがやーのHPやっぱり面白いw

タグ: JuliaTokai

posted at 13:40:56

Dolphin7473 @Dolphin7473

20年5月9日

喫緊の用事でラボに書類取りに行ったついでに常識を回収してきた pic.twitter.com/8u2v6eIhMs

タグ:

posted at 13:35:02

(「・ω・)「ガオー @bicycle1885

20年5月9日

止まっちゃった。俺だけ? #JuliaTokai

タグ: JuliaTokai

posted at 13:33:31

天むす名古屋 Temmus @temmusu_n

20年5月9日

@OokuboTact #超算数 直前のツイートは、大矢真一さんが書いた【当時は答えさえ出ればよいのであって、被乗数と乗数を理論的に峻別はしていないのである。】にむかっ腹を立てているんです…

タグ: 超算数

posted at 13:23:48

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 東京大学教養学部統計学教室編『統計学入門』における信頼区間、尤度、最尤法、ベイズ統計、自由度、最小二乗法などの基本概念の説明はことごとく不適切だと思う。

安心して読める教科書を1つも知らない。

基本概念の正しい習得のためには、自分で科学的に考え直すしかなさそう。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 13:18:10

天むす名古屋 Temmus @temmusu_n

20年5月9日

@OokuboTact #超算数 日本が19世紀に乗り換えた西洋の数学でも、遅くて18世紀までに乗数と被乗数はどっちでもよいという考えが現れているのにねえtwitter.com/temmusu_n/stat...。それは19世紀の教科書にもtwitter.com/genkuroki/stat...、20世紀前半の算数教育専門家の論文にも現れているんですtwitter.com/temmusu_n/stat...

タグ: 超算数

posted at 13:16:22

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 資料

* 95%信頼区間における95%はモデル内標本分布で測った確率(の近似値)であり、「割合」と言い直す必要はない。

* モデル内標本分布は現実とは違う。モデルの現実への適用が妥当でない場合には95%という数値は信頼できないものになる。

東京大学教養学部統計学教室編『統計学入門』p.225 pic.twitter.com/M7j21lbFQY

タグ: 統計

posted at 13:08:05

Masa Yamamoto予測誤差が大き @mshero_y

20年5月9日

無条件での正規分布適用は本当に困ったちゃん問題。会社でこれで喧嘩になった。今も和解はできていない。無条件派は疑ったことが過去一度もないので屁理屈&難癖を単につけているという解釈のようで…こちらは100個のサンプルでいいから確認してよ… twitter.com/genkuroki/stat...

タグ:

posted at 13:05:08

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 以上では信頼区間に関する入門的な話を長々としていますが、統計学的予測について理解を深めておけば、そこで得た経験がもっと先に進んでも(もっと難しい場合の統計学的予測に関する考察でも)、ずっと役に立ち続けそうなことが伝わればうれしいです。

基本は大事。

タグ: 統計

posted at 12:58:24

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 統計学的予測(統計学入門で習う信頼区間はその典型例)においては使用した数学的モデルの現実における妥当性が常に問題になる点を強調して欲しいです。

実際には「頻度論95%信頼区間の95%は確率ではなく、割合だ」というデタラメとベイズ統計に関するデタラメが悪魔合体して猛威をふるっている。

タグ: 統計

posted at 12:54:42

ジーベンロック動物図鑑 @kame_fuji

20年5月9日

【サルパ・マッジョーレ】
無色透明の海洋生物。自分のクローンを作り繁殖するらしい。名前がジョジョのキャラっぽい。 pic.twitter.com/1bDm6YYWGO

タグ:

posted at 12:52:04

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 統計学入門の教科書によくあるこのスレッドの上の方でも触れた平均の信頼区間を扱うときに、現実にはぴったり一致するはずがない正規分布モデルを使っていることの是非に関する解説はほとんどされません。

それは極めて非科学的な態度での解説で問題有りすぎだと思う。

タグ: 統計

posted at 12:50:38

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 真の分布や真の値は固定されているのですが、真の分布が生成するサンプルは確率的に揺らぐので、サンプルから計算した信頼区間は確率的に揺らぐ。統計学入門!

もっと強調されるべきことは、

信頼区間の信頼性は使用した数学的モデルに強く依存していること

です。これが最も重要。

タグ: 統計

posted at 12:45:17

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 サンプル(という名の)確率変数の分布が与えられるごとに、信頼区間の両端の値が確率変数として決まるわけです。i.i.d.としてのサンプルの分布は、その各要素の分布(真の分布と呼ぶ)で決まり、真の分布における真の値が信頼区間に含まれる確率を考えることができる。

タグ: 統計

posted at 12:40:53

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 95%信頼区間は

* サンプル(データ)
* その計算に用いた数学的モデル
* 近似計算法

の3つで決まります。統計学ではサンプルが運悪く偏っているせいで予測に失敗するリスクを扱うために、サンプルを確率変数として扱います。確率変数の函数は確率変数なので信頼区間の両端の値も確率変数。続く

タグ: 統計

posted at 12:37:57

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 【頻度論的な○○%信頼区間の○○%は「確率ではなく割合だ」】と言い張るおかしな信頼区間警察をたまに見ます。

しかし、95%信頼区間の95%を確率と呼ぶこと自体が間違いではないし、統計学入門を正しく理解できていれば決してそのようなことは言えないはずです。

やはり、信頼区間も大事。 pic.twitter.com/vC3RM4EhmT

タグ: 統計

posted at 12:34:56

OokuboTact 大久保中二病中年 @OokuboTact

20年5月9日

@temmusu_n

【 江戸時代の掛け算 】

大矢真一『和算入門』によると、和算では乗数と被乗数の違いは本質ではないそうです

#超算数 #和算 pic.twitter.com/ruxHCfXQ4c

タグ: 和算 超算数

posted at 12:25:42

坂上二郎ラモ(栗栖綾香)★★★★★★★✯ @sucknoway260

20年5月9日

@TOTB1984 @covid19jyoho このまんが読んだことないですけど…
妊婦のこの症状がフィクションで最初に取り上げられたのは知る限りたぶんアメリカのドラマER(1994年)の第1シーズン第19話「生と死と」じゃなかろうか…と。15年続いた作品の中でも五指に入る傑作回。是非ドクターに見て頂きたいです。

タグ:

posted at 11:20:02

(「・ω・)「ガオー @bicycle1885

20年5月9日

お、Julia 1.5のブランチが切られてる。

タグ:

posted at 10:30:17

黒木玄 Gen Kuroki @genkuroki

20年5月9日

それとも裏拳か?

タグ:

posted at 09:30:52

黒木玄 Gen Kuroki @genkuroki

20年5月9日

Re:RTs 蹴られたのかな?(笑)

タグ:

posted at 09:26:24

松浦 健太郎 @hankagosa

20年5月9日

TJOさん本人は凄くいい人で悪意はないはず。ただ、数理やコーディングの理解のあやふやさを達者な日本語でぼかしてはいけないと思う。そういう良くない部分だけを真似て、TJOさんに憧れてます!という人が周りに現れはじめて実害が出てきたので、たまに警鐘を鳴らすことにしました。

タグ:

posted at 09:25:19

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 「いまさら信頼区間かよ!」かもしれませんが、「信頼区間による予測」の数値例について計算を地道に積み重ねる過程で、「統計的予測がうまく行くこと」について正しい認識が心に染みつき、set.seed(102)の場合の特殊なランダムウォークの場合の結果だけで判断する誤りを犯さなくなるはずです。

タグ: 統計

posted at 09:15:16

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 「時系列データに基く予測の交差検証」は実は非自明な難しい問題です。

数学がらみのことは、自分でもよく理解できる入門的な事柄から順番に地道に理解して行くことが基本です。

例えば、信頼区間の予測がいつどのくらいうまく行くかについて、色々計算して感じをつかむのは良いことだと思う。

タグ: 統計

posted at 09:15:13

Katsushi Kagaya @katzkagaya

20年5月9日

ちなみにそのドクターの名前がリバイ。腕が良かったのはほんとに幸運だった。

タグ:

posted at 09:12:46

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 続き。だから「95%信頼区間に真の値が含まれる確率」と聞いたら、その確率はサンプルの確率的変動に由来する確率の意味だと解釈することは入門的な基礎の範疇。

ただし、信頼区間を計算するために使ったモデルが妥当でないとその95%という数値が近似的にも正しい数値でなくなることに注意!

タグ: 統計

posted at 09:07:12

松浦 健太郎 @hankagosa

20年5月9日

TJOさんのブログ記事、業界与太話や書籍写経の記事は良いと思うけど、分析やコーディングの記事は理解があやしいものが多い(ロジスティック回帰、時系列、モデルの評価など)。データサイエンス力を高めたい人は注意深く読もう。他の情報も確認しよう。

タグ:

posted at 09:05:05

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 統計学入門では、母集団からのサンプルの無作為抽出の統計学について習います。そのストーリーでは、確率概念はサンプルの無作為抽出の形で統計学に導入されます。

だから「確率」という用語を「サンプルが確率的に揺らぐこと」を要因とした確率の意味で解釈することは入門的な基本。続く

タグ: 統計

posted at 09:03:39

Tetsuro Miyatake @tmiyatake1

20年5月9日

Amazonで仕事している人たちにとっては当たり前だが、Amazon従業員が学ぶライティングティップス
・1センテンスで単語数は30以下
・形容詞をデータで置き換える
・漠然とした言葉を無くす
・質問を受けた際に、4つの回答方法がある(はい、いいえ、数字、分からない)

事例も書いてくれてて参考になる twitter.com/destraynor/sta... pic.twitter.com/EC6VQ8Qk1m

タグ:

posted at 09:03:38

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 訂正&解説追加

❌ベイズ信頼区間→⭕️ベイズ信用区間(確信区間)

「95%信頼区間に真の値が95%の確率で含まれる、と確率という用語を使って説明してはいけない」というような考え方は誤りです。

この辺はベイズ統計に関するデタラメな解説と悪魔合体して困ったことになっています。続く twitter.com/genkuroki/stat...

タグ: 統計

posted at 08:58:08

Katsushi Kagaya @katzkagaya

20年5月9日

在米時に親知らずを抜いた歯医者からメールが来て、なくなった歯と高かった治療費に思いを馳せた。

タグ:

posted at 08:53:29

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 例えば、set.seed(102)とすることによって選択された特別なランダムウォークの場合を例に出して、ランダムウォークにトレンドなどないのに、「そこそこ適切に下降トレンドを予測できていることが分かります」などと書いている解説を読者は信用するべきではありません。

タグ: 統計

posted at 08:45:22

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 統計学的予測のユーザーになることに勧誘する人たちはギャンブルに誘っていることになる。

ギャンブルに誘う人は、うまく行く場合だけではなく、どのように失敗する可能性があるのか正直に説明する必要があると思います。

逆に言えばこれで真っ当な解説を判別できる。

タグ: 統計

posted at 08:39:26

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 例えば、t分布で平均の95%信頼区間を求めるとき、サンプルを生成した分布が正規分布でなくても一様分布やΓ(α=10, θ)分布なら予測が(確率的に)うまく行くが、左右の対称性が大きく崩れた分布だとうまく行かなくなることがある。

タグ: 統計

posted at 08:35:57

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 「分布Aのサンプルに方法Mを使って予測がうまく行くか?」を確認するときには、分布Aのサンプルを多数生成して確率的にうまく行く程度を見積もることが必須なのですが、それだけではなく、予測がうまく行く分布Aとうまく行かない分布Bの両方の例を作ることが大事だと思います。

タグ: 統計

posted at 08:32:10

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 サンプルを生成した分布が対称形から程遠い場合(例えば数学の実力のように母集団の中に飛び抜けて優れた小集団が含まれている場合)には、t分布を使って求めた平均の95%信頼区間の95%という数値は信頼できなくなります。

こういうことがあるので要注意。

タグ: 統計

posted at 08:23:27

Lambda @LambdaAPI

20年5月9日

Starting a deep learning project this weekend?

The Lambda Cloud 4 GPU instance comes pre-installed with @ProjectJupyter, @TensorFlow, @PyTorch, and other major AI / ML frameworks for $1.50 / hr.

lambdalabs.com/blog/getting-s...

タグ:

posted at 08:22:51

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 正規分布モデルを使ったt分布を利用する巧妙な方法による平均の95%信頼区間による予測において、95%という数値は、サンプルが正規分布で生成されている場合には正確な値なのですが、正規分布以外の場合にもほぼ95%になることもあるし、例えば78%というような95%より小さくなることもあります。

タグ: 統計

posted at 08:19:52

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 続き #Julia言語

実際にそういうことをやってみた例↓

nbviewer.jupyter.org/gist/genkuroki...
母平均の仮説検定と区間推定

t分布を使った平均の信頼区間に真の平均が含まれる確率を見積もっています。(この文を見て「ベイズ信頼区間と混同している?」などと感じる人はダメ解説に踊らされている) pic.twitter.com/IZnlF6rB15

タグ: Julia言語 統計

posted at 08:16:15

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 続き。平均の95%信頼区間には、95%程度の確率でサンプルを生成した真の分布Aの平均値が含まれていて欲しいので、コンピュータで、分布Aのサンプルを多数生成して、その各々について95%信頼区間に分布Aの平均値が含まれるかどうかを確認し、含まれる確率を見積もる必要があります。

タグ: 統計

posted at 07:18:14

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 続き。そのとき、コンピュータで生成した分布Aの1つのサンプル(数列)から求めた信頼区間に分布Aの真の平均値(期待値)が含まれていることを確認しただけで、「分布Aについてもt分布で求めた平均の信頼区間による予測はうまく行っているようだ」と思ってはいけない。

これ、当たり前ですよね!

タグ: 統計

posted at 07:15:16

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 続き~求めてみたとしよう。

分布Aのサイズnのサンプルから求めた平均の95%信頼区間は「分布Aの真の平均値は概ねその区間に入っているだろう」というスタイルの予測で使われる。(実践的にはAは未知の分布になる。)

Aが正規分布以外のときにどうなるかを確認したい。続く

タグ: 統計

posted at 07:11:46

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 例えば、統計学入門の教科書を見たら、正規母集団の仮定のもとでt分布を使った平均の信頼区間の計算法が書いてあり、正規母集団を仮定していることに疑問を持ったとする。

そこで、コンピュータで正規分布以外の確率分布のサンプルを生成して平均の信頼区間を~続く

タグ: 統計

posted at 07:11:42

黒木玄 Gen Kuroki @genkuroki

20年5月9日

#統計 ど素人過ぎて(理解不足が原因で)、「予測」の取り扱いについて、うまく説明できていない感じなので、再度書く。言うべきだったポイントは多分これ↓

* 数値実験で予測がうまく行っていることを示すには、複数(沢山)のデータを生成してその各々で予測の結果がどうなっているかを確認するべき。

タグ: 統計

posted at 07:01:12

非公開

タグ:

posted at xx:xx:xx

ごまふあざらし(GomahuAzaras @MathSorcerer

20年5月9日

Python3.8 が枯れた頃にはJulia台頭してるでしょ

タグ:

posted at 00:28:59

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました