Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
並び順 : 新→古 | 古→新

2022年08月10日(水)

上海II @shanghai_ii

22年8月10日

収支報告書はデジタル申請を義務化して検索できるようにすべきやな。河野さん、最初の仕事としてお願いします>@konotarogomame

タグ:

posted at 23:39:22

上海II @shanghai_ii

22年8月10日

収支報告書を調べるのにこのサイトいいね。
openpolitics.or.jp
都道府県⇨議員で絞るのがよさげ

タグ:

posted at 23:37:14

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 超幾何分布、二項分布、ベータ二項分布(負の超幾何分布、ポリアの壺での二項分布の類似物)の3種の離散分布は「仲間」とみなして、共通の方法で期待値を求めておくとスッキリします。

分散なども同様の方法で求まります。 twitter.com/genkuroki/stat... pic.twitter.com/qLhdIFNpsa

タグ: 統計

posted at 23:31:55

清水 団 Dan Shimizu @dannchu

22年8月10日

数学Bの確率分布と統計的な推測

『二項分布B(n,p)$の平均,分散,標準偏差を求めよ。』

教科書の例題はn=10,p=1/6。
n=50,p=1/5の分布をグラフで見たい時はコーディング

#julia言語 pic.twitter.com/zT3hmAhOoJ

タグ: julia言語

posted at 23:11:08

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 私もやってみた。

私はずるをして確率分布のパッケージを使ってしまいました。

そのパッケージのドキュメントは

 確率分布のギャラリー

になっていて勉強になります。

juliastats.org/Distributions....

github.com/genkuroki/publ... twitter.com/dannchu/status... pic.twitter.com/yH5rn0NAoo

タグ: Julia言語

posted at 23:06:45

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 どういう試行錯誤をやればすんごい人になれるかについて知りたい人は、松浦さんのブログを見ればよいと思います。

非常に面白いです。

statmodeling.hatenablog.com/archive

タグ: 統計

posted at 22:48:42

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 そういう泥臭い面倒な試行錯誤をしておけば、理解が深まる。そのためには、コンピュータでの計算法を含めて色々マスターする必要がある。個人的には次の本が好きです。

松浦健太郎『StanとRでベイズ統計モデリング』
www.amazon.co.jp/dp/4320112423

タグ: 統計

posted at 22:45:50

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 事前分布の取り方の恣意性がきになるなら、事前分布を色々変えてみて、結果がどう変わるかを数学的に調べてみればよいです。

もちろんコンピュータを使って構わない。

タグ: 統計

posted at 22:39:58

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 主義に逃げて安易に答えを得ようとせずに、S市の中3男子全体の母集団からn人分の身長のサンプルを無作為抽出して、それを平均身長などが確率変数であるようなモデルでは使うとどうなるかを数学的に調べることが必要なのです。

手計算が苦手ならコンピュータで調べてみればよいと思います。

タグ: 統計

posted at 22:38:33

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 そういう勉強の仕方をすると、勉強したせいで頭が悪くなってしまう。

統計学的なツールの使用可能条件を、ある特定の主義に帰依しているかどうかで決めるというちょっとあり得ないレベルで非科学的な思考を平気でするようになってしまう。

馬鹿が増える。

こういうのはもうやめた方がよい。

タグ: 統計

posted at 22:27:22

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 これを知らないとベイズ統計の勉強時に、現実には決まった定数になっているS市の中3男子全体の平均身長を、事前分布を使って確率変数とみなしてよいことを、怪しげなことをしていると感じたり、「頻度主義とベイズ主義の違い」で納得しようとしたりする愚かな方向に進みがちになる。

タグ: 統計

posted at 22:24:45

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 使っている統計モデルが目的にとって妥当であるかどうかは、現実を正確に記述している可能性があるかどうかでは決められません。

現実を正しく記述していないことが確実なモデルを使った方が、数学的理由によって勝ち目がある統計分析になる可能性もあるわけです。

タグ: 統計

posted at 22:24:43

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 現時点でのS市の中3男子全体の平均身長は決まった定数になっていると考えられるので、平均身長にあたるモデルのパラメータが確率変数になっているようなベイズ的なモデルを使うと、そのモデルは現実の記述としては全然正しくないモデルになります。

しかし、そういうモデルも役に立つ。

タグ: 統計

posted at 22:19:07

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 このスレッドでAさんに0<p<1を満たすpの値を最初に決めさせる場合には、私はpを確率変数でモデル化するのが自然だと思いますが、nを増やして定数パラメータpを持つ二項分布モデルを使っても構わない。

タグ: 統計

posted at 22:15:57

清水 団 Dan Shimizu @dannchu

22年8月10日

数学Bの確率分布と統計的な推測

『白玉k個,黒玉N-k個が入っている袋の中から,同時にn個を取り出す。白玉の個数をXとする。平均,分散,標準偏差を求めよ。』

教科書の例題はk=7,N=10,n=2。
k=20,N=100,n=10で調べたい時はコーディング

#julia言語 pic.twitter.com/Vs0NR563BL

タグ: julia言語

posted at 22:05:52

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 正しくないが特定の目的のためには妥当なモデルを使うことになる。

例えば、S市の中3男子全体の平均身長(←これは確定した定数)を推測するために、平均身長のモデル化になっているパラメータが確率変数になっているモデルを使って構わない。

これがダメならベイズ統計は役に立ちません(笑)。

タグ: 統計

posted at 22:04:23

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 「ありがちな状況では数学的理由によって近似的に一致する」という発想をできずに、「ぴったり一致するか否か」という発想しかできないと、統計学の基礎部分を丸ごと全部理解できなくなるので注意。

「すべてのモデルは正しくない」が統計学に基本。

タグ: 統計

posted at 22:04:22

鰹節猫吉 @sunchanuiguru

22年8月10日

大学数学でも #超算数 が横行しているのか… twitter.com/rQKjYbBQ0zGiqP...

タグ: 超算数

posted at 22:02:58

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 以上の話と全然関係ない話になるが、

rand()^2 + rand()^2 ≤ 1 ならば s に 1 を足すというコードを書くときには、if も ifelse もいらない。

s += rand()^2 + rand()^2 ≤ 1

だけでよいです。 pic.twitter.com/NFV4QNPCuW

タグ: Julia言語

posted at 21:48:21

Akinori Ito @akinori_ito

22年8月10日

@ManabuShakai 人件費と研究費を混ぜて考えればそうですね

タグ:

posted at 21:41:10

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 xと同じ型の0はzero(x)、xの型へのスカラー倍の意味での次元を持たない1はone(x)、xと同じ型の1はoneunit(x)です。添付画像を参照。

函数の引数の型情報の適切な伝搬のためにこれらは必要になる。

抽象代数学の素養があれば自然に使えるようになりやすい。 pic.twitter.com/kxzbLuzHh8

タグ: Julia言語

posted at 21:38:15

Akinori Ito @akinori_ito

22年8月10日

@ManabuShakai 企業と国の支出の各国比較はこちらを参照
www.nistep.go.jp/sti_indicator/...
今問題なのは、研究費が競争的資金化されているのもありますが、もっと重大なのは人件費がないことです。多くの大学は現状の人員を維持する人件費をもらっていない。

タグ:

posted at 21:35:43

Viral B. Shah @Viral_B_Shah

22年8月10日

@wdonald_1985 @marcpabst @BatesDmbates is the author of lme4 and MixedModels.jl as well.

タグ:

posted at 21:35:21

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 f(a,b)の定義中の s = zero(a+b) は何か?

zero(a+b) は a+b と同じ型のゼロという意味です。

無駄なa+bの計算はコンパイラが除去。

s = 0 だとsがIntに決め打ちされ、引数の型と合わない可能性が出て来る。

本当は s = zero(eltype(a:b)) とするべきかも。

github.com/genkuroki/publ... pic.twitter.com/HwKXDQ6mMn

タグ: Julia言語

posted at 21:29:23

Akinori Ito @akinori_ito

22年8月10日

@ManabuShakai 研究「開発」費には企業の開発費が含まれているはず

タグ:

posted at 21:24:18

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 f_annotatedの側で引数に型注釈をつけた効果は、単にf_annotated(10.0, 20.0)などがエラーになることだけです。

引数にへたに型注釈を付けると単に損をするだけになってしまいがちなので要注意。

型注釈の代わりに、doc stringに函数の仕様をメモっておくと便利です。 pic.twitter.com/vendnKRNuD

タグ: Julia言語

posted at 21:23:02

渡辺 明 @watanabe_1984

22年8月10日

対局についてはブログに書きました。
こんな解説、本人しか出来ないから、それだけで認証して欲しいですw

blog.goo.ne.jp/kishi-akira/e/...

↓RT、明日夜のオンライントークショー、お申し込みは本日23時までです!

タグ:

posted at 21:21:44

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 Juliaでは 、f(10, 20)を、引数の10, 20の型のIntを取得して、その型情報を使って、ネイティブコードにコンパイルしてから実行します。

だから、引数に型注釈をつけなくても、f(10, 20)はf_annotated(10, 20)と同じネイティブコードにコンパイルされることになります。

タグ: Julia言語

posted at 21:19:59

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 添付画像を見れば分かるように、引数に型注釈をつけていないプレーンなf(10, 20)と型注釈をつけたf_annotated(10, 20)は完全に同じネイティブコードにコンパイルされてから実行されます。

函数の引数に型注釈をつけても計算速度は改善されません。

github.com/genkuroki/publ... pic.twitter.com/Itnpid4eNh

タグ: Julia言語

posted at 21:16:33

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 函数の引数に余計な型注釈を付ける必要はないです。つけても計算速度は改善されない。

これ、Juliaを理解するときの最初の関門かも。

添付画像の2つの函数はaからbまでの和を計算します。

f_annotatedの方は引数にIntの型注釈をつけています。

続く

github.com/genkuroki/publ... pic.twitter.com/0dtIHsfl2D

タグ: Julia言語

posted at 21:16:30

積分定数 @sekibunnteisuu

22年8月10日

#超算数

「守破離 指導書」でツイッター内検索
twitter.com/search?q=%E5%A...

タグ: 超算数

posted at 21:16:30

清水 団 Dan Shimizu @dannchu

22年8月10日

数学Bの確率分布と統計的な推測

『n個のサイコロを同時に投げるとき,出る目の和をXとする。確率変数$X$の確率分布を求めよ。』

教科書の例題はn=2。nを大きくして,どうなるか調べたい時はコーディング

#julia言語 pic.twitter.com/t79C43bmPk

タグ: julia言語

posted at 21:14:48

非公開

タグ:

posted at xx:xx:xx

清 史弘 @f_sei

22年8月10日

「2次不等式x^2+bx+c<0を解くにはね、まず、2次方程式を解くんだ。その解をα、βとでたら、不等号が『<』なら、αとβの間と覚えよう。どうだい簡単だろ。わかりやすいだろ」
と理由のない手順のみの説明をしている人が国立大学の入試を解説している動画を見てみたい。

タグ:

posted at 20:44:55

清 史弘 @f_sei

22年8月10日

その程度の説明ならば、私の周りの数学の先生(予備校関係・フォローしている人)は全員できると思う。ただ、それをやると数学の先生ではなくなるので、やらないだけ。
手順の説明だけならば、プロのアナウンサーに頼んだ方がもっとわかりやすいものができると思う。

タグ:

posted at 20:40:57

清 史弘 @f_sei

22年8月10日

久々に某教育系動画を見た。
まあ、その動画の感想は書かないけれど、たぶん「答が出るのまでの手順を『覚える』ことが数学の学習」と思う人が日本の中で、相当数いるのだと思う。
答が出るまでの手順をわかりやすく説明して、「どうだすごくわかりやすいだろう」と言わんばかりのものも見かけるが、

タグ:

posted at 20:40:57

雨宮純 @caffelover

22年8月10日

彼女は夫のJerry Hicks氏と共に夥しい数の自己啓発本を出版していますが、この夫妻は元々何をやっていたか。実はアムウェイのハイレベルディストリビューターでした。二人は会員向けに自己啓発商材を売っていました。自己啓発で稼ぐのはマルチ商法でよくあるパターンです。

abrahamhicksfraud.blogspot.com/p/whats-so-bad...

タグ:

posted at 20:25:10

小林泉美(囲碁棋士) @cho_kobayashi

22年8月10日

赤ハート先でピンクハートを全部取って下さい。有名な手筋を使います。
#張栩 #5路盤 #詰碁 #初級
#ランドセルリメイク #囲碁

ランドセル裏地もそのまま再利用♬リバーシブルで楽しめる碁盤です✨碁石も盤に合わせました💖 #ハートラミーゴ twitter.com/cho_kobayashi/... pic.twitter.com/rXas6Y2zUC

タグ: 5路盤 ハートラミーゴ ランドセルリメイク 初級 囲碁 張栩 詰碁

posted at 20:00:09

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 その辺が面倒だと感じるなら、

discourse.julialang.org/t/ann-concrete...

を使うとよいかもしれません。

struct Foo{Ta, Tb, Tc}
a::Ta
b::Tb
c::Tc
end

の代わりに

using ConcreteStructs

@ concrete struct Foo
a
b
c
end

と書けます。 twitter.com/tsatie/status/...

タグ: Julia言語

posted at 18:09:53

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語

structの定義の頻繁な変更が必要な試行錯誤時には

module O
struct Foo{A,B,C}
a::A
b::B
c::C
end
end

として、O. Foo を使うようにして、Fooの定義を変更するためにはモジュールOごと上書きするという手が使えます。

これはstructに限らず、使えて結構便利。 twitter.com/genkuroki/stat...

タグ: Julia言語

posted at 17:59:46

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 高速計算のためのコンパイルで必要な型情報を、

❌函数の引数の型注釈

で与えようとするのではなく、

⭕️函数に引数として与えるデータを格納した変数の型及びその型の適切な伝搬

として与えると考える。

タグ: Julia言語

posted at 17:05:47

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 Juliaのありがちな使い方は、引数の型注釈をできるだけ書かずに、引数の具象型が適切に伝搬するように函数を書いて、その函数に引数として与えるデータは型が確定するように気を使う。(Vector{Any}やVector{Real}型の引数を函数に与えない。)

タグ: Julia言語

posted at 17:03:07

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語

基本的に函数の引数の型注釈無しで書いたBrunner-Munzel検定のpermutation版のJuliaによるお手軽実装が、FORTRAN並に速かったという話
twitter.com/genkuroki/stat...

タグ: Julia言語

posted at 16:58:09

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 Int64で使う予定だったコードが、そのままBigIntやFloat64でも使えている場合。型注釈無しでもCやC++並の速さで計算してくれる。
twitter.com/genkuroki/stat...

タグ: Julia言語

posted at 16:55:29

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 Juliaでは実行時に具象型の情報が伝播するように書くことが大事で、型注釈を下手につけて型を制限しても計算速度的なメリットはない。

タグ: Julia言語

posted at 16:46:50

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語

struct Foo
a
b::Real
c::AbstractArray{Float64}
end

のように書くと遅くなる。この辺を理解できていない人は

struct Foo{Ta, Tb, Tc}
a::Ta
b::Tb
c::Tc
end

のように書くとよい。フィールドの型を抽象型にするミスを犯さずに済むし、型名も書かずに済む。

タグ: Julia言語

posted at 16:44:51

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語

Juliaでは函数の引数の型注釈の有無は計算速度に影響しない。

そのお陰で、計算速度を犠牲にせずに、函数の引数の型注釈を一切書かずに(もしくはディスパッチのために必要最小限で)済ませられる。

これは結構便利で、Int64用に書いたつもりの函数がBigIntやFloat64でも使えたりする。 twitter.com/ari23ant/statu...

タグ: Julia言語

posted at 16:40:54

日経Linux | ラズパイマガジン @nikkei_Linux

22年8月10日

シャープの電子辞書「Brain」では、ラズパイのようにmicroSDカードからLinuxを起動できます。その方法は、日経Linux9月号の特集1で詳しく紹介しています。Brainは中古品が格安に出回っています。夏休みは日経Linux9月号を参考にして、BrainのLinux化に挑戦してみてください!
www.amazon.co.jp/dp/B0B7PQ54SG/ pic.twitter.com/PAhqWMXWpb

タグ:

posted at 16:27:00

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#Julia言語 このスレッド内では分位点函数を使って信用区間を計算していますが、hdiを使いたい人はこちらを参照。
twitter.com/genkuroki/stat...

タグ: Julia言語

posted at 15:57:57

omion @16331633

22年8月10日

全否定するのもよくないけど、違和感があったら「放射能デマに手を染めた人もしくは報道機関だ」という枷をはめておくと、多少の権威には目が眩まないですむ。

タグ:

posted at 15:34:01

omion @16331633

22年8月10日

どれが本当でどれが嘘か、テレビや新聞で何か言ってる偉い肩書きの人の言うことに違和感あっても10年くらい前までは「よくわからないけどそうじゃないとおもう」程度しか言えなかったけど、「この人放射能デマで出鱈目言ってたから信じない」と決断できるようになったのは大きいな。

タグ:

posted at 15:31:39

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 ベイズ統計は非常に使い易い便利で優れた道具なのですが、伝統的なベイズ統計観に基く解説ではアンフェアな態度でベイズ統計が優れていることを説明しようとしているように見える場合が非常に多い。

そういう卑怯なことをやめた方が説得力が増すと思うのだが。

タグ: 統計

posted at 15:19:30

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計

アンフェアな比較に繋がりかねない説明の仕方の例
twitter.com/genkuroki/stat...

タグ: 統計

posted at 15:16:45

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 あと、比較するときには、フェアな比較をするか、フェアでない比較をするならそのことを述べることが必要。

例えば、Aさんによる数の選び方のクセが確率分布(事前分布)としてかなり分かっているという設定では、頻度論者であってもその事前分布を当然使うことにしないとアンフェアになります。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 15:13:59

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 「定義が違う」という当たり前のことばかり強調する知的に不健全な信頼区間警察達のせいで、「実践的な多くのケースで数学的必然によって信頼区間とベイズ信用区間はほぼ一致する」という事実を覆い隠して、「異なる解釈が必要だ」という言説だけが流布して行く。

そろそろやめた方がよい。

タグ: 統計

posted at 15:06:06

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 「それ定義が違うだろ」というような初歩的な誤解については「定義を理解するまでその道具を使うことは控えろ」で終了。そういう話は議論になりようがない。

そして、実際に我々の社会に実際に害を与えているのは、そういうつまらない話題について不健全な議論をしたがる人達。

タグ: 統計

posted at 14:56:34

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 ベイズ統計の方法を使っていてもいなくても、実践的に強く気にするべきことは、「頻度論とベイズ主義での解釈に違い」などではなく、

* データにはどのようなバイアスが含まれているか
* 使用した統計モデルは妥当であるか

の方です。事前分布は統計モデルに含まれていると考える。

タグ: 統計

posted at 14:45:05

黒木玄 Gen Kuroki @genkuroki

22年8月10日

面白すぎたので全部RTしてしまった。 twitter.com/yusuketaira/st...

タグ:

posted at 14:25:37

江口某(粗忽要介護2級) @eguchi2018

22年8月10日

でも最後の方えらい悲観的だな。そんなに悲観的にならなくてもいいのではないか……

タグ:

posted at 14:05:06

江口某(粗忽要介護2級) @eguchi2018

22年8月10日

twitter.com/YusukeTaira/st...

平先生のいまごろ見てる。えらい。

タグ:

posted at 14:01:56

黒木玄 Gen Kuroki @genkuroki

22年8月10日

Cat: You had better play with me. twitter.com/kokoromidaregi...

タグ:

posted at 13:53:16

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 この特定のケースでは「この論文は通常の信頼区間ではなく、ベイズ的な信用区間を使っているので、ベイズ主義的な解釈をしなければいけない」と発言する人が出て来るたびに、研究結果の情報の健全な伝播が阻害されることになります。

そういう害を積み重ねることは我々の社会にとって有害です。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 13:38:12

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 こういう我々の命に関わる具体的な研究事例について、通常の信頼区間とベイズ的な信用区間の正しい解釈が異なることの強調が意味があるかを論じる必要があります。

この場合には数学的必然によってそれらはほぼ一致するので、その手の解釈論にこだわることは無意味です。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 13:34:26

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 そしてそういう知識は、○○によって新型コロナウイルスの重症化をどれだけ防げるかに関する論文の解釈で必要になります。

以下のリンク先スレッドで紹介した論文はベイズ統計の事後分布を使ってリスク比の区間推定を行っています。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 13:34:25

ながぴい @Nagapiii

22年8月10日

たしかに何言ってんのか、さっぱりわからん。 twitter.com/Amazondaibiki/...

タグ:

posted at 13:29:56

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 95%信頼区間とベイズ的な95%信用区間は定義の仕方もその背景にある考え方も全く異なるので、「それらは全く異なるものである」という段階で思考がストップしがちだと思う。

実際には、実践的にありがちな状況ではそれらは数学的必然によって近似的に一致することが多いのです。

タグ: 統計

posted at 13:27:36

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 近似計算を多用する分野において、各種のツールの正しい使い方に関する議論では「近似的にどのように等しくなり得るか」に関する議論をしていない人達は全員、知的に不健全な状態に陥っているとみなせます。

検索すると大量に見つかる。

タグ: 統計

posted at 13:22:22

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 実践的な統計学的ツールが近似的な計算を多用していることをよく知っている人達にとっては、定義に忠実にぴったり一致するか否かという発想で頻度論とベイズ主義について説明したり、解釈したりする傾向が強い議論の仕方は知的に一段劣っているように見えてしまいがちだと思います。

タグ: 統計

posted at 13:19:37

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 二項分布モデルのような離散分布モデルでは、95%信頼区間の95%は正確な値にはならず、なんらかの近似を使ったどんぶり勘定にならざるを得ません。

そういう状況で「ぴったり等しいかどうか」という発想で考えることは無意味で、常に「どのように近似的に等しくなりえるか」と考える必要がある。

タグ: 統計

posted at 13:16:11

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 二項分布モデルでの95%信頼区間の被覆確率を計算したことがある人であれば、理想的には95%になって欲しい被覆確率が95%から結構ずれることを知っているはず。

そのことを知っていれば、事後分布で測った95%信頼区間にpが含まれる確率が95%にかなり近くなることに驚くと思います。

タグ: 統計

posted at 13:13:46

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 平坦事前分布から作った事後分布で測った「pが95%信頼区間に含まれる確率」のプロット。速やかに95%に収束しています。

実践的には平坦事前分布を使うケースが多いので、この場合の方が通常の信頼区間とベイズ的な信用区間の関係の実態をよく表していると考えられます。 pic.twitter.com/30NwtVakhG

タグ: 統計

posted at 13:10:28

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 平坦事前分布の場合

各グラフの右半分を見れば、通常のP値・信頼区間とベイズ的な結果の違いのずれの大きさがわかります。

P値函数のグラフの高さ0.05での切断で得られる線分が95%信頼区間です。ベイズ版は信用区間と呼ばれている。

平坦事前分布ではn=10で信頼区間と信用区間はよく一致。 pic.twitter.com/cVj32W0CH1

タグ: 統計

posted at 13:07:56

MATLABパイセン @MATLAB33761100

22年8月10日

夏休みに入ったのでMATLABやろう
休み中に2記事程度書きたいと思います

ボストン界隈ではPythonよりもJuliaが流行ってるらしいです
ただ、結果の可視化(グラフ作成)ではMATLABが使いやすいんですよね

タグ:

posted at 12:45:39

Donald Williams @wdonald_1985

22年8月10日

Update.. Took one hour.. pretty amazing !! pic.twitter.com/BqGIjPqnzy

タグ:

posted at 12:14:20

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 具体的な状況を設定して科学的にはどう考えるべきなのかについて議論するのではなく、「頻度主義的には~であり、ベイズ主義的には~である」のような議論を杜撰なやり方ですることを知的な態度であるかのように思っている人達がものすごくたくさんいる。

そのこと自体が害悪になっている。

タグ: 統計

posted at 11:18:55

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 そして何よりも、頻度論やらベイズ主義といった主義に関する考え方は,統計学を実践的に適切に利用するためには必要ありません。

その手に主義よりも、科学的に常識的な考え方の方が上位の考え方になっており、科学的な常識があれば主義は無用かつ有害なだけになります。

タグ: 統計

posted at 11:13:16

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 そして、nを十分大きくすると、通常の95%信頼区間とベイズ的な95%信用区間は近似的に一致します。

そしてそういう場合には、それらは実践的には同じものだと考える必要があり、片方に適用される解釈は両方に適用しなければいけません。

タグ: 統計

posted at 11:09:05

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 「頻度論とベイズ主義」という分類について説明するときに、

❌ベイズ統計の95%信用区間には真の値が含まれる確率は95%だと考えて良い。

のような説明がされているのをよく見ます。

これは上の方のストーリーのように、真の事前分布が分かっている場合にのみ正しく、一般には誤りです。

タグ: 統計

posted at 11:04:22

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 注意・警告

以下のリンク先以降のストーリーでは、Aさんの数の選び方の癖が確率分布として分かっている(真の事前分布が分かっている)と仮定しているので、事後分布はパラメータpに関する真の分布になっています。

しかし、現実にはほぼあり得ない仮定になっていることに注意!

続く twitter.com/genkuroki/stat...

タグ: 統計

posted at 10:59:28

富士見坂 @Te393098

22年8月10日

オカルトの「EM菌、親学、江戸しぐさ」
江戸しぐさも科学技術振興機構に科学技術として認められるかもしれませんね
ニセ科学EM菌はスーパーサイエンスハイスクールとユネスコスクールに入り込んでいます

>文部科学省は「世界最大の江戸しぐさ普及団体」という指摘があります
twitter.com/breathingpower...

タグ:

posted at 10:58:06

Donald Williams @wdonald_1985

22年8月10日

maybe 20 million (give or take a few million) 😱

タグ:

posted at 10:43:01

Donald Williams @wdonald_1985

22年8月10日

Also, millions of random effects...

タグ:

posted at 10:41:58

Donald Williams @wdonald_1985

22年8月10日

Highly recommend the Julia package MixedModels.

7.5 million rows, including 4 million level two, 1000's of level three, fixed residual variance, no problem..

Barely putting a dent in my memory (and no crashing, as in R), and so far no convergence issues

juliastats.org/MixedModels.jl...

タグ:

posted at 10:41:22

Akinori Ito @akinori_ito

22年8月10日

日本の論文ランク12位が話題だけど、国立大学法人化の目的が「行政改革」であったことを思えば、今まさにそれが成就しているといえる。当時どういう説明をしていたにせよ、最終目標は国の支出の節約であり、お金が来なければ活動は低下するに決まっている

タグ:

posted at 09:31:50

積分定数 @sekibunnteisuu

22年8月10日

#超算数
これに同調する意見が主に教員からなされていて、闇の深さを感じる。

「守破離」だの、「形無し」「型破り」だの、いつもの言葉もちりばめられている。 twitter.com/17vyl/status/1...

タグ: 超算数

posted at 09:17:16

sako @SSako86

22年8月10日

@kamo_hiroyasu 慶應に限らず、「○○大学院」っていう言い方ってほとんど見ないんですよね。たいてい「○○大学大学院」。本来の名称なんだから当然でしょうけど。
「東京大学院」っていうのがあったと思ったら「首都大学東京大学院」でした(笑)。

タグ:

posted at 02:24:30

Hiroyasu Kamo @kamo_hiroyasu

22年8月10日

@SSako86 "慶應大学院理学修士" でググってみましたが、この人しか引っかかりませんでした。

タグ:

posted at 02:12:50

Hiroyasu Kamo @kamo_hiroyasu

22年8月10日

@UFOprofessor @sekibunnteisuu プロフィールが微妙な書き方で、数学科を出たとは断定できないんですね。学位ではなく学歴と書いてあって、それなのに修了とは書いていないので、数学分野を学ぶ修士課程に学生として在籍したことがあるとしか読み取れません。

タグ:

posted at 02:08:50

sako @SSako86

22年8月10日

@kamo_hiroyasu ちょっと違和感があったんですが、やっぱり珍しいんですね。

タグ:

posted at 02:07:58

QmQ @gejiqmq

22年8月10日

共産党引き合いにして、統一教会を相対化しようとするパターンが結構あるけど、さすがに統一教会vsz共産党なら、後者が比較にならないくらい、まとも。

タグ:

posted at 01:59:26

森山和道/ライター、書評屋 @kmoriyama

22年8月10日

RT
オリビアを聴きながら〜六本木・芋洗坂での一人暮らしから生まれた珠玉のメロディー www.tapthepop.net/machinouta/47656 @TAPthePOPより

タグ:

posted at 01:56:14

Hiroyasu Kamo @kamo_hiroyasu

22年8月10日

@SSako86 プロフィールの「慶應大学院理学修士(数学)」ははじめて見る書き方です。学位の正式名称は「慶應義塾大学修士(理学)」で学歴だったら正式には「慶應義塾大学大学院理工学研究科基礎理工学専攻数理科学専修修士課程修了」でしょうが、どっちを略してもそうはなりませんよね。珍しい。

タグ:

posted at 01:56:08

Massimo @Rainmaker1973

22年8月10日

What do you see?

This is Wonder, a meditative moving sculpture whose aim is to show how everything is interconnected created by designer & inventor @tomlawton.

beuplifted.co.uk pic.twitter.com/0p0AFHM3Sg

タグ:

posted at 01:53:05

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 データにバイアスが入っている可能性が高いのに、データを取り直しもせず、モデルの側で調整しようもしていないというのは、深刻な誤りだと思います。

そういう深刻な誤りを犯したままだと、通常の信頼区間を使っても、ベイズ版信用区間を使っていても、まったく信用できない。

タグ: 統計

posted at 00:47:59

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 「95%信頼区間に真のpの値が含まれる確率は95%になる」という主張は確かに誤りです(笑)。

しかし、誤りを指摘するときに、ベイズ統計との関連でその部分にこだわるのは愚かな行いであることが、上の方でした解説を読めば分かると思う。

統計学の実践的な使用で深刻になるのはそこじゃない。

タグ: 統計

posted at 00:44:52

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 要するに、統計学入門の教科書にあるような易しい統計モデルを使っている場合には、通常のP値と信頼区間を使う立場とベイズ統計を使う立場は実質的に同等だとみなせます。

自分の好きな方を適切に使えば良いだけの話。

こういう穏健な結論を出せば平和でかつ合理的です。

タグ: 統計

posted at 00:40:04

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 偏った事前分布が許されるためには、何らかの証拠が必要です。

そしてそういう証拠があるならば、事前分布の恣意性を嫌う人であっても、証拠によって恣意性が解消されたと判断して、偏った事前分布の使用を躊躇しないでしょう。

タグ: 統計

posted at 00:37:37

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 大雑把には、シンプルなモデルでは、通常のP値や信頼区間を使った結果と、ベイズ統計による結果は、正しく比較すれば、本質的に事前分布の偏りの分の違いしか出ず、その違いもn→大で解消されてしまいます。

これが数学的な真実です。

タグ: 統計

posted at 00:33:14

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 現実の統計分析では、以上のストーリーのように、Aさんの数の選び方の癖に関する信頼できる証拠にあたるものを使えることはほとんどなくて、事前分布はもっと「おとなしめのもの」を選ぶのが普通。

そういう場合には、上より小さなnで通常の信頼区間とベイズ的に求めた区間はよく一致します。

タグ: 統計

posted at 00:30:29

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 ここまで理解できた人は私が

【違うもの達を、「ぴったり等しいかどうか」という発想で、しかも実践的にはあり得ないくらい小さな標本で比較するのは、ダメな考え方】

と述べた理由も理解できたと思います。

違うものを比較する場合には適切に比較しないとダメです。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 00:27:32

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 「95%信頼区間に真のpの値が含まれる確率は95%になる」という主張は確かに誤りです(笑)。

しかし、上の設定(信頼区間ユーザー側にとってアンフェアな設定)の下であっても、推測精度を高めるためにnを大きくしてあれば、 「95%信頼区間に真のpの値が含まれる確率は約95%になる」は正しい!

タグ: 統計

posted at 00:25:00

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 Wilsonの95%信頼区間を用いた人はAさんの数の選び方の癖に関する信頼できる情報を使っておらず、アンフェアな比較になっている。

それにもかかわらず、推測精度を高めるためにnを大きくすると結果はほぼ同じになる。

添付画像はWilsonの95%信頼区間にpが含まれる確率で、n→大で95%に近付く。 pic.twitter.com/49IqdZR3XM

タグ: 統計

posted at 00:22:31

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計

以上のストーリーで「この事前分布は正しい」と仮定しました。

その仮定を「この事前分布は大きく的を外していなさそうな証拠がある」に弱めたとしましょう。

そういう証拠があるなら、ベイズ統計を嫌いな人であっても、モデルにこの情報を組み込んで推測するでしょう。続く pic.twitter.com/4RqDP0S3nq

タグ: 統計

posted at 00:16:02

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 n=320, k=160のときには、Wilsonの95%信頼区間は

[0.446, 0.554]

で、ベイズ法で求めた区間は

[0.437, 0.586]

です。これらの幅を0.1未満にしたければもっとnを大きくする必要があります。精度を高めるのは結構大変。

Aさん自身ではなく、コンピュータに数えさせないとかわいそう!(笑) pic.twitter.com/2VvWdzrN5e

タグ: 統計

posted at 00:12:25

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計 pが含まれる確率が94.5%程度になっているのであれば、「95%信頼区間にpが含まれる確率は約95%である」と言って良いでしょう。

グラフの右半分を見ると、通常のWilsonのスコア検定のP値による結果がベイズ統計の結果とどれだけ近くなっているかが分かります。 pic.twitter.com/lHBY5HRZmk

タグ: 統計

posted at 00:07:35

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計

「n=160回中80回p以下になった」
「n=320回中160回p以下になった」

とAさんが報告して来たときの結果は添付図の通り。

Wilsonの95%信頼区間にpが含まれる確率はそれぞれ

94.5%
94.7%

です。Wilsonの95%信頼区間はベイズ法で求めた区間に相当に近くなって来ています。 pic.twitter.com/e4peoGhgtK

タグ: 統計

posted at 00:04:05

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計

「n=40回中20回p以下になった」
「n=80回中40回p以下になった」

とAさんが報告して来たときの結果は添付図の通り。

Wilsonの95%信頼区間にpが含まれる確率はそれぞれ

93.7%
94.1%

です。 pic.twitter.com/UUeamTKIxe

タグ: 統計

posted at 00:01:52

黒木玄 Gen Kuroki @genkuroki

22年8月10日

#統計

「n=10回中5回p以下になった」
「n=20回中10回p以下になった」

とAさんが報告して来たときの結果は添付図の通り。

Wilsonの95%信頼区間にpが含まれる確率はそれぞれ

94.1%
93.5%

です。 pic.twitter.com/rbCssDms9O

タグ: 統計

posted at 00:00:13

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました