黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2020年02月11日(火)
「修正版心理学のためのベイズ統計入門」、確率モデルによって母集団分布が実現可能であると仮定して進むと解説しているが、そうなのか。そんな「見做し」がなくてもモデルの相対評価ができるのが統計学の貢献だと思っていた。最後の引用は「ベイズ統計の理論と方法」4p
www.slideshare.net/simizu706/ss-2... pic.twitter.com/iWTQCLjD4o
タグ:
posted at 23:45:24
#統計 同感!
みんな同じように変なことを書いているので、震源地があると思うのですが、変なことを書いている人達は参照文献を示さない習慣を持っているようなので、全然遡れないのだ。
何を読んで変な考えを知ったのかに関する情報をみんなで共有するべきだと思います。
twitter.com/stattan/status...
タグ: 統計
posted at 22:36:31
#超算数 確か、ブルクナーとグロスニケルの『算数を意味付ける方法(勝手訳)』twitter.com/temmusu_n/stat...も、かけ算せgroup sizeに言及していたかも。とにかく和田は指導要領執筆中にかけ算をアメリカの流儀で定義した。
タグ: 超算数
posted at 22:14:37
ごまふあざらし(GomahuAzaras @MathSorcerer
PacakgeCompilerX.jl が旧 PackageCompiler.jl に取り込まれたのでX付きの方はアーカイブされました.今後はPackageCompiler.jl の方を楽しみください.
タグ:
posted at 22:01:44
#統計 訂正
❌ L(X) = p₁(x)/p₀(x)
⭕️ L(X) = p₁(X)/p₀(X)
例によって、x→Xの違いです。まあ、以上の説明で理解できる人はネイマン・ピアソンの補題を知っている人だけだと思うので、害はないと思いますが、念のために訂正しておきます。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 21:38:51
でも最近はジュリアが好き。ジュリア好きすぎて先輩さんに「Juliaって知ってる?」って訊かれたとき真っ先に「知ってます!!大好きです!!かっこいいですよね!!!」とか言ったぐらい。
プログラミング言語の話だった。
タグ:
posted at 21:33:24
#統計 さらに、既出ですが、第4章の4.3節が難しいと感じた人は以下のリンク先に書いたより初等的な議論もあることを知っておいた方がよいかもしれません。
genkuroki.github.io/documents/2016...
大学1年レベルまで初等化
nbviewer.jupyter.org/github/genkuro...
大学2~3年レベルまで初等化
タグ: 統計
posted at 21:31:49
#統計 「仮説が正しい確率」というような考え方を捨てても何も失われない。
渡辺澄夫『ベイズ統計の理論と方法』を読めば、最尤法やベイズ法を使えば、サンプルサイズ→大で、採用した正しくないモデルの範囲内でベストの推定結果が得られることが分かり、さらにモデル間の相対評価の方法も得られる。 twitter.com/not_identified...
タグ: 統計
posted at 21:10:30
#統計 1つ前のツイートで指摘した通り、「(事前分布も含めて)正しいモデルの下では、仮説が正しい確率を求められる」という主張もナンセンスである。
「仮説が正しい確率」なるものは最初からナンセンス。
救いようがない。続く twitter.com/not_identified...
タグ: 統計
posted at 21:01:50
#統計 正しい。
未知の母集団分布に「正しい事前分布」なんてものはないし、事前分布はモデルの一部分なので、
「ベイズ統計では、モデルが正しければ、仮説が正しい確率を計算できる」
という主張をしても意味がない。
渡辺澄夫『ベイズ統計の理論と方法』7.1節の説明はミスリィーディング。 twitter.com/not_identified...
タグ: 統計
posted at 20:58:21
Movie 1 にメンフクロウ入れてないのはなんで?っていま聞いてみたら、こいつはLED光をつけたらと左右どっちかに寄ってしまいがちで、片翼が見切れてるから、らしい…それだけなら別に載せてもよかったと思うんだけどな。Education purpose でもあるから、なのかな。
タグ:
posted at 20:51:37
このヘリウムバブルを使って鳥が飛行した後に残す気流を可視化したのが movies 1 & 2. パッと見て翼端渦に目が行くわけですが、よく見ると胴体・尾羽の真下にかなり強い吹き下ろしがあることもわかります。これがこの論文のポイント。
タグ:
posted at 20:48:29
広瀬隆があるというので見てみたら、広河隆一も小出裕章も日野行介もアーニー・ガンダーセンもあって、さながら「放射能デマ文庫」の様相。改めて、菅直人はすごいなあと思いました twitter.com/NaotoKan/statu...
タグ:
posted at 20:33:46
心理学のためのベイズ統計入門【スライド修正】 by @simizu706 #bayes #psychology www.slideshare.net/simizu706/ss-2... @SlideShareより
タグ: bayes psychology
posted at 20:26:17
非公開
タグ:
posted at xx:xx:xx
とうとう娘も掛け算の順序問題に直面!私は娘の答案で正しい派ですが、担任の先生に勝っても得るものが殆どないので、娘に「君ので正しい」と教えて、後は放置します。 pic.twitter.com/xInpdwgJQe
タグ:
posted at 20:09:25
PIV: particle image velocimetryとは、流れの中にたくさん入れた粒子を撮影し、2時刻の粒子群の相関から移動ベクトルつまり流速を求める手法。空気中だと細かい霧状の粒子を使うので、光らせるには強力なレーザが使われる。ヘリウムバブルは大きいので、LEDでもいけるらしい。
タグ:
posted at 19:40:56
飛行実験に使った鳥はメンフクロウ・モリフクロウ・オオタカの3種類。バブルを使う利点の一つは、風洞内で飛ばすには大きいような鳥でも実験しやすいことにあります。また、普通のPIVと違いレーザを使わないので、人や鳥がゴーグルをかぶる必要がなく扱いやすいです(広告みたいになってしまった)。
タグ:
posted at 19:34:36
教育界隈には100マス先生の信者がマジで多いから、ココでちゃんと叩いて置かないと多分大変なコトになる。
すでに信者はどうしようもねぇけど、少なくともココからは増やさないために。
だって信者は現場にも多いから水伝・EM・江戸しぐさの二の舞になりかねない。
タグ:
posted at 19:07:56
ただ、一般的に、ニセ医学批判は「PVが取れる」どころか、なかなか広がらない。例外的に血液クレンジング批判が広まった理由の一つは、推進側に強力なインフルエンサーがいたからこそではないか(加えて「見た目のインパクト」「わかりやすい」のも理由)。
タグ:
posted at 19:05:42
はあちゅう氏に「血液クレンジングには予防医療の観点で部分的効果がある。ニセ医療じゃない」と吹き込んだ医師がいるはず。インフルエンサーよりもニセ医学を自由診療で提供している医師のほうが悪い。
タグ:
posted at 19:05:22
この連ツイ、大学入試改革の利権構造のおぞましき実態を簡潔にまとめてあります。知っている方には復習、知らない方は、"パラサイト 半地下の家族" 級のミステリーですよ、ぜひお読み下さい。題して”パラサイト 教育を食う官の奴らと民の奴ら” twitter.com/KITspeakee/sta...
タグ:
posted at 18:29:27
はあちゅうさんの痛いところは、少なくとも医療に関しては一切インフルエンサーなどではないのに自分をインフルエンサーだと思い込んでるとこよな。裸の王様的な滑稽さがある。情報を見極める力が絶望的になく、逆に自らが流れてきた情報を信じ込む「インフルエンスされる人」なんだよ
タグ:
posted at 18:14:27
Juliaってプログラミング言語初めて知った。多重ディスパッチやらもさることながらとにかく速いことが特徴らしい。こんな感じで書く模様
The Julia Language: julialang.org pic.twitter.com/AvCu16bpHU
タグ:
posted at 17:46:39
#統計 #Julia言語 更新された
nbviewer.jupyter.org/gist/genkuroki...
を見ればわかるように、成功確率が0または1に非常に近い場合には最尤法の方が(Jeffreys事前分布の)ベイズ法よりも平均予測誤差(ただし「n回中0回成功」「n回中n回成功」は除いてある)が小さくなっています。平均二乗誤差も同様です。 pic.twitter.com/NmJFO5wBmh
posted at 16:27:34
#統計 以下のリンク先では、真の成功確率が0.3でn=10の場合には、Jeffreys事前分布のベイズ法の方が最尤法よりも平均予測誤差(KL情報量で定義)が小さくなることに言及しました。
常にベイズ法が最尤法勝つわけではないことに注意!続く
twitter.com/genkuroki/stat...
タグ: 統計
posted at 16:19:04
(入試改革ウオッチャーが知らなかった情報は限られているが,このズブズブ・ドロドロを世間一般が知らないのはメディアの怠慢! ことは教育問題。知れば政権の大きな打撃にもなるのに,大手メディアが腰抜けで本当に情けない。)
タグ:
posted at 16:06:46
また,安倍首相の父,晋太郎氏の側近だった加藤六月氏の娘,康子氏はベネッセグループの「東京個別指導学院」の大株主だった。加藤康子氏は安倍首相と半ば兄妹のように育った幼馴染で,昨年7月まで内閣官房参与を務めた,「アベトモ」の筆頭格。
タグ:
posted at 16:00:48
この部分は入門書で「モンティホール問題」や「医療診断の偽陽性率」みたいな、ただベイズの定理で計算するだけの話からものすごくジャンプを感じたんだけど、そのときは素通りしてしまった。当時の私、それは遠回りだぞ。
タグ:
posted at 15:54:43
教育再生実行会議の委員の元シンクロスイマー武田美保氏(元経産官僚で第一次安倍内閣官邸スタッフ・現三重県知事の鈴木英敬氏の妻)も理事を務めていたが,3氏とも一連の騒動の渦中にCEESからフェードアウトした。
タグ:
posted at 15:54:23
ここで仮に事前分布を用意したところで、現実の未知の母集団分布に「正しい事前分布」なんてものはないので、そこから導かれる事後分布の区間を見ても結局日常言語で理解される意味での「仮説が正しい確率」にはならないわけだ。
タグ:
posted at 15:53:53
Constraint Solver: How to use JuMP for your own solver?
#Julia言語
disq.us/t/3l62oan
タグ: Julia言語
posted at 15:53:14
Types in C/C++ and Julia by Erik Engheim
#Julia言語
link.medium.com/QGWp1gv8Y3
タグ: Julia言語
posted at 15:50:39
◇「アベトモ」もベネッセ人脈に
主役は「三木谷連合」からベネッセに移ったが,中心にいるのは下村氏と鈴木氏のコンビ。他にも,ベネッセ関連の「進学基準研究機構(CEES)」の理事長を佐藤禎一・元文部事務次官が,評議委員を中教審会長として改革の旗振りをした安西祐一郎・元慶應大塾長が務めていた
タグ:
posted at 15:49:42
Re: RT ニセ医療を叩くと視聴率を上げられる!
この認識はもっと広がるべき。
お医者さん達がしている「医療の常識」に関係していると思われる雑談は滅茶苦茶面白いですよね。
娯楽として成立していると思う。
ツイッターの有効な使い方としては最上位に入ると思う。
タグ:
posted at 15:45:54
文科省もこの両氏をサポートし続けると同時に,ベネッセへの「便宜」を図っている。たとえば,導入延期決定の直前になっての,伯井高等教育局長から各都道府県知事や教育長らに宛てた試験会場借用に係る依頼文書。この次期,英検の試験会場はほぼ決まっていたので,ベネッセへの便宜供与と言ってよい。
タグ:
posted at 15:42:31
下村氏は教育再生実行会議の委員に「懇意の塾経営者」を就かせ,鈴木寛氏を引っ張り込み,後で自分の補佐官に抜擢。「鈴木氏とのコンビで作った新テスト導入の行程表を15年1月に大臣決定すると,なぜか重要な部分は審議非公開のブラックボックスの中で決められていった」→
タグ:
posted at 15:34:03
#統計 ベルヌイ分布モデル(もしくは二項分布モデル)のJeffreys事前分布 Beta(1/2, 1/2) の密度函数は両端の x=0,1 で発散しており、下に凸な函数です。
両端の重みを大きくした方が最尤法に近付くんですね。こういう基本的なことにも気付いていなかった。私は統計学はど素人なので仕方がない。 pic.twitter.com/9nTDsSXZLE
タグ: 統計
posted at 15:29:51
◇「便宜供与」する文部科学省(ここでも説明は詳細)
結局TOEFLではなく「英語成績提供システム」を設置することになったが,再三問題が指摘される中,「ここまでデタラメな試験が危うく実施されそうになった」のは第二次安倍内閣で文科大臣に就任した下村衆議院議員によるところが大きい。→
タグ:
posted at 15:28:26
最尤でもベイズでも、誰もわからない真の分布を近似したくて
・最尤(とかMAPとか)なら推定量w'の実現値で条件付けられたモデルの分布を
・ベイズなら事後予測分布を
それぞれ真の分布を近似していると期待する
…のかな?やっと自分の中で明確になってきた
タグ:
posted at 15:22:25
当時,三木谷氏は「利害関係は今後も一切ないし,楽天のビジネスには何の利益もない」と強弁していた。ところが,2017年,楽天は英語教育市場に参入,ITを用いた英語教材販売会社ReDucateを傘下に収め,葛城氏を社長に据えた。(←これを野党もメディアも追及しなかった。)
タグ:
posted at 15:19:23
◇英語問題の発端は楽天・三木谷(詳細だが端折ると)
「最初に利権のにおいを嗅ぎ取った」のは楽天の三木谷氏。経済同友会のPTでTOEFLの大規模活用を提言。自社の英語公用語プロジェクトリーダーだった葛城崇氏を文科省に送り込んだ。→
タグ:
posted at 15:14:13
ベネッセが大部分の受験生を囲い込んでいる。JePは経産省と総務省が主導する「情報銀行」構想とリンクして進めることが決まっている情報の「宝の山」。それをベネッセの関連会社に丸投げすること自体が危うい。ベネッセが巨大データを管理するに至った経緯や情報の安全性の確認が必須。
タグ:
posted at 15:06:20
「最もクレームが多かったのがベネッセでアルバイトがほとんど」と。JAPAN eポートフォリオについても,情報を管理しているのは実はベネッセの関連会社。「なりすまし」を防ぐためという名目でベネッセのID, PWを使うことになったが詳しい経緯は不透明。1学年40万人が受験する進研模試があるので,→
タグ:
posted at 14:59:36
以下,見出しと概要
◇ベネッセの知られざる「利権」
記述式の採点を61億円で落札した「学力評価研究機構」。その裏にはテスト採点業務の寡占構造があった。学テの採点もベネッセ,内田洋行,教育測定研究所の「三社で棲み分けしていた」と言う,その下請けをしていた企業の経営者は→
タグ:
posted at 14:51:24
2月号の『選択』は必読だが書店で買えないのが残念。2020年度大学入試改革にからむ利権構造をこれまでに出たどの記事より正確かつ比較的詳しく報じている。www.sentaku.co.jp/articles/view/...
タグ:
posted at 14:42:57
#統計 #Julia言語 既出の
nbviewer.jupyter.org/gist/genkuroki...
を大幅に更新した。
真の成功確率0.3
n = 100
の場合には、最尤法MLEとベイズ法でKL情報量で定義した予測誤差の分布はほぼ同じになります。
KL情報量で定義した予測誤差の2n倍は近似的に自由度1のχ²分布に従います。正則モデルの普遍的な性質。 pic.twitter.com/F9SCCjDaiG
posted at 14:36:18
@sekibunnteisuu @genkuroki あなたのツイートをトゥギャりました。読んでいただけると幸いです。 togetter.com/li/1467105
タグ:
posted at 13:53:01
#統計 #Julia言語 計算で使用したプログラムは
nbviewer.jupyter.org/gist/genkuroki...
で公開しておきました。間違った計算をしていたら教えて下さい。訂正して計算をやり直します。
posted at 13:41:58
#統計 それでは、「n回中0回成功」「n回中n回成功」の両極端な場合を除いて比較したらどうでしょうか?
真の成功確率が0.3、n=10、事前分布Jeffreysの場合に、KL情報量で定義された予測誤差の両極端な場合を除いた場合の平均を計算すると
ベイズ→0.039
最尤法→0.050
でベイズの勝ち。 pic.twitter.com/mFXwTPkk2Z
タグ: 統計
posted at 13:40:15
#統計 私のTLでは「頻度vs.ベイズ」の話題は皆無で、
「頻度vs.ベイズ」というおかしな対立図式を煽って来た人達に対する非常に厳しい批判
意外に見当たらない。
「頻度vs.ベイズ」の話題が盛り上がっているなら、「資料収集」のために是非とも見てみたい。検索しても見つけられない。 twitter.com/__sugiura/stat...
タグ: 統計
posted at 13:10:08
非公開
タグ:
posted at xx:xx:xx
kamekura(リベラルきのこ派) @kamekurasan1
>「ニセ医療」を叩くとPVが取れる
これは正しい情報が拡散され、かつ正しい情報の発信者が適切な報酬を得られる、理想的な状況だと思うのですが、何が気に入らないのでしょうか?
エビデンスのない医療についてはメディアだろうがインフルエンサーだろうが批判されます。それが科学というものです。 twitter.com/ha_chu/status/...
タグ:
posted at 12:53:27
「ニセ医療」ではないと断言する医師は残念ながらいるだろうね。ただ、そう断言する医師がいるからといって、血液クレンジングがニセ医療ではないことにはならない。 twitter.com/ha_chu/status/...
タグ:
posted at 12:51:44
須山さんの本の3D barplotをJuliaで書きたいんだよぉぉぉ!(右はしょうがないからPythonで書いた)誰か…知ってたら…教えて…
(引用: ベイズ推論による機械学習入門 須山敦志 2.2.4 多項分布) pic.twitter.com/0mnwCXhI8Q
タグ:
posted at 12:18:14
不思議ベイズ紹介スライドを作成した人たちも真面目にテキストとか読んだのだろうけど,どういったテキストに好ましくないことが書いてあったのか,共有してくださったら世の中のためになると思うのです。
タグ:
posted at 12:07:59
自分「JuliaでExcelファイル扱うで!」
自分「まずはテストデータを作って……」
自分「XLSXっちゅうパッケージがあるんやな」
Juliaくん「データ読み込んだで」
自分「ファッ!? 日本語だとふりがながついてくるんか!?」
※ちなみに日付はちゃんとDate型で読めるらしい
#Julia言語 pic.twitter.com/xDuNKUSGMb
タグ: Julia言語
posted at 11:26:04
下記資料で、主義による対立を助長しかねない不適切なベイズ推定に関する説明をしていました(@genkuroki 先生ご指摘ありがとうございます!)。元の資料はそのままに残し、コメント欄に適切な理解につながる資料へのリンク共有しました。
www.slideshare.net/yoshitaket/32-...
www.slideshare.net/yoshitaket/ws-...
タグ:
posted at 11:23:30
ƃuᴉɥʇou ⅎo ɐpoʇ ǝʞns @totti0223
過去の論文ではそう意識してなかったからいざデータほしいとコンタクトがあったときにまごついたりして恥ずかしい。少なくとも今後は論文化のときにはちゃんとフォーマットしておきたいと思って今回の投稿以降はとか考えていたり。
タグ:
posted at 09:44:05
このように得られたデータセットはひとつにすぎなくて、それを元に事後分布を計算してもそれは定義しその上実現したとみなし多くは近似的に得たもの。結果の評価なしに正しいとみなしてしまうリスクが大きいと黒木さんは繰り返し警告、批判されていると思っています。twitter.com/genkuroki/stat... twitter.com/genkuroki/stat...
タグ:
posted at 09:39:01
ƃuᴉɥʇou ⅎo ɐpoʇ ǝʞns @totti0223
自分のスタンスとしては再現するためのコードやデータは基本的にオープンにする、コンパイルしていたらその前のものを出す、データセットを入れ替えても使えるぐらいには可読性を高めておく、ぐらいまではデフォルトとして目指したい。共著者の所属団体の関係でいつもそうできるとは限らないだろうけど
タグ:
posted at 09:34:54
数理がわからないから,主義に走る。気持ちはわからんではない。哲学っぽい(深いっぽい)甘い言葉でくるむと人は簡単に流される。ということで,正しい推測方法は存在しないが予測が当たるかどうかを評価できる,ということをいつでもどこでも思い出して欲しい。
タグ:
posted at 09:32:04
ƃuᴉɥʇou ⅎo ɐpoʇ ǝʞns @totti0223
論文化の際に全部公開した場合、競合チームを安易に利するのではないかともやる気持ちもわからんでもない。でもそれって今後のオープンサイエンス(特にFAIR principle)の流れとは相容れない考えなんですよね。
タグ:
posted at 09:31:30
ƃuᴉɥʇou ⅎo ɐpoʇ ǝʞns @totti0223
特に植物分野での機械学習データセット非公開にしがち問題は結構深刻だと思ってる。この分野では、取得とラベル付けに(他分野と比べて相対的に)ものすごく労力とお金のコストがかかるので(続
タグ:
posted at 09:29:58
ƃuᴉɥʇou ⅎo ɐpoʇ ǝʞns @totti0223
論文の査読者コメントが嬉しい。
「筆者らは論文に関わる再現に必要なコードやデータセットを全て公開している。summerizeされた論文のmethod sectionを読むしかなく、再現性や実装に苦しんでいた近年の植物科学者が機械学習を実際やってみようとmotivateする良い試みである」
タグ:
posted at 09:16:30
モデル式をRmdの数式にできる!これは便利!!
bookdown.org/yihui/rmarkdow... pic.twitter.com/E8IS75RAMG
タグ:
posted at 09:08:32
「掛け算の順序で意味が変わるから困ることになる」と言っているのは、掛け順固定派のマッチポンプに過ぎません。むしろ実社会では、(ひとつ分×いくつ)も(いくつ×ひとつ分)もどちらも普通に使われているので、前者だと思い込んでしまう方が実害があると考えます。
タグ:
posted at 09:02:09
「Twitterやめようかな」
「……」
「私なんか必要ないんだ」
「……」
「誰か反応してよ」
「……」
「Pythonはじめようかな」
「Juliaはいいぞ」「Juliaはいいぞ」「Juliaはいいぞ」「Juliaはいいぞ」
タグ:
posted at 05:16:03
鳥の「胴体・尾羽セクション」が(少なくとも今回計測した低速滑空では)「静安定確保のために負の揚力を発生」してはいないことなどがわかった。尾羽は翼面積を増やし正の揚力を発生するという意味では飛行機のフラップに近いが、失速に遠い迎え角でも抗力低減に役立つという点で機能的には異なる。
タグ:
posted at 03:16:55
少し詳しい解説。鳥の翼幅方向の空気力分布は、誘導抗力を最小化するような「楕円形の揚力分布」ではなく、粘性抗力を最小化するような「揚力係数一定」の分布に近いことがわかった (fig. 5)。鳥は飛行機と違って Reynolds 数が二桁以上低く、粘性抗力が誘導抗力に比べて無視できないためと思われる。
タグ:
posted at 03:16:55
このとき言っていた同僚たちの論文が published.
doi.org/10.1242/jeb.21...
Open accessなので誰でも読めます。
滑空する鳥が作る渦を、大量のヘリウム入りシャボン玉をLEDで光らせることで計測して、尾羽の役割を調べています。
内容がわからなくても movie 1 & 2 はきれいなのでぜひ見てみてほしい。 twitter.com/dynamicsoar/st...
タグ:
posted at 03:16:54
Colab integration with Google Drive just got better. Authenticate only once per notebook. No authentication codes are necessary for private notebooks when using the 'Mount Drive' button in the file browser. pic.twitter.com/VyXhZziCVd
タグ:
posted at 03:01:34
@ringo_taka BASICは「コンピュータプログラムは書いてある通りに動くこと」以上の教育効果は微妙. むしろ「悪い習慣」も学んでしまうことを考えると有害な面もある. モダンな言語の中でも,数学との親和性を考慮してHaskell (関数とは何かの本質が学べる) やJulia (直感的に数式を扱える)が良いのではないか.
タグ:
posted at 02:43:23
#統計 以下のリンク先の、渡辺澄夫『ベイズ統計の理論と方法』からの引用部分は素晴らしい。
擬似哲学的な議論で分からないことを分かることにしてしまうのは非常にまずいというお話。
まずい統計学教育を何年も続けてやってしまった人はその逆向きを行う責任がある。
twitter.com/not_identified...
タグ: 統計
posted at 02:08:19
@genkuroki @coro_NLP 件の論文は,サンプルサイズが大きい場合の実験もやっていますね.ただ,漸近論の仮定が満足されているかは論文からはわからないですね.
タグ:
posted at 01:54:57
@genkuroki @coro_NLP 有限のnでも破綻する場合は漸近論の仮定が満たされていないくらい「全事例」が足りないケースです.
偏った6面サイコロの出目をサンプリングして1の出目だけ極端に少ない(か,最悪ない)場合は,他の出目がどんなに多くとも漸近論の仮定は満たされません.nが有限だとしばしばこの状況が起きます
タグ:
posted at 01:52:05
@sekibunnteisuu #数楽 2階の線形常微分方程式は、1階微分の項を消す同値な方程式に書き直すことはよくやります。本質的に同じ方程式であっても見かけが異なることがあって、ひとまずその形は計算しておく。
xy''+2xy+xy=0 はそれで解けちゃうので特別なケース。
タグ: 数楽
posted at 01:46:26
@sekibunnteisuu #数楽 y = 2xy' + (y')² はめんどくさいです。この手の形はまず両辺をxで微分します。すると t = y' に関する1階の常微分方程式になる。それは x を t の函数とみると、xに関する1階の非斉次線形微分方程式になっているので解けます。
一般化はダランベール方程式とか呼ばれていたはず。色々大変。
タグ: 数楽
posted at 01:42:59
非公開
タグ:
posted at xx:xx:xx
@genkuroki @coro_NLP MAP法を考えてるわけではないにもかかわらず,fullyに温度付きをしていることが事前分布の影響が強くなる奇妙な現象の原因なのではないかという考察が2つ目のポチ・でした.
タグ:
posted at 01:40:03
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
@genkuroki @coro_NLP だからこそ,T=1で負けてT<<1で勝つのが不思議という話から,かの論文は始まっています.
SGDはDLのような非凸最適化では大域最適に行くとは限らないのでバッチ正規化やDropoutの有無以前にそもそも最尤でもMAPでもない推定量がSGDで得られており,その乖離が効くのではというのが最初のポチ・でした
タグ:
posted at 01:38:36
@genkuroki @coro_NLP 特異モデルというより,正則・特異の両方を含む一般の場合で収束の早さが正則な場合「以上」(等号を含む)ということが証明されているのでは?
タグ:
posted at 01:36:18
@genkuroki @coro_NLP 正則モデルでもMAPとベイズは大差がない(経験的にはベイズの方が汎化損失が小さい)ので,MAPが機能するならベイズが負けるということはないはずです.
タグ:
posted at 01:31:55
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
@sekibunnteisuu #数楽 一般に a(x)y'' + b(x)y' + c(x)y = 0 に y = f(x)u を代入したとき u' の項が消えるような f(x) を作れます。
これを xy'' + 2y' + xy = 0 の場合に実行すると f(x)=1/x と取れることが分かり、y = (1/x)u すなわち u = xy とおくと、u''+u=0 になることも分かります。
タグ: 数楽
posted at 01:02:32
Φ(x,y)=0とおいて、dy/dx=-(∂Φ/∂x)/(∂Φ/∂y)を代入して、Φ(x,y)をテイラー展開した形で、と考えようとしたけど、2変数テイラー展開、つまりaij*x^i*y^j となってしまって、ややこしいことこの上ない。
で挫折
タグ:
posted at 00:52:46
未だに分からないのがこれ
y=2xy'+(y')^2
先ほどの2つと違って線型ではない。
答えは、y=xの関数 じゃなくて、xとyの関数=0という形になるらしいのだが、どうすりゃ良いのかわからない。
タグ:
posted at 00:48:55
(x-1)y''-xy'+y=(x-1)^2 これも、
yが多項式だと仮定して特殊解を1つ見つけ、
あとは、(x-1)y''-xy'+y=0の一般解を、テイラー展開で見つけた。
答えがわかった後なら、(x-1)y''-xy'+yをもう一回微分すればいいと気づく。
タグ:
posted at 00:46:23
でもこの変形は、答えがわかった上での後付けの変形。
xy’’+2y'+xy=0
ここから、xy=zと置いて、z''+z=0 と変形できるって気づけるものなのだろうか?
一般的に気づく方法があるのだろうか?
タグ:
posted at 00:41:51
この答えがわかった上で、改めて考えてみる。
xyがsinxやcosxになるのだから、xyの形から何かが見えるはず。
(xy)'=y+xy'
もういっちょ微分して、(xy)''=y'+y'+xy''=2y'+xy’’
つまり、(xy)''+xy=0
ここからxy=Asinx+Bcosxとなる。
タグ:
posted at 00:39:23
静的なコード解析で行えるプログラマ支援の機能は普通に便利だしめちゃ使うけど,やっぱりなによりも編集中のコードのランタイムとインタラクティブに関われるっていうのが自分にとって欠かせないスタイルな気がしてきた.
JupyterとかJunoが提供してるスタイル.
タグ:
posted at 00:37:48
そうすると、e^ix/x と e^(-ix)/x が出てくる。
で、これは sinx/x と cosx/x でもかまわない。
よって一般解は、(Asinx+Bcosx)/x
タグ:
posted at 00:35:39
xy’’+2y'+xy=0
この手の問題、幾何学で同補助線を引いたらいいのか思いつかないのと同様、どう変形すればいいのか思いつかない。
ということで、y=Σak*x^k とテイラー展開されたと仮定して、akの漸化式を求めて強引に出して見る。
タグ:
posted at 00:33:19
伝統的な統計学ではデータが確率変数でパラメータは定数だけど、ベイズ統計だとデータは定数でパラメータが確率変数というのは誤りらしいことをTwitterを見て知った
タグ:
posted at 00:24:48
@coro_NLP @389jan 以下のリンク先スレッドも参照。
これで混乱が収まるとよいと思いました。
twitter.com/genkuroki/stat...
タグ:
posted at 00:22:16
例えば、次の図はWatanabe (2018) MTBS より。同じ真の分布からのサイズ10のサンプルでも、その現れ方によって事後分布の実現値はゆらぐことが示されています。この英語版は数値実験を示してくれていてより入門的な感じがします。 pic.twitter.com/BzFeZvsCXd
タグ:
posted at 00:21:36
Ninja DAO | CryptoNi @CryptoNlnjaNFT
新型肺炎の感染が広がる豪華客船の乗客への「応援」に対して、「これだから日本は凄い。中国とは違う」と書き込んでいる人たちがあちこちに。でも、その後半のフレーズをわざわざつける行為こそが「日本は凄い」を台無しにしているのだ、という事に思いが及ばないのはなぜだろうか。
タグ:
posted at 00:17:01
ごまふあざらし(GomahuAzaras @MathSorcerer
多分計算機インフラを整える的なのをするともっと研究効率が上がるんだろうなって気もするし、そこにビジネスの入る余地もあるかも。
タグ:
posted at 00:16:53
ごまふあざらし(GomahuAzaras @MathSorcerer
物理での深層学習の実例の規模感を質問したら、数十GBのデータと、1週間ほどの学習ぐらいらしい。
タグ:
posted at 00:16:52