黒木玄 Gen Kuroki
- いいね数 389,756/311,170
- フォロー 995 フォロワー 14,556 ツイート 293,980
- 現在地 (^-^)/
- Web https://genkuroki.github.io/documents/
- 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
2019年08月24日(土)
【大事なお願い】私の名前で検索すると、このアカウントが大量に出てきます。私の実名を使って誹謗中傷をおこない、意味不明のサイトに誘導しようとしています。スパムおよび攻撃として通報し、ブロックしていただけないでしょうか。ぜひよろしくお願いします
twitter.com/kyot1225/with_...
タグ:
posted at 00:05:45
#統計 prior=randomizerの選択には主観が入っていてもいなくても良いという立場です。
あと、「事前分布も含めてモデルの設定は全部主観で決めたものである」というような無意味な議論はしないという立場です。
どうして誤りだと分からなかったを知りたいところ。
twitter.com/ohsaworks/stat...
タグ: 統計
posted at 00:23:07
#統計
ベイズ統計は【主観確率に基づく統計分析】である
という主張が誤りでないと思った理由を述べて頂ければ質問に答えやすくなります。
twitter.com/Ohsaworks/stat...
タグ: 統計
posted at 00:31:58
@tsatie #統計
(1) 現実とは異なる数学的世界を設定。
(2) 現実から得たデータと同じデータがその数学的世界でも観測された場合に、その数学的世界の法則を制限。
(3) 制限された数学的世界の法則が現実世界の法則を近似していると期待。
ベイズ統計はこういう仕組みの一種。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 01:18:54
スマホをメガネの代わりにしたいときは「明るく大きく」というアプリが便利です。拡大するだけでなく、明るさやコントラストが調整できたり、停止ボタンで止めて拡大することもできます。 pic.twitter.com/4i9GsX6P6u
タグ:
posted at 06:34:16
Tsuyoshi Miyakawa @tsuyomiyakawa
あと、出典の新井先生のご著書、『AI vs.教科書が読めない子どもたち』のリーディングスキルテストの部分もさっと拝読したんですが、点が低いとされる設問で、数学とか理科の知識の多寡が正答率に影響を与える問題があり、純粋に読解力を評価しているとは言いにくいように思いました。
タグ:
posted at 06:55:00
Tsuyoshi Miyakawa @tsuyomiyakawa
原点と点Aを通りX軸と接する円を選ぶ設問とかは、数学の語彙をしっかり覚えていないと解けないので、読解力ではなく数学の語彙が中心的に評価されているのではないかと思います。
タグ:
posted at 06:57:27
Tsuyoshi Miyakawa @tsuyomiyakawa
この「読解力」テストの成績と、学力の偏差値が0.8程度の相関を示すデータを示され、このデータの「解釈は2つに一つです」とし、
「偏差値の高い高校に入ると基礎読解力が上がる」という可能性と、
「基礎読解力が高いと偏差値の高い高校に入れる」
という2つの可能性を出されています。
タグ:
posted at 07:05:31
Tsuyoshi Miyakawa @tsuyomiyakawa
この2つの可能性は存在しますが、相関を解釈する時の大切な3つ目の可能性が抜けてしまっています。それは
「基礎読解力と偏差値に影響を与える第3の要因が存在する」
です。
タグ:
posted at 07:06:46
Tsuyoshi Miyakawa @tsuyomiyakawa
実際、心理学や教育学では、general inteligence (g) というものが想定されていて、これが様々な学力の指標と高い相関を示すことが繰り返し報告されてます。en.wikipedia.org/wiki/G_factor_...
タグ:
posted at 07:08:25
行列操作を含むiterationをpythonとjuliaで比較した。2次元のkernel行列の作成を2重for、list内包、配列で処理(2d)で試した。結果はどのやり方でもjuliaの圧勝。
python,juliaともにリスト内包の方がforより遅い(なぜ?)
あとjuliaは二重forと2Dの差がないので他にボトルネックがあるかも pic.twitter.com/p0yPSIo35s
タグ:
posted at 07:10:23
Tsuyoshi Miyakawa @tsuyomiyakawa
これまでの研究の流れをふまえ、この「リーディングスキルテスト」の成績が数学・理科・社会などの知識量も反映することも考慮しますと、この第三の可能性が正しいという可能性はより強まると思います。
タグ:
posted at 07:10:51
Tsuyoshi Miyakawa @tsuyomiyakawa
この解釈の違いは極めて重要です。なぜかというと、新井先生たちは、この僅かな調査結果をもって、読解力が低いことが、すべての教科の成績の低さに影響しているという仮説を出されていて、主にそれによって「論理国語」の重視という政策を実現しようとされているからです。
タグ:
posted at 07:13:53
Tsuyoshi Miyakawa @tsuyomiyakawa
たいへん興味深く重要と思われる仮説ではあるのですが、その論理に問題があり、国内外の過去の研究成果、エビデンスがその仮説をサポートするのには極めて不十分というのが自分の印象です。
タグ:
posted at 07:16:13
Tsuyoshi Miyakawa @tsuyomiyakawa
ご著書のこの仮説の部分には、僅かな調査結果が示されているだけで、学術的論文の言及・引用がほぼ皆無です。
タグ:
posted at 07:16:55
Tsuyoshi Miyakawa @tsuyomiyakawa
この仮説を研究として検証しようとしますと、「リーディングスキル」を重点的に教育した生徒と、そうでない生徒で、各種学力がどう推移するかを調べるような実験的研究がどうしても必要です。実験ではないですがこれに近いデータとして埼玉県戸田市の事例が言及されてました。
タグ:
posted at 07:19:26
Tsuyoshi Miyakawa @tsuyomiyakawa
埼玉県戸田市の教育委員会では「リーディングスキルテスト」を取り入れ、この観点を教育に反映させているとのことです。そうしたらところ、学力テスト成績が県内でトップになったとのことでした。
タグ:
posted at 07:20:48
Tsuyoshi Miyakawa @tsuyomiyakawa
これが事実であるとしますと、結構な説得力を持つエビデンスになるわけです。しかし、そのような明確な事実は自分が調べたところですと、見つかりませんでした。あまり上がっていないですし、指標によってはおちてます(ノイズ程度)。
www.toda-c.ed.jp/uploaded/attac...
bit.ly/33X5jpY
タグ:
posted at 07:26:28
Tsuyoshi Miyakawa @tsuyomiyakawa
経時的な「同じ児童生徒集団での比較」では国語の成績は低下してしまっているのに、数学の成績はアップしています。
www.toda-c.ed.jp/uploaded/attac...
タグ:
posted at 07:30:10
Tsuyoshi Miyakawa @tsuyomiyakawa
こういう面白いというだけで、エビデンス、まっとうな研究論文の裏付けがほとんどない仮説で、政策が決まっていってしまうのが日本という国なのかな、と。もっと科学的な研究を振興してもらって、エビデンスベーストの政策を進めていただかないとよろしくないように思います。
タグ:
posted at 07:33:00
#統計 訂正。自明な誤りなので訂正に必要はないと思うが。
❌ KL(1, 0.99) = ∞
⭕️ KL(0.99, 1) = ∞
KL(1, p) = log p なので KL(1, 0.99)≒0.01.
twitter.com/genkuroki/stat...
タグ: 統計
posted at 08:03:30
#統計 なるほど、その通りですね。
本当に言いたかったことは、99%の確率で偶数の目が出るサイコロを1回だけ振ったとき、「偶数の目が出る」という予測が当たる確率は99%だということ。
あと「100%偶数に目」と「99%偶数の目」では100%と99%で値がちょっとしか違わない。
twitter.com/tsatie/status/...
タグ: 統計
posted at 08:10:17
Tsuyoshi Miyakawa @tsuyomiyakawa
この議論のスレッドで、塾講師の方と議論させていただいたわけですが、議論の中で、
「せめてMARCHかセンター国語9割レベルの国語力をつけてくださいませ。我々の言っていることが理解できるようになると思います。」
というようなアドバイス(?!)を何回かいただきました。 twitter.com/tsuyomiyakawa/...
タグ:
posted at 08:14:59
Tsuyoshi Miyakawa @tsuyomiyakawa
論理的な議論とか科学の議論においては偏差値とか学歴、年齢、職業その他は本来は無関係でしょう。議論以外のトピックは持ち出さないことが慣習として確立されるべきでは。先生が生徒と議論する場合でも権威を使って負かす、とかではなく、フラットな土俵の上で意見を交わすのが好ましいと思います。
タグ:
posted at 08:18:58
#統計
*【ベイズ推定は主観確率を用いて行われている】
や
* ベイズ統計は【主観確率に基づく統計分析】である
が少しでも正しい可能性があると思っていなければ、質問自体が無かったと思います。
どのように正しい可能性があると思ったかについて教えて下さい。
twitter.com/ohsaworks/stat...
タグ: 統計
posted at 08:31:18
小学校算数での台形の面積の公式がどうこう、でもそうだが、教える公式の多寡で、ゆとりだの詰め込みだのと言うのは、非本質的だと思っている。
多寡の問題じゃない。教え方の問題。公式・解法をさっさと教えて演習問題を何問もやらせて定着させるなんていうのは、くだらないと思う。
タグ:
posted at 08:37:57
自分が分かっていると思っていたら、ツイッターでこんなにつぶやいたりしない。
よく使われている教科書を読んだらよく分からないことが書いてあり、実はひどく間違っているのではないかと思ったことを重点的にツイートしている。
統計学の講義を受け持った経験がある人達はみんな分かっているのか?
タグ:
posted at 08:39:24
台形の公式が算数に入るかどうかなんて、正直どっちでもいい。面積の概念が分かっていたら公式を知らなくても求めることができる。
2次方程式の解の公式が中学の教科書に載っているのは良くないと思っている。一般的な2次関数のグラフは高校で扱う。そことの関連のなかで解の公式を学んだ方がいい
タグ:
posted at 08:41:47
#超算数 メモ。【視覚的工夫】に【教師は言葉で勝負する。こういうものに頼ってはダメだ。逃げるな】とあるベテラン教師だそうだ。この人だけの偏見でないとすると、#掛算 の順序における困難も理解できそうだけど、本当にそんな逐語的精神で不都合はないのか。 twitter.com/zubattored/sta...
posted at 09:07:25
@genkuroki 確かに此の手の僕のような誤解を減らすには「賭け事やら予想」という話にしておくのが良いのか。あとは平行宇宙か(笑。ふーむ。この話の前に普通のサイコロで「1の目が出る」に賭けたときに賭けに勝つ確率は1/6なわけだがそれを「「一の目が出る」という予測が当たる確率」と表現すると何が嬉しいのか
タグ:
posted at 09:50:58
@genkuroki Twitterの良いところは文字数制限なわけで当然無駄な言葉は省こうとするのだけど数学は特に難しい。お互い分かってる事や基本的だと認識している筈だと思うてる言葉はどんどん使うからだ。でもそこが難しい。特にこの統計の話は個々のことばの説明がどうしても長くなりただそこに疑問があるからだろう
タグ:
posted at 09:53:14
@tsuyomiyakawa これ、問題が悪いと思います。論理的な曖昧さ、「名前」と「愛称」の関係、最後の「〜である」がどういう意味なのかなど、文意を一意に定めることができない文章になっています。そうすると、「こういう文章はこういう風に読むんだよ」という暗黙のルールを知っている子に有利になる。
タグ:
posted at 09:55:39
@tsuyomiyakawa 「〜である」は、Alexandraの愛称にAlex「を含む」という意味にも解釈できるかもしれない。また、「この文章で与えられた情報だけから判断すると、「〈Alexandraの愛称=Alex〉である」とも解釈できる。だけど、文の意味を解釈するというのは、必ずしもそういう作業のことだけではないと思います。
タグ:
posted at 09:59:27
たしかに、母分散未知の場合の前置き程度にしかなってないような気もする 具体的な応用があれば知りたい twitter.com/genkuroki/stat...
タグ:
posted at 12:13:42
#統計 時系列解析は「母集団からの無作為抽出の統計学」は違います。
【「小学校6年生男子の身長」とか、何年か測って、数年たったら母分散は過去の値から求めたものを使う】というのは私が実データを眺めて不自然だと思った設定。教科書にはその例が書いてありますが。
twitter.com/cojjyman/statu...
タグ: 統計
posted at 12:46:22
ごまふあざらし(GomahuAzaras @MathSorcerer
夏も終わるようなので
ヘビで遊ぶ. pic.twitter.com/fg0i5xVj19
タグ:
posted at 12:56:23
#統計 小寺平治著『ゼロから学ぶ統計解析』2002年のp.112には添付画像のように書いてある。この設定も私には不自然に感じられる。
教科書にはこういうことが書いてあるのですが、色々納得できない例だと思います。
サンプルサイズが900もあるのに、標準偏差は過去の資料の値を使っちゃうの? pic.twitter.com/84Hd8E3Rfo
タグ: 統計
posted at 12:56:48
ごまふあざらし(GomahuAzaras @MathSorcerer
This object can be iterated to produce values on demand, instead of allocating an array and storing them in advance pic.twitter.com/dxQOsSlM1B
タグ:
posted at 13:01:32
今日はベイズ統計の授業で変分ベイズの話をして、ついでにKL情報量の話をしました。黒木さんのこの多項分布の話を使わせてもらいました。この話を聞くまでKL情報量の意味が今ひとつピンときてなかったけど、これのおかげでだいぶスッキリししました。 twitter.com/genkuroki/stat...
タグ:
posted at 13:11:59
Tsuyoshi Miyakawa @tsuyomiyakawa
@sakura_osamu おっしゃるとおりだと思います。解釈が複数ありえて正答を一意に決めることができない問題はこの種のテストとしては適切ではないですね。リーディングスキルテスト、かなり普及してきて政策にも影響を与えつつあるようですし、設問の妥当性などについて精査&研究が必要かと思います。
タグ:
posted at 13:24:14
@genkuroki 大村平の本は「そのような状況はあまりない」とはっきり書いてあったような記憶があります。「そのような状況はあまりない」とはっきり言った上で、練習のために「母分散が既知の場合の平均の信頼区間の求め方」の説明をするのであれば問題ないと思うのですがいかがでしょうか。
タグ:
posted at 13:27:02
#統計 「そのような状況はあまりない」のように書いてあるだけだと、どうしてその「あまりない状況」について「練習」しなければいけないのか分からなくなるので、まだ説明が足りないと思う。
私個人は「その場合については練習しなくてもよい」と思っています。続く
twitter.com/abiko_ushi/sta...
タグ: 統計
posted at 13:33:32
@tsuyomiyakawa @sakura_osamu この問いにどのような問題点があり、どのように修正すると良いかを子どもたちと議論すること自体が、子供たちの論理構成能力を高める良い方法である気さえしてきますね…。
タグ:
posted at 13:40:55
非公開
タグ:
posted at xx:xx:xx
非公開
タグ:
posted at xx:xx:xx
先ほどの発表資料です→ hackmd.io/@antimon2/Sy28... juliatokai.connpass.com/event/136684/ #JuliaTokai
タグ: JuliaTokai
posted at 14:28:36
#数楽 以上の筋道については雑に書いたノート
genkuroki.github.io/documents/Intr...
に書いておきました。
学部生向けの「確率・統計」の教科書ではモーメント母函数や特性函数を経由する中心極限定理の「説明」が書いてあることが多いと思う。どうしてわざわざ難しい議論にするのか不思議。
タグ: 数楽
posted at 14:30:37
補足資料(裏で実験してた時の Jupyter Notebooks)も公開します→ nbviewer.jupyter.org/gist/antimon2/...
#JuliaTokai
twitter.com/antimon2/statu...
タグ: JuliaTokai
posted at 14:58:34
qiitaにガウス過程にJuliaを使ったら圧倒的に早かった話を書きました。
Juliaで反復数値計算をしたらPythonよりも圧倒的に速かった話 qiita.com/triwave33/item... #Qiita
タグ: Qiita
posted at 15:06:01
#統計 randomizerという用語は既出の赤池弘次さんの論説にあった言葉を私がそのまま流用しているだけです。
私の質問に真っ当に返答をするつもりがあるなら、「主観確率」は大まかに何だと思っているかの説明と、その概念を使用する必然性を示す必要があります。
twitter.com/ohsaworks/stat...
タグ: 統計
posted at 15:21:13
#統計 私の主張は
* 主観確率(=ベイズ確率)の概念は、ベイズ推定について説明するために不要である
です。これを認めれば、【ベイズ推定は主観確率を用いて行われている】は不要なものが必須であるかのように説明していることになり、誤りになります。
twitter.com/Ohsaworks/stat...
タグ: 統計
posted at 15:21:16
#統計 このスレッドでは、まずrandomizationという言葉が
twitter.com/genkuroki/stat...
で赤池さんの論説を引用した場面で登場していて、添付画像の引用中にrandomizerという言葉が登場。
スレッドを読まずに反応してしまうことは確かによくあることだと思います。私もやってしまうことがある。
タグ: 統計
posted at 15:30:30
#統計 リンク先の添付画像に引用した部分の終わりの段落付近で語られていることは、以下のようなことだと私は解釈しています。
事前分布として、主観の内容の表現となるような確率分布ではなく、単なるrandomizerを採用する場合には~続く
twitter.com/genkuroki/stat...
タグ: 統計
posted at 15:45:09
#統計 そのように解釈した私は、現在ではWAICやLOOCVを使えば、どちらの事前分布が(予測誤差の意味で)優れているかを客観的に(高確率で)評価できる場合があることを示すための例を提示したわけです。
これで私が言いたいことはさらに明瞭になったはず。
twitter.com/genkuroki/stat...
タグ: 統計
posted at 15:45:14
#統計 現代的な事前分布の決め方については
watanabe-www.math.dis.titech.ac.jp/users/swatanab...
を参照。添付画像にも引用。
こういう知識があれば、
【ベイズ推定は主観確率を用いて行われている】
とか
ベイズ統計では【主観確率に基づく統計分析】を行う
が正しいと考えることは無理だと思います。 pic.twitter.com/VHlrCDg6SF
タグ: 統計
posted at 15:59:49
"米国環境保護庁(EPA)は、グリホサートが発がん性であると主張する表示をもはや認めない。連邦殺虫剤・殺菌剤・殺鼠剤法(FIFRA)表示規定を満たさない虚偽の主張だと判断したため" / “グリホサート発がん性は虚偽 - FoodWatchJapan” htn.to/R8WZNX6Lx6
タグ:
posted at 16:40:30
"カリフォルニア州の批判の多いProposition 65がグリホサートのような製品にこの誤解を招く表示を要求し、人々に自分たちの直面するリスクについての間違った情報を与えてきた…グリホサート製品の登録業者は、90日以内にその警告文を排除した改訂表示案を提出しなければならない"
タグ:
posted at 16:42:18
非公開
タグ:
posted at xx:xx:xx
@your_friend_bot @tsuyomiyakawa ぼくは、「この文章で与えられた情報だけに基づいて考える」という前提で「Alex」と解答しますが、「解答不能ではないか」との疑問が出されたら十分な反論はできないと思います。質問を「Alexandraの愛称の中には( )がある。」とすれば良いのかな。
タグ:
posted at 16:59:38
A new post on geometric modelling.
Explanation of B-splines and visualizations using #julialang opensourc.es/blog/b-spline pic.twitter.com/4yBYwlSlvs
タグ: julialang
posted at 17:43:41
Yasuhiko TAKANASHI @YTAKANASHI4
実際には、これまで使っていた機器の設定を変えた場合など(例えば長さ10cmを切り出す設定を8cmに変えるなど)、分散は既知、ということはあり得ますね。
ただこの場合は平均を議論する必要性はないかも。 twitter.com/genkuroki/stat...
タグ:
posted at 18:35:03
#超算数 逐語的精神が不都合を生じる例はすぐに見つかったtwitter.com/kale_aojiru/st...。#掛算 の順序固定指導にはさらに、こっそり交換法則適用を認めている指導項目があり、それを経験しても文章題では非可換wという瞞着がある。
posted at 18:48:46
ハッシュタグ付け直してRT🐤
「【JuliaTokai #3】Juliaで音声のデジタル信号処理に再入門したかった」
#JuliaTokai #Julia言語 twitter.com/KzhtTkhs/statu...
タグ: JuliaTokai Julia言語
posted at 18:57:09
Togetter(トゥギャッター) @togetter_jp
「たらればさん、史実ジャンヌを調べたら #FGO ジャンヌの鋼メンタルは意外と忠実再現なのではと気づく。そして「姉ビームくらい撃つでしょ」の錯乱結論へ」togetter.com/li/1394627
が伸びてるみたい。みんな注目してるんだね! 作成者:@motoyaKITO
タグ: FGO
posted at 21:03:03
Fermat's Library @fermatslibrary
Viviani's Theorem: in an equilateral △, the sum of the distances from any interior point to the 3 sides is equal to the height of the △ pic.twitter.com/ZM5Cb0GBpf
タグ:
posted at 21:20:02
#JuliaTokai で型システム入門のLTを聞いたおかげでソースコードが読めるようになった (読めるとは言ってない)。ありがたやありがたや
タグ: JuliaTokai
posted at 21:34:23
@jun_fujiki julia 良さそうですよね.特にベクトルとは何か,行列とは何か,プログラミング言語としてどうあるべきかを深く考えているところが.
www.slideshare.net/acidflask/desi...
タグ:
posted at 22:35:56
#Julia言語 Windows 8.1環境では特別な処置抜きに(GR.inline("png")抜きに)、10000個のpngファイルを生成して、GIF動画を作れました。コードは
nbviewer.jupyter.org/gist/genkuroki...
で公開してあります。OS依存の問題かもしれません。
twitter.com/julialangisthe...
タグ: Julia言語
posted at 23:20:03
Everyone’s Favorite Blogpost: CSV Benchmarks
#Julia言語
www.juliabloggers.com/everyones-favo... @juliabloggersさんから
タグ: Julia言語
posted at 23:20:53
非公開
タグ:
posted at xx:xx:xx