Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

黒木玄 Gen Kuroki

@genkuroki

  • いいね数 389,756/311,170
  • フォロー 995 フォロワー 14,556 ツイート 293,980
  • 現在地 (^-^)/
  • Web https://genkuroki.github.io/documents/
  • 自己紹介 私については https://twilog.org/genkuroki と https://genkuroki.github.io と https://github.com/genkuroki と https://github.com/genkuroki/public を見て下さい。
Favolog ホーム » @genkuroki » 2022年08月27日
並び順 : 新→古 | 古→新

2022年08月27日(土)

なべきち @nabekichi32

22年8月27日

ハイスコアガール見始めたんだが、1話目から「待ちガイル、投げハメ」からの「ファイナルファイト錬金術」で、コレが噂のオッさんホイホイかと思っているw

タグ:

posted at 00:05:06

須藤玲司 @LazyWorkz

22年8月27日

定義の原文にあたると
>the repetitive posting of inflammatory comments or hate speech (often called “trolling”)
pen.org/online-harassm

repetitive、「繰り返し」を定義に含めています。

つまり定義では、1度だけの批判はハラスメントとなりません。複数回の粘着荒らしが対象です。 pic.twitter.com/9ARlQXe9rA

タグ:

posted at 00:17:42

須藤玲司 @LazyWorkz

22年8月27日

しかし本論文の眼目である炎上事例分析では、「繰り返し」要素が曖昧になってます。

>ハラスメントを行ったユーザーは、3 つの層に分かれる
>①インフルエンサー
>②(略)インフルエンサーの「犬笛」に呼応する炎上加担ユーザー群
>③荒らしを行うユーザー群

最初の定義に沿うのは、③のみでは。 pic.twitter.com/p9dehOkB0C

タグ:

posted at 00:20:36

須藤玲司 @LazyWorkz

22年8月27日

オンライン・ハラスメントの研究で、論文のなかでのオンライン・ハラスメントの定義を(PENに準拠して)宣言したならば、当然それを守る必要があります。
違う主張をしたいなら、別の定義を宣言しなければなりません。
自ら宣言した定義を守らないのは、思想や解釈以前の、論文の瑕疵でしょう。 pic.twitter.com/ediv9z79AQ

タグ:

posted at 00:22:37

須藤玲司 @LazyWorkz

22年8月27日

それだけではありません。
自ら宣言した定義を守らない箇所は、他にもあります。「オンライン・ハラスメント」よりも、さらに激しく定義を無視して濫用しています。
f1000research.com/articles/10-11...

タグ:

posted at 00:25:18

須藤玲司 @LazyWorkz

22年8月27日

>要旨
>女性記者ツイートの「炎上」事例を分析、ハラスメントを行うユーザーにはインフルエンサー群、インフルエンサーの犬笛に呼応する炎上加担ユーザー群、荒らしを行うユーザー群の三層があり(略)

犬笛という特殊用語にカッコをつけない感覚は謎ですが、この「犬笛」も定義と異なります。 pic.twitter.com/H6Fi3ELMxT

タグ:

posted at 00:27:13

須藤玲司 @LazyWorkz

22年8月27日

>要旨
>インフルエンサーの犬笛に呼応する炎上加担ユーザー群

>Abstract
>users who responded to the instigation by influencers

英語のAbstractには、なぜか「犬笛」(dog whistle) という言葉を使用していません。instigationは「扇動」です。

日英で明らかに異なることを書くのは怪しい。 pic.twitter.com/PRAQ1IuxxM

タグ:

posted at 00:30:34

須藤玲司 @LazyWorkz

22年8月27日

犬笛の定義もPEN Americaのものを採用しています。
>犬笛とは「加害的もしくは有害な意味を持つ二重、もしくはコード化された言葉や記号を使い、インターネット上の加害者グループに特定の標的を攻撃するように合図する行為」を意味する

ここで「二重、もしくはコード化された」が問題となります。 pic.twitter.com/bsopnnfv4R

タグ:

posted at 00:32:50

須藤玲司 @LazyWorkz

22年8月27日

PENのサイトでDog Whistling定義を見てみましょう。
onlineharassmentfieldmanual.pen.org/defining-onlin...

"Using words or symbols with a double (or coded) "
翻訳は忠実です。

しかし問題はExample.
例として、白人至上主義者がユダヤ人の名前を三重カッコで括って見分けられるようにした件が挙げられています。 pic.twitter.com/PBYo2LWOM1

タグ:

posted at 00:36:58

須藤玲司 @LazyWorkz

22年8月27日

「犬笛」とは「二重、もしくはコード化された言葉や記号を使い」合図すること。
犬だけがわかる超音波のように、わかる人にだけわかる隠語やキーワードで攻撃対象を示して指示することです。
(日本ならJアノンがやりそう?)

つまり、インフルエンサーによる明確な「扇動」は、犬笛とは言えません。 pic.twitter.com/t1dTFnO8vo

タグ:

posted at 00:43:10

なべきち @nabekichi32

22年8月27日

「チンチンに骨あるか確認させろ」とか「爺やはパチンコ中毒だから日本でしか暮らせない」とか、どういうアニメだよwww

タグ:

posted at 00:46:20

あ〜る菊池誠(反緊縮)公式 @kikumaco

22年8月27日

これはかなり重要な問題なので、ぜひPDFをお読みください。鳥取県の条例とその運用にはおおきな問題があると思います twitter.com/tj_paki/status...

タグ:

posted at 00:51:47

須藤玲司 @LazyWorkz

22年8月27日

参考:政治家が使う秘密の「犬笛」  隠れた人種差別メッセージとは
www.bbc.com/japanese/video...

ここで挙げられている犬笛の例
・「大都市ラッパー」
・「バラク・フセイン・オバマ」
・「生来の民族衣装」
・「強制バス登校」
・「移民」

一種のサブリミナル。
大勢に気づかれれば威力を失う、とも。 pic.twitter.com/ydzuCP9O5z

タグ:

posted at 00:56:01

Massimo @Rainmaker1973

22年8月27日

Elijah Secrest is an artist from Columbus, Ohio and works mainly in metals. Among the things he makes, there are these impressive mechanical masks

TikTok: buff.ly/3CzPnxL
Instagram: buff.ly/3PWikqG
pic.twitter.com/e78EIvSdtG

タグ:

posted at 00:58:32

須藤玲司 @LazyWorkz

22年8月27日

たしかに日本のネット文化では、Dog Whistleの原義から離れ、「犬笛」は俗に濫用されがちです。
しかし本論文では、「犬笛」はPEN Americaの定義に従うことをわざわざ宣言しています。

では、そこで挙げられた犬笛の事例は、自ら決めた定義に沿ってるのでしょうか? とてもそうは思えません。 pic.twitter.com/tZIyFEx85b

タグ:

posted at 01:00:48

須藤玲司 @LazyWorkz

22年8月27日

〈事例分析 : X社の記者ツイート「炎上」事件〉で、インフルエンサーH氏が吹いたという「犬笛」は、本論文のなかで宣言された定義に沿っているでしょうか?

検証するには、論文のなかでぼやかされているツイートを特定して、元ソースをあたらなければなりません。他に方法はないでしょう。

タグ:

posted at 01:14:51

須藤玲司 @LazyWorkz

22年8月27日

まず、元となった「X社の実名女性記者Z氏」のツイートは、これです。
twitter.com/erika_asahi/st...

現時点で、3〜4000件のRT(表示によって異なる)、800件強のリプライ、1100件台の引用ツイートがあります。
(1年たって消えたアカウントなども多数あるでしょう。炎上参加アカウントは消えやすい傾向も)

タグ:

posted at 01:24:50

須藤玲司 @LazyWorkz

22年8月27日

そして、「犬笛」を吹いたとされる、約350万ユーザーをフォロワーに持つインフルエンサー・H氏の、第一回目の引用 RTは、これです。
twitter.com/takapon_jp/sta...

タグ:

posted at 01:29:39

須藤玲司 @LazyWorkz

22年8月27日

どうでしょうか。
インフルエンサーH氏のツイートは、「二重、もしくはコード化された言葉や記号」は含まれた「犬笛」でしょうか?

コードを共有しない者には裏の意味を読み解けないのが犬笛の特徴ではありますが、そんなまわりくどい裏の意味が隠されているとは、私には読み取ることができません。 pic.twitter.com/avGnXnf1i5

タグ:

posted at 01:36:13

Hideki Kawahara: WAS @hidekikawahara

22年8月27日

AppleのM1やM2は、GPUとCPUのメモリが共通なので(だと思う?)CUDAよりも深層学習に向いていそうな気がする。JuliaのFluxとMetal.jlを組み合わせて最強な環境が手に入る?ことを期待している。

www.juliabloggers.com/technical-prev...

タグ:

posted at 03:21:26

ひろなか@地方のはむ @16naka_show

22年8月27日

@sakuma_tomoyuki 先生たちはものすごく頑張ってるのは理解しているし、親としても頼りにしているところです。
このお手紙の受け入れ難いポイントは、
・何だか上から目線
・何だか強制的
・公務員はこれが当たり前
みたいな雰囲気が出ている事なのかも知れないです。あくまで個人的な感想ですが😅

タグ:

posted at 05:56:42

Miles Cranmer @MilesCranmer

22年8月27日

Meta-programming in Julia is such a dream come true. The code optimizations possible with the `@ generated` macro are mind-blowing

タグ:

posted at 07:19:00

サイボーグ伯爵/h+JP @aqBDnsQ5gDNo5Aq

22年8月27日

@radiolife1980 指定担当者に辞書とか六法全書とか学校の教科書とか送りつけてみたらどうなるん?

タグ:

posted at 08:36:14

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

www.itmedia.co.jp/news/articles/... では compatibility interval を「互換区間」と翻訳しているが、この翻訳の仕方は誤訳とみなされるべきだと思います。

compatible には互換という意味もありますが、相性の良さや両立することも意味します。コンピュータネタ的に「互換区間」とするのはまずい。続く pic.twitter.com/BNwiR1M2kZ

タグ: 統計

posted at 10:05:12

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 comparibility interval は「観測データとの整合性が無さすぎると判断されずに済んだパラメータ値達の集合」(データとの両立できるパラメータ値の区間)という意味であり、consistency interval と言い換え可能です。

これを「互換区間」と訳すのは非常にまずいと思う。

タグ: 統計

posted at 10:05:13

ゑゑ @runrun_hello

22年8月27日

ベルヌーイ分布において期待値pであるとき分散はp(1-p)

比率に関する検定において母比率pが分かっているのに、標本分散を検定統計量の計算に用いる理由がわからない

タグ:

posted at 10:09:18

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 【※信頼区間:区間推定において、ある確率(信頼係数)のもとで母数がその内に含まれると推定された区間のこと】という説明の中には統計モデルに当たる語がないので、論外な説明扱いが妥当です。

そこからリンクがはってある bellcurve.jp/statistics/glo... の説明も論外。

色々ひどい。 pic.twitter.com/n7O6pQ2IcQ

タグ: 統計

posted at 10:13:54

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 母数はparameterの翻訳語。私は使わない。使わない理由は、母数という言い方だと、母集団の「母」との関連で、「母数は現実の母集団に関するなんらかの値のことである」と誤解させてしまいそうだから。

パラメータはモデルのパラメータの場合が非常に多い。信頼区間の文脈でもそうなっている。

タグ: 統計

posted at 10:13:55

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 confidence interval のconfidenceの意味は、統計モデルにも依存することを見えなくすると、confidence manの意味でのconfidenceになりかねない。

一方、データとモデル+パラメータ値のcompatibilityやconsistencyであれば、仮にデータとモデルが信頼できなくても意味を持たせられる。

タグ: 統計

posted at 11:02:04

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

「仮にどちらも信用できるとすれば~は信頼できる」と言うことをやめても、「どちらも信用できないけどそれらの相性は悪くない」とは言える。

confidenceからcomparibility (もしくはconsistency)に考え方を移行すれば、データもモデルも信用できるとは限らない場合にも対応できます。

タグ: 統計

posted at 11:02:05

前田陽平 @ent_univ_

22年8月27日

医療の世界で「多くの医師と異なる方針」でやっている場合、それが優れているということはほとんどありません。
優れたものは、多くの医師のやっていること、もしくはその延長線上にあるものです。
ネットで医療情報を検索するなら「特殊なこと」ではなくて、「普通はどうなのか」探すのがいいです。

タグ:

posted at 11:26:08

前田陽平 @ent_univ_

22年8月27日

なお、「他の医師と異なる方針だが優れたもの」はわりとすぐに広がります。
本当に優れたもので他で知られていないなら、YouTubeや本で一般の人にアピールするのではなく、学会などで他の医師に「これいいからみなさんの患者さんにもぜひやってみては」と発表したり、論文にしたりしますから。

タグ:

posted at 11:26:09

前田陽平 @ent_univ_

22年8月27日

もちろんすでに確立されたもので一般の方に知られていないことを広げていくのは大事なことだと思いますし、僕もやっています。
標準的ではないが優れた方法はまず専門家に広めたい、と考えるのが我々医療の専門家にとっては普通の発想なのです。それによりフィードバックも受けられます。

タグ:

posted at 11:26:09

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 この辺の説明の仕方は、竹村彰通『新装改訂版 現代数理統計学』もひどいです。

パラメータ値θで決まるモデルの確率分布に従う確率変数XとXに対応する信頼区間S(X)について、

P_θ(θ∈S(X))

は紛れもなく確率です。これを確率だと解釈できないと、竹内さんの本の内容は壊滅します(笑)。続く pic.twitter.com/5IDEaGHQdH

タグ: 統計

posted at 11:27:45

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 ところが、竹村さんは【P_θ(θ∈S(X))を確率と解釈することについては問題がある】と書いてしまっている。

私ならば「こういう失敗は誰にでもあるよね」で済ませますが、統計検定の受験のためにこの本を読んでいるような人達にとっては地雷になりかねない悪しき説明の仕方だと思います。続く pic.twitter.com/xgapdn9Rzu

タグ: 統計

posted at 11:27:47

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

⭕️確率変数Xについては確率P_θ(θ∈S(X))を考えることができるが、Xの実現値xについてθ∈S(x)の真偽は確定しており、θ∈S(x)の確率を考えることはできない。

というだけの話をするために、紛れもなく確率であるP_θ(θ∈S(X))を確率と解釈してはいけないかのように言うのはひどい混乱です。続く pic.twitter.com/MqnNNuDJum

タグ: 統計

posted at 11:27:50

前田陽平 @ent_univ_

22年8月27日

最近は一気に医学が進歩して治療方針が変わるということは減ってますが、たとえば、①新薬の登場や、②新しい手術デバイスの開発などによって、それまで常識的に選ばれていた治療方針や手術方法が一気に変わる、ということはあります。

タグ:

posted at 11:31:37

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 竹村さんのこの本を私は非常に良い本だと思っています。(実際、肯定的に何度も引用している。)

しかし、昔からある統計学入門での伝統的悪しき解説法に引きずられている部分が残っているので、そういう部分については、きちんと自分で批判的に読むことが必要だと思います。

タグ: 統計

posted at 11:33:02

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 この辺について、非論理的なひどい解説が生き残っている原因は、伝統の権威だと私は考えています。

「偉い先生がそう言っているからこの説明の仕方で良い」という科学を学んだ人とは思えないような感覚で解説する人達が、ひどい解説を維持しているわけ。

これは非常に不快な話だと思います。

タグ: 統計

posted at 11:37:58

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 人間には完璧に論理的な説明は無理で、1冊本を書くとどうしても粗が出てしまう。

高等教育を受けた側の読者はそういう粗の部分を受け入れないだけの心の強さと教養を身につけていないとまずいと思います。

教科書にある論理的でない説明は自分のノート内では訂正しておくべき。

タグ: 統計

posted at 11:41:21

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 このスレッドで指摘しているような信頼区間に関する非論理的な説明の歴史はおそらく古いと思います。その歴史を史料で追いかけると、20世紀における統計学普及の歴史の暗黒面が見えて来る可能性もあると思います。

この件はベイズ統計の普及にも関係がある。

タグ: 統計

posted at 11:44:02

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 「95%信頼区間の95%は確率ではない」と言い張る困った人(非常に困ったことに博士号持ちの場合がある)は、「ベイズ版の95%信用区間の95%は確率である」と言う傾向があるように思えます。

信頼区間に関する非論理的な説明は、ベイズ信用区間との対比として生き残っている疑いがある。

タグ: 統計

posted at 11:46:49

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 論理的により正確な説明はこうです。

⭕️95%信頼区間の95%もベイズ版95%信用区間の95%もどちらもモデル内確率であるが、それらの確率の定義は異なる。

⭕️シンプルなモデルでは、信頼区間とベイズ版信用区間は定義は異なるが互いに相手を近似していることが多い。

続く

タグ: 統計

posted at 11:53:20

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 重要なポイントは、どちらの95%も「モデル内確率」であることと、2つの区間が「互いに相手を近似していることが多い」ということです。

⭕️95%という確率の値は現実におけるデータの生成のされ方と無関係に定まっている。

⭕️定義が異なる2つの区間を実用的には区別する必要がない場合がある。

タグ: 統計

posted at 11:53:22

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 「ベイズ版95%信用区間であればその区間が真の値を含む確率は95%だと考えてよい」のような説明の仕方は、論外すぎのひどくミスリーディングな説明の仕方です。

これをまともな説明の仕方だと信じてしまうような人達が大挙して信頼区間に関する非論理的な説明を維持して来ているように見える。

タグ: 統計

posted at 11:56:29

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 論理的に正しい説明

⭕️現実で得たデータとモデル(事前分布を含む)から計算されたモデル内確率分布(事後分布と呼ばれる)で測った「θが95%信用区間に含まれる確率」は95%になる。

⭕️パラメータ値θもモデル内で生成された仮想的データから計算された95%信頼区間にθが含まれる確率は約95%になる。

タグ: 統計

posted at 12:01:16

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 定義は全然違うのですが、シンプルなモデルにおいては、数学的理由によって、同じデータの数値xから計算された通常の95%信頼区間とベイズ版95%信用区間は近似的によく一致することが多いです。

95%信頼区間の近似計算としてベイズ版信用区間を使えるし、逆も正しいという場合が結構ある。続く

タグ: 統計

posted at 12:09:47

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 続き。そういう場合には次が成立する。

⭕️現実で得たデータとモデル(事前分布を含む)から計算されたモデル内確率分布(事後分布と呼ばれる)で測った「θが95%信頼区間に含まれる確率」は約95%になる。

2つ前のツイート中の(ベイズ版)「信用区間」を(通常の)「信頼区間」に置換されている。続く

タグ: 統計

posted at 12:09:49

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 こういうことが成り立つ場合には、信頼区間と信用区間の定義の違いを大問題であるかのように語ることは馬鹿げています。

しかし、主義で統計学を分類したい困った人達にとっては大問題らしく、信頼区間と信用区間の解釈の違いだけを強調し続けていたりする。

タグ: 統計

posted at 12:09:50

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 そういう困った人達は、我々の社会に少しずつ害を及ぼしているように見えます。

新型コロナ関連の研究でベイズ統計の方法を使っていると、それに対して、「ベイズだから研究結果の解釈が違って来る」というようなことを安易に言う人達が発生している。

そういうのは本当にやめて欲しいです。

タグ: 統計

posted at 12:14:01

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 例:イベルメクチンに関する論文 www.nejm.org/doi/full/10.10... ではリスク比の区間推定を、通常の信頼区間ではなく、ベイズ版信用区間で行っていたのですが、それに対して「ベイズだから解釈は違う?」というようなことを言う人達がいた。

しかし、この場合に 2つの区間はほぼぴったり一致します。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 12:19:13

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 通常の信頼区間とベイズ版信用区間を実践的には区別する必要がない場合が数学的理由によってあることをよく知っていると、リスク比に関する通常の信頼区間を求めるための技巧的処理法(中心極限定理を使う)とベイズ版のシンプルさを比較して、後者を論文で採用する気持ちはよくわかります。

タグ: 統計

posted at 12:22:43

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 主義の違いによって全く異なる統計学があると信じてしまうような権威に弱い(ゆえに非科学的な)人達にとっては、通常の信頼区間とベイズ版信用区間を実践的には区別する必要がない場合が数学的理由によって結構あるという事実は思いもよらないことだと思います。

タグ: 統計

posted at 12:28:35

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 主義に基く統計学へのこだわりは、新型コロナ問題が発生している緊急時に、科学的コミュニケーションを阻害していると思います。

その原因を作った人達はどのように責任を取るつもりなのでしょうか?

おそらく責任を取るべき立場に立っていること自体を認識していない。ひどい話だと思います。

タグ: 統計

posted at 12:28:35

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 統計学入門の解説について批判的なことを述べると、論理的に証拠を挙げることによって反論するのではなく、

❌偉い人が書いた教科書
❌偉い人が書いた論文

を持ち出して権威で威圧しようとする人がいる。

そういう態度はみんなで批判して行かないと結構力を持つ可能性があるので要注意。

タグ: 統計

posted at 12:42:49

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 自分自身の力で論理と証拠を示した上で参考になる文献として教科書や論文を紹介することと、教科書や論文の権威を正しいことの根拠にすることは全然違う。

信頼区間 竹村

でツイッターを検索すればその辺の違いの実例を見ることができるかも(笑)

twitter.com/search?q=%E4%B...

タグ: 統計

posted at 12:48:39

黒木玄 Gen Kuroki @genkuroki

22年8月27日

これはめちゃくちゃまずそうな話。

スパイ眼鏡やスパイカメラの実物紹介記事などを見て育った人が現在では立派な理系のおじさんになっているケースは結構多いと思う。

有害図書指定した人達はその理由を説明して議論に応じる責任があると思いました。おそらくボッコボコにされる。 twitter.com/radiolife1980/...

タグ:

posted at 13:24:11

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

developers.google.com/machine-learni...
Home > Products > Machine Learning > Guides > Good Data Analysis

この「機械学習」に分類されている「良いデータ解析」の解説は、もろに大昔からある統計学の入門的解説のサブセットになっています。

機械学習ユーザーは統計学の入門的知識に欠けている?

タグ: 統計

posted at 13:37:52

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 これ、場合によっては義務教育でも教えているような話なんじゃないか?

そういうレベルの話を Google 社内で教育しているように見える点は非常に興味深いです。

タグ: 統計

posted at 13:40:27

こーた丼 @rental_math

22年8月27日

Googleと言って箔をつけるだけの簡単なお仕事です twitter.com/genkuroki/stat...

タグ:

posted at 13:41:40

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

【Look at your distributions】

データが得られたら、その要約値を見る前に、データを適切に視覚化してデータの数値の分布を見なければいけない。

これは統計学の入門的な講義では必ず強調されることです。

統計学実践のイロハのイの最初の1画目のノに当たる話。

タグ: 統計

posted at 13:44:51

たらお改 @aka11209137

22年8月27日

@sakuma_tomoyuki これは「たより」とありますが、保護者に配布するやつではなくて、職員に出す校長の意思統一のツールでしょう。

にしても内容終わってるね。

タグ:

posted at 13:47:43

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 これについては個人的に「ゴリラ論文」とよんでいる面白い話があります。

宿題として、データを渡して、統計分析させて、ゴリラの存在に学生が気付くかどうかの実験。統計分析の指示の出し方で気付く割合に違いが出たという話。

これに類することをやっている教員は昔から結構いるはず。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 13:49:41

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 データの代表値が等しいのに、その内容が全然違う例として、アンスコムの例は昔から有名だし、最近では多くの講義でデータサウルス(以下のリンク先を参照)がよく使われている。

データを渡されたら、まずはデータの数値の分布を見ないとダメ。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 13:52:53

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

【Consider the outliers】

外れ値の存在と扱いに注意を払うことも統計学では大昔から常識的。

タグ: 統計

posted at 13:55:26

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 【Consider noise】

データにはノイズもしくは無作為抽出に伴う確率的揺らぎの成分が含まれているので、統計分析の結果を報告する場合には、ノイズ(確率的揺らぎ)の見積もりを必ず含める必要があります。

これも統計学のイロハの1つです。

タグ: 統計

posted at 13:58:59

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

developers.google.com/machine-learni...
【Look at examples】

統計分析のコードを書いたら、具体例を詳しく見て、元のデータと分析の出力結果を詳細に比較して、妥当かどうかを確認するべき。

これはもはや単なる常識だと思います。

タグ: 統計

posted at 14:02:50

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

developers.google.com/machine-learni...
【Slice your data】

「層別化」もある程度以上の統計学を学んだ人にとっては常識的な方法の1つでしょう。

タグ: 統計

posted at 14:05:04

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

www.google.com/search?q=%22%E...
"層別" 統計

経験的にこの手の話題については、佐藤俊哉さんの解説を見つけて読むのが分かりやすいです。

例えば www.jstage.jst.go.jp/article/eiyoga...

タグ: 統計

posted at 14:14:55

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

developers.google.com/machine-learni...
【Consider practical significance】

【「値 X が値 Y よりも 0.1% 大きいというのが本当だとしても、それは問題になるでしょうか?」と自問する必要がある】というような話も統計学入門の範囲内でしょう。

有意差の有無だけを見ちゃだめで効果量も見よも常識。

タグ: 統計

posted at 14:18:23

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 【Check for consistency over time】や【Acknowledge and count your filtering】もまじめに仕事をしたいならば当たり前の話に見える。

タグ: 統計

posted at 14:20:28

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

developers.google.com/machine-learni...
【Ratios should have clear numerator and denominators】

比率について報告する場合には、どのようにして集めたどういうサイズのデータにおける○○の比率であるかを明確にしなければいけない。

これは義務教育で教えるべきレベルの入門的話題だと思います。

タグ: 統計

posted at 14:24:18

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 以上で【Technical】の節の内容が、単なるまたは統計学における常識の話で尽きていることは明白だと思います。【Process】の節もほぼ同様と言って良いと私は思います。

やはり、単なる常識と統計学における常識的な事柄は押さえておかないとまともな仕事にならないのではないかと思いました。

タグ: 統計

posted at 14:28:52

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 個人的な意見では、機械学習エンジニアになりたい人達には、機械学習とは毛色が異なる医療統計についての講習を受けてもらうと、新型コロナの時代には興味を持って、有益な知識を身につけてもらい易いと思いました。

タグ: 統計

posted at 14:30:53

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 具体的には9月末に閉鎖されるらしい(ひどい!😭)京大OCW ocw.kyoto-u.ac.jp/news/6/

ocw.kyoto-u.ac.jp/course/328/
聴講コース 臨床研究者のための生物統計学

が非常に良いと思います。特に佐藤俊哉さんの講義動画の聴き易さが異様なほどすごい。似た仕事をやったことがあればそう思うはず。

タグ: 統計

posted at 14:34:21

ryugo hayano @hayano

22年8月27日

コロナ重症化、若い世代でも 爆発的感染拡大続く鹿児島県内 医師「ほとんどはワクチン未接種」
373news.com/_news/storyid/... via @373news_twit

タグ:

posted at 14:36:08

藤岡敦 @atsushifujioka

22年8月27日

リンク先には初出の文献が紹介されていますが、理由はどうなんでしょう🤔

mathshistory.st-andrews.ac.uk/Miller/mathwor... twitter.com/C_Doleans_Dade... pic.twitter.com/zdRl6971Ow

タグ:

posted at 14:37:29

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

小学生の保護者は、小学校で妙な統計学教育を受けていないか注意した方がよいです。

例えば、統計学通の間では円グラフが嫌われているのに、小学校では円グラフをよく使わせている。最悪なのは、データサイズの記述無しに、パーセント表示だけの円グラフを描かされること。完全にアウト。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 14:39:02

清水 団 Dan Shimizu @dannchu

22年8月27日

卒業生からの質問です。(ちょっと設定を変えました。)

<疑問1>
ラフに求めるとp,q,rはどのくらいの大きさの数でしょうか?

<疑問2>
p,q,rはそれぞれどのような範囲の数になるのでしょうか?

<疑問3>
そもそも,このような条件を満たすp,q,rは存在するのでしょうか? pic.twitter.com/SfqcKAH2qb

タグ:

posted at 14:40:51

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 添付画像

①最初の3つの等式を満たす p, q, r > 0 を求めると、解は一意的。
www.wolframalpha.com/input/?i=p%2Bq...

②その解は、5つの等式からなる連立方程式の近似解になっている。
www.wolframalpha.com/input?i=%7Bq%5... twitter.com/dannchu/status... pic.twitter.com/oC0c2aYler

タグ: 統計

posted at 15:08:34

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#Julia言語 #数楽

JuliaのOptim.jlを使った近似解の計算例
github.com/genkuroki/publ...

p = 0.2839852252443264
q = 0.1681895702410221
r = 0.5470635714575498

が近似解になっている。

twitter.com/dannchu/status... pic.twitter.com/56JQPTejD2

タグ: Julia言語 数楽

posted at 15:31:57

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#Julia言語 #数楽

p+q+r=1はexactに成立するようにした場合の近似解
github.com/genkuroki/publ...

p = 0.2841456385892286
q = 0.16845702633351833
r = 0.5473973350772531

上とほぼ同じ。

Optim.jlは非常に便利!

twitter.com/dannchu/status... pic.twitter.com/1jdwmE38YO

タグ: Julia言語 数楽

posted at 15:38:12

ファインマンbot @feynmannnn

22年8月27日

科学者が信仰熱心な人々と同じような信仰の確信をもてるとは、僕にはどうしても思えないのです。ひょっとすると可能なのかも知れませんが、それは僕にはわからないことだし、やっぱり難しいのではないでしょうか。

タグ:

posted at 16:01:52

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

❌95%信頼区間の説明はTJOさんが言うように統計WEBが分かりやすく~

⭕️95%信頼区間の説明はTJOさんが勧めているので統計WEBの解説はミスリーディングであることが分かる。

現実の母集団の標本分布と統計モデル内の仮想的な標本分布の区別が明瞭でない解説は全てアウト。 twitter.com/tota13890499/s...

タグ: 統計

posted at 16:27:30

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 信頼区間や信用区間の適切な使い方に繋げるには、「θが区間に含まれる確率」という方向に行くこと自体が穴ぼこにはまる可能性を増やすと思う。

データの数値とモデルのパラメータ値のcompatibilityを考えているという方向に持って行った方が教育的失敗が少なくなると思います。続く

タグ: 統計

posted at 16:40:06

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 confidenceではなく、compatibility (両立性、整合性、相性の良さ)で考えるべきだという意見は私個人の意見ではなく、800人の署名付きのnature誌での提案の説明

www.nature.com/articles/d4158...

でもcompatibilityがキーワードになっており、最近の論文

journals.sagepub.com/doi/10.1177/02...

でもそうです。 twitter.com/nature/status/...

タグ: 統計

posted at 16:40:07

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 注意:nature誌の800人署名の提案 www.nature.com/articles/d4158... はP値の使用を禁止する提案ではありません。添付画像部分を参照。

【We are not calling for a ban on P values.】

この辺を誤解するのはまずい。

その辺については最近の論文 journals.sagepub.com/doi/10.1177/02... の方が分かり易いです。 pic.twitter.com/VNZHMqOIaA

タグ: 統計

posted at 16:46:42

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 閾値抜きで役に立つP値函数の有用性に、私は自然に独立に気付いていたので、その後、Rothmanさんたちの疫学の教科書やGreenlandさんたちの提案を読んで自信を深めました。

タグ: 統計

posted at 16:49:21

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 nature誌の800人署名付きの提案や最近の論文(どちらにもGreenlandさんが絡んでいる)を見れば分かるように、統計学の使用法について真剣に考えている科学者達の間では、P値や信頼区間に関する考え方が、confidenceから(データの数値とモデル+パラメータ値の)compatibilityに移行しているのです。

タグ: 統計

posted at 16:52:52

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 その移行はかなり穏健で、P値を使うことは禁止していないし(journals.sagepub.com/doi/10.1177/02... で無数のP値を計算するべきだとしている(笑))、「現実の目的において意味のある効果の測定の重要性」という常識も自然に加味されたものになっています。

今までの考え方の否定ではなく、洗練になっている。

タグ: 統計

posted at 16:57:13

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 こういう類の事柄について、自分の頭で深く考えた経験も皆無で、以上で紹介したような最近の文献を読んで勉強もしていないような人達が、昔から統計学入門の教科書にあるミスリーディングな説明の仕方を死守しようとしているようにも見える。

これ、めっちゃまずいと思います。

タグ: 統計

posted at 16:59:32

ながぴい @Nagapiii

22年8月27日

かけ算の可換性なんざ誰でも知ってることなんで、そんなことをいくら指摘しても、「自分が数学が如何にできるか」という自慢になんか一切ならないということを、理解できていない人。 twitter.com/chujusilverhai...

タグ:

posted at 17:30:19

ハガネの連勤術師 @hgn_no_otaku

22年8月27日

>何で掛け算は順番変えてもいいのに割り算はダメなんですか?と質問受けたことありますか?

この質問の回答に困るのポンコツすぎるのでは? twitter.com/chujusilverhai...

タグ:

posted at 17:37:38

平 裕介 Yusuke TAIRA @YusukeTaira

22年8月27日

現行の鳥取県青少年健全育成条例は、主要な代替的な発表の経路を断つ効果のある条例なので、事前抑制か、それに近い強度の規制を課すものといえる。Amazonなどインターネット等での販売まで刑事罰付きで規制しており、県外の者への販売禁止をほぼ必然的に伴う。違憲だろう
www.pref.tottori.lg.jp/240262.htm pic.twitter.com/HPdD3nZJKy

タグ:

posted at 17:56:48

平 裕介 Yusuke TAIRA @YusukeTaira

22年8月27日

争い方だが、販売事業者等が刑事罰の適用を争うことは勿論できるが、これだと図書等の著者等が直接争うことはできない。そこで、著者等としては有害図書指定の告示を処分だとして取消訴訟を行い、処分性が否定される場合に備えて(条例自体の違憲性を前提に)指定違法の確認訴訟をすること等が考えられる

タグ:

posted at 18:21:00

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 ミスリーディングな解説があることを強調すると、代替的な説明の方が見逃されてしまい、より洗練された考え方を何も学ばずに、「ミスリーディングな解説がはびこっている」という否定的な事柄のみを暗記してしまう人が出て来がちだと思うので再度繰り返し説明しておきたいです。続く

タグ: 統計

posted at 18:24:47

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 統計モデルM(θ)を使って適切に定義された仮説θ=θ₀の(両側検定の)P値は、P値を計算するときに使ったデータの値とモデルM(θ=θ₀)の整合性(consistency)または両立性(compatibility)の指標と見なされます。

P値は概ねデータの数値以上に極端な値がモデル内で生成される確率として定義される。

タグ: 統計

posted at 18:24:48

平 裕介 Yusuke TAIRA @YusukeTaira

22年8月27日

指定が違法であることの確認訴訟は実質的当事者訴訟(行訴法4条後段)のうちの確認訴訟だが、(条例が違憲無効であるため指定も無効であるから)特定の図書が有害図書に指定されていないことの確認訴訟はできないだろうか。なお最悪、国賠訴訟で条例の違憲性を争えるし、住民訴訟という手段もありうる

タグ:

posted at 18:26:01

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 P値はデータの数値から決まるモデル内確率(一般にはその近似値)になる。

現実の母集団に関する確率ではないことに注意。

P値はあくまでも数学的フィクションであるモデル内の確率分布で測った確率になる。

続く

タグ: 統計

posted at 18:31:11

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 例えば、θがある薬の効果を表す指標とみなせるとき、仮説θ=0のP値はデータの数値と統計モデルの下での「薬の効果はゼロ」という仮説の整合性または両立性の指標になる。

一般に、仮説θ=θ₀のP値は「薬の効果はθ₀である」という仮説とデータの数値の整合性または両立性の指標になる。

タグ: 統計

posted at 18:31:12

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 P値の定義に課されるべき条件の1つは、モデルM(θ=θ₀)内で生成された仮想的なデータから計算された仮説θ=θ₀のP値の分布が0~1の一様分布で近似されることである。

モデルM(θ=θ₀)内で生成された仮想的なデータから計算された仮説θ=θ₀のP値がα以下になる確率はαで近似されなければいけない。

タグ: 統計

posted at 18:34:16

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 データの数値xから計算される仮説θ=θ₀のP値をpvalue(x|θ=θ₀)と書くとき、パラメータθの100(1-α)%信頼区間ci(x|α)は

ci(x|α) = { θ₀ | pvalue(x|θ=θ₀) ≥ α }

と定義する。P値函数pvalue(x|θ=θ₀)から信頼区間が定義される。

タグ: 統計

posted at 18:37:06

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 αを有意水準と呼ぶ。pvalue(x|θ=θ₀)<αのとき、データxによって仮説θ=θ₀が有意水準αで棄却されたという。

信頼区間 ci(x|α) = { θ₀ | pvalue(x|θ=θ₀) ≥ α } は、データxによって棄却されないパラメータ値全体の集合になる。

タグ: 統計

posted at 18:39:43

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 P値は、統計モデルの下での、データの数値xとパラメータ値θ=θ₀の整合性または両立性の指標であった。それがα未満になることを整合性が無さすぎると言うことにすると、信頼区間は

 データの数値との整合性が無さすぎると
 判定されずに済んだパラメータ値全体の集合

になる。これが基本!

タグ: 統計

posted at 18:42:25

平 裕介 Yusuke TAIRA @YusukeTaira

22年8月27日

罰則なので形式的には事前規制ではなく事後規制だが、他県の買い手を含めネット販売が事実上全てできなくなってしまう効果のある条例だとすれば、その規制効果は事前抑制並みに強いといえないかと思う。特に青少年ではない大人が県内で有害図書指定された図書を買う経路が相当限定されるのではないか

タグ:

posted at 18:42:31

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 P値と信頼区間については、以上のようにデータの数値とモデル+パラメータ値の整合性または両立性の指標を扱っていると考えるのがよい。

タグ: 統計

posted at 18:45:37

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 しかし、どうしても、信頼区間にθ=θ₀が含まれる確率について考えたい人もいるだろう。そういう人は、モデルM(θ=θ₀)内での仮説θ=θ₀のP値の分布経由で考えればよい。

タグ: 統計

posted at 18:45:39

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 XはモデルM(θ=θ₀)内での仮想的なデータの分布に従う確率変数であるとする。P値の作り方への要請から

pvalue(X|θ=θ₀)≥αとなる確率 ≈ 1 - α.

そして

θ₀∈ci(X|α) ⇔ pvalue(X|θ=θ₀)≥α

なので

θ₀∈ci(X|α)となる確率 ≈ 1 - α.

これで、信頼区間に関する確率の話もできた。

タグ: 統計

posted at 18:50:18

平 裕介 Yusuke TAIRA @YusukeTaira

22年8月27日

憲法21条1項違反が問題だが、憲法94条・地方自治法14条1項違反(刑法175条等との関係で法律の範囲内の条例とはいえない)にもならないか。指定有害図書のインターネット販売等の規制(罰則付き)まで法律は容認する趣旨といえるのか、かなり疑問だと思います。あと鳥取県って特に立法事実がある県なの?

タグ:

posted at 18:50:58

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 モデルM(θ=θ₀)内で信頼区間がθ₀を含む確率が約1-αになるという結果は、モデル内での計算結果に過ぎず、現実の母集団についての主張をするためには、モデルの現実における妥当性を検討しなければいけない。

その検討は非自明で難しいが、統計学ユーザーが負うべき責任になる。

タグ: 統計

posted at 18:53:40

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 モデルの妥当性には、データがどのように偏っている可能性があるかが大いに関係する。

完璧なiidになっているならシンプルなモデルで十分だが、データにバイアスが含まれている場合には、その分だけモデルの側を複雑にし、データの取得時にも色々頑張る必要がある。

タグ: 統計

posted at 18:58:28

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 「このモデルでオッケー!」と言える段階に達することができなくても、場面ごとに最善手に近い手を打って行く必要がある。

そういう状況では、データの側もモデルの側も不完全であっても使える「データの数値とモデル+パラメータ値の整合性または両立性の指標」という考え方は役に立つだろう。

タグ: 統計

posted at 19:01:27

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 「データもモデルも不完全だが、現時点ではこれがベストの分析であり、この分析に基いてリスクをコントロールする努力をして行こう」というような状況でも使えるP値と信頼区間の解釈は、以上で述べたようなものである。

これが基本的な教養になることは社会的に十分に価値があると思います。

タグ: 統計

posted at 19:05:15

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 以前(と言っても結構最近)、他のスレッドで解説したように、以上のP値と信頼区間の解釈の仕方は、尤度函数やベイズ統計での事後分布の解釈にもそのまま拡張されます。

「データの数値とモデルの整合性または両立性」という考え方は統計学において最も基本的で普遍的な考え方だと思います。

タグ: 統計

posted at 19:08:05

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 鋭い疑問にコメント。

分母のpが既知なのにpにp̂=k/nを代入した式を使う「どうして?」と言いたくなる検定はWaldの信頼区間に対応する検定です。

分母のpをそのまま使う検定はWilsonの信頼区間に対応する検定です。こちらの方がWald版よりも優れていることが分かっています。 twitter.com/yutan_huku/sta...

タグ: 統計

posted at 19:52:52

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 「n回中k回成功」というデータについての仮説「成功確率はpである」のWald版のP値は

2(1 - cdf(Normal(0,1), |k - np|/√(n(k/n)(1-k/n)))).

Wilson版のP値は

2(1 - cdf(Normal(0,1), |k - np|/√(np(1-p)))).

分母の平方根の中だけが違う。続く

タグ: 統計

posted at 19:52:53

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 95%信頼区間の定義はP値が5%以上になるp全体の集合。

Waldの95%信頼区間は

[k/n - 1.96√((k/n)(1-k/n)/n), k/n + 1.96√((k/n)(1-k/n)/n)]

とシンプルに書ける。Wald版には誤差を大きくする代わりに、信頼区間の計算を単純化する利点がある。暗算でも結構行ける。続く

タグ: 統計

posted at 19:52:54

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 Wilsonの95%信頼区間は、pに関する二次方程式

(k - np)² = 1.96² np(1-p)

の解をp_L < p_U と書いたときの区間

[p_L, p_U]

になる。このようにWilson版では信頼区間の計算がややこしくなるが、Wald版よりもずっと良い性質を持ちます。

タグ: 統計

posted at 19:52:55

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 東大出版会の『統計学入門』を真剣に読むような人は、世間一般の基準では相当に賢い人達の集団のはずなのに、出版されてから30年以上「炎上」せずにまるで標準的な教科書のごとく使われて来たのはちょっと不思議な感じがします。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 19:57:41

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 例えば、Waldの信頼区間は0~1の範囲をはみ出すことがあるのですが、Wilsonの信頼区間であればそういうことはありません。Wilsonの信頼区間は(ゆえにその場合のP値函数は)他にも色々よい性質を持ちます。

暗算で計算するならWaldの信頼区間の方がずっと簡単。

タグ: 統計

posted at 20:02:18

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 1ヶ所訂正 ❌竹内 → ⭕️竹村

こういう「弘法も筆の誤り」的な節を、自分自身のおかしな考え方の権威付けに使っている人を見つけたので、この部分を引用してどこがおかしいかを解説せざるを得なかった。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 20:08:38

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計

⭕️確率変数XについてはP_θ(θ∈S(X))という式で書かれたものは紛れもなく確率である。

⭕️具体的な数値xについてθ∈S(x)の真偽は確定しており、θ∈S(x)の確率を考えることはできない。

たったこれだけの話なのに、P_θ(θ∈S(X))を確率だと解釈できないと言うのはどう考えても訂正の必要有り。 twitter.com/genkuroki/stat...

タグ: 統計

posted at 20:15:32

台風 @taifu21

22年8月27日

【「今、手を挙げてない人は、話を聞いていなかったか、やる気がないかどちらかになりますが、よろしいですね?」】

この手の脅迫を
「攻める指導」って言っているのか。
「責める指導」じゃなくて?

そもそも「指導」なの?
児童を支配したいだけにも見えるけれど。

#超算数 twitter.com/img46ginR6W3F0...

タグ: 超算数

posted at 20:43:41

薬学部教授π @Sira04431769

22年8月27日

統計をガチで学んだら軽く5、6年は最低かかると思います。標準的には、微分積分、線形代数、数理統計学、計算機統計学で3年、データ解析処理等のスキルを身につけ、大学院レベルで、臨床研究の研究デザイン、線形推測論、ベイズ流解析、混合効果モデル、等、かなり果てしないです。どこまでかですが

タグ:

posted at 20:47:48

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 「モデルが正しければ(現実を良く近似していれば)」という条件を仮定するだけだと何の意味もなくて、モデルが正しいことの証拠を示さなければ強い結論は出せないです。

そして多くの場合にそういう証拠は出せません。

「自信過剰になるな」がP値や信頼区間の使い方に関する議論では主流。続く twitter.com/takotakot/stat...

タグ: 統計

posted at 21:42:42

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 今まで、P値や信頼区間の計算によって、科学的お墨付きが得られたように自信たっぷりに結論を出して来た人達は、そういう自信の持ち方を誤りだったと認める必要がある。

natureの記事

www.nature.com/articles/d4158...

でも

overconfiden{t,ce}

の語が3回登場します。

例えば
pic.twitter.com/rdbTGYaUZR

タグ: 統計

posted at 21:42:44

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 あと、話題が技術的詳細にずれてしまいますが、統計モデルが現実をどのくらい近似していれば、用いた統計分析の結果が現実において信用できるかは非自明な問題です。

タグ: 統計

posted at 21:42:50

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 例えば、正規分布の標本分布モデルから出て来るt分布を使った平均に関する検定や信頼区間は、現実の母集団分布が正規分布でなくれも、標本平均の分布が正規分布で近似されていれば使える。

しかし、正規分布の標本分布モデルを使った分散の検定や信頼区間は正規母集団でない場合には使えない。

タグ: 統計

posted at 21:42:51

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 要するに、統計モデル内の仮想的な母集団分布が現実の母集団分布を直接近似していなくても大丈夫な場合と、そうでない場合があります。

例の『統計学入門』はその辺の区別もしていないので、実践的にも相当に問題がある教科書だと思います。

タグ: 統計

posted at 21:42:52

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 で、現実の母集団に関する標本平均の分布が正規分布で近似されていることは、標本サイズが大きいならばかなり良く分かりますが、小さい場合にはその標本だけからはよく分かりません。別の間接的な証拠を使わないと苦しいでしょう。

タグ: 統計

posted at 21:42:52

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 以上の例は、母集団の平均や分散の推定というシンプルな統計分析の話だったので、そう難しい話にはならないのですが、モデルが複雑になると、使用しているモデルがどれだけ妥当であるかという問題は恐ろしく難しくなります。

自信過剰を避けることが普通にならないと危ないです。

タグ: 統計

posted at 21:42:53

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 信頼区間をcompatibility intervalと改名しようという提案の意図は、

⭕️信頼区間は、データやモデルが妥当かどうかと無関係に、データとモデル+パラメータ値の両立性(整合性)の様子を表しているに過ぎない

という事実を明らかにして、過信を避けることです。

www.nature.com/articles/d4158... twitter.com/genkuroki/stat... pic.twitter.com/IXasWZDsBI

タグ: 統計

posted at 21:49:29

黒木玄 Gen Kuroki @genkuroki

22年8月27日

#統計 「その辺についてもっと詳しく!」と言いたくなるはずで、そういう人は最近の論文(短くて分かりやすい)

journals.sagepub.com/doi/10.1177/02...

に目を通すとよいと思います。

統計ユーザーなら、こういう議論がされているという認識は必要だと思う。 pic.twitter.com/j9NxjgFtWM

タグ: 統計

posted at 21:52:40

探究 @sekai_tankyu

22年8月27日

これはおもんない。文脈で分かるやろ。 twitter.com/yuhunami_tidor...

タグ:

posted at 22:28:05

探究 @sekai_tankyu

22年8月27日

元ネタ消えてたw twitter.com/uki2wqxyg7rx3g...

タグ:

posted at 22:29:55

積分定数 @sekibunnteisuu

22年8月27日

@sekai_tankyu 鍵垢にしちゃったようですね。

タグ:

posted at 22:31:00

探究 @sekai_tankyu

22年8月27日

肝は

. , 、

の区別

#超算数 (アホ・バカな算数数学)

タグ: 超算数

posted at 22:31:40

探究 @sekai_tankyu

22年8月27日

@sekibunnteisuu あ、鍵垢か。スクショとってないから内容を忘れてしまいました。

タグ:

posted at 22:33:59

探究 @sekai_tankyu

22年8月27日

@sekibunnteisuu ありがとうございます。助かります。

タグ:

posted at 22:40:50

須藤玲司 @LazyWorkz

22年8月27日

>砺波先生たちのように「犬笛」を使うと、インフルエンサーのほとんどあらゆる批判や悪口みたいなのがぜんぶ「犬笛」になる。そうじゃないでしょ。
twitter.com/eguchi2018/sta...

まったく同感。
同じ批判でも、フォロワー10人なら許されて、フォロワー10万人だと許されない犬笛、というのも変な話です。

タグ:

posted at 23:42:41

須藤玲司 @LazyWorkz

22年8月27日

日本におけるオンライン・ハラスメントの現状と対策:Twitterでの女性記者のツイート「炎上」を例に
f1000research.com/articles/10-11...

本当は考え方に踏み込んだ批判をしたいのですが、そこに踏み込むまでの段階で、外形的・論理的な細かい誤りがまだまだあります。
この際、気づいた分を指摘しておきます。

タグ:

posted at 23:46:09

須藤玲司 @LazyWorkz

22年8月27日

>「(死者数が)少ないという表現は妥当である」(略)「(新型コロナ感染症の)他にも重要な事柄がある」
>これらは(略)、「そっちこそどうなんだ主義 (whataboutism) 」に基づくコメントである。

むちゃくちゃ言うてはります。
もちろんwhataboutismは後者だけ。「これらは」ではありません。 pic.twitter.com/UJop1WEe5j

タグ:

posted at 23:48:27

須藤玲司 @LazyWorkz

22年8月27日

>元ツイートの内容ではなく、Z氏の属性に対して批判もしくは誹謗するものも多かった。例えば、「恥を知れ」「心の底から軽蔑する」「うるさい、クズ」「そんなことでよく記者をやっているものだ」

この例のなかで属性誹謗は、もちろん「記者」の件だけ。
「属性誹謗」批判を、不適切に濫用してます。 pic.twitter.com/9KGCw2AfwQ

タグ:

posted at 23:50:26

須藤玲司 @LazyWorkz

22年8月27日

>Z氏がオンライン・ハラスメントを受けた理由としては、(略)外見 (ルッキズム)、という PEN アメリカの調査結果でも見られた(略)

日本語として破綻してますが…。
「ハラスメント理由はPEN America調査での理由と共通する」との意図でしょう。

しかし「外見」については、全く報告されてません。 pic.twitter.com/i1RxpOqwhD

タグ:

posted at 23:55:52

須藤玲司 @LazyWorkz

22年8月27日

「表1. 直接リプライの内容と分類」では、リプライ1200件前後の内容を分類しています。
そこに「外見(ルッキズム)」はありません。(女性差別的の項にも)

X記者はアイコンが顔写真ということもあり、もしかするとルッキズム攻撃もあったかもしれません。しかし、そのことは調査されてません。 pic.twitter.com/qsLB4KMaC5

タグ:

posted at 23:56:43

須藤玲司 @LazyWorkz

22年8月27日

データから読み取ってないにも関わらず「外見(ルッキズム)(略)を理由に行われていることが分かる」とするのは、無理があります。
PEN Americaの先行研究、あるいはイデオロギーに引きずられてます。

※ただし、このパラグラフは日本語として破綻してるため、意図を読み取れてない可能性もあります。 pic.twitter.com/K6LKknBmbU

タグ:

posted at 23:59:41

@genkurokiホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

掛算 統計 超算数 Julia言語 数楽 JuliaLang 十分 と教 モルグリコ 掛け算

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました