にしもつ
- いいね数 37,683/53,703
- フォロー 4,143 フォロワー 2,119 ツイート 25,142
- 現在地 Hiroshima, Japan
- Web https://d.nishimotz.com/aboutme
- 自己紹介 NVDA日本語版 / NVDAチートシート / http://shuaruta.com シュアルタ @nishimotz / http://mstdn.jp/@24motz / https://www.threads.net/@nishimotz / YAPC::Hiroshima 2024 運営
2019年10月22日(火)
2018年にgoogleが発表した話者分離の論文 "Looking to Listen at the Cocktail Party" の追実装をしました。ポイントは音だけでなく顔画像情報もネットワークに入力することで、動画のような結果を得ることができます。
ソースコード整理してGithubに上げました → github.com/meokz/looking-... pic.twitter.com/ThaQyt9QM6
タグ:
posted at 23:28:31
なお大変よい機会なので受験生の皆さまにお伝えしておきたいのは、今日みたいな式典の最中に、緊張しまくった参列者がふと見上げた会場の窓の、その向こうに青空と虹がかかっているのを見た時に湧き上がる感情、こういうのを「をかし」と言います。現代の「可笑しい」とは少し意味が違うのでご注意を。
タグ:
posted at 14:23:48
スクリーンリーダーにはJAWSおよびNVDAを使っているが、ChromeとFireFoxではどちらを使うのがベストなのだろうか。JAWSの開発元のFreedomScientificの出している音源(英語)をいろいろ聞いていると、ほとんどがChromeである。ということは、Chromeの方がいいのだろうか。
タグ:
posted at 12:37:57
Firefoxは一時期各種ツールバーを操作するのにマウスエミュレーションを使うのが必須だったけど、久々に使ってみたら全部タブキーでフーカスできるようになってて、これはかなり便利になってる印象。
そしてなぜかChromeよりGoogle Docsの使い勝手が良い印象 (NVDAの場合)
タグ:
posted at 12:26:54