にしもつ
- いいね数 37,683/53,703
- フォロー 4,143 フォロワー 2,119 ツイート 25,142
- 現在地 Hiroshima, Japan
- Web https://d.nishimotz.com/aboutme
- 自己紹介 NVDA日本語版 / NVDAチートシート / http://shuaruta.com シュアルタ @nishimotz / http://mstdn.jp/@24motz / https://www.threads.net/@nishimotz / YAPC::Hiroshima 2024 運営
«< 前のページ1次のページ >»
並び順 : 新→古 | 古→新
2023年05月01日(月)

低次元の潜在空間で拡散モデルを学習するLDM(Stable Diffusionの元ネタ)が、audioの生成でも有効という噂を聞いたので、AudioLDMとTANGOを読んだんですが、思った以上に画像生成と同じモデルが使われていてびっくりしました。
AudioLDM: audioldm.github.io
TANGO: tango-web.github.io pic.twitter.com/Zt7dIiSHh0
タグ:
posted at 18:31:21
«< 前のページ1次のページ >»
スポンサーリンク