論文紹介��N. Demerlé, P. Esling, G. Doras and D. Genova. �“COMBINING AUDIO CONTROL AND STYLE TRANSFER USING LATENT DIFFUSION”
前澤 陽(ヤマハ株式会社 研究開発統括部 | MINA Lab)
Confidential
About me
https://www.yamaha.com/ja/tech-design/research/base/minalab/
Confidential
論文紹介- N. Demerlé, P. Esling, G. Doras and D. Genova. “COMBINING AUDIO CONTROL AND STYLE TRANSFER USING LATENT DIFFUSION”
Confidential
論文紹介- N. Demerlé, P. Esling, G. Doras and D. Genova. “COMBINING AUDIO CONTROL AND STYLE TRANSFER USING LATENT DIFFUSION”
音色のエンコーダ
構造のエンコーダ
Confidential
論文紹介- N. Demerlé, P. Esling, G. Doras and D. Genova. “COMBINING AUDIO CONTROL AND STYLE TRANSFER USING LATENT DIFFUSION”
❄
Confidential
論文紹介- N. Demerlé, P. Esling, G. Doras and D. Genova. “COMBINING AUDIO CONTROL AND STYLE TRANSFER USING LATENT DIFFUSION”
Confidential
論文紹介- N. Demerlé, P. Esling, G. Doras and D. Genova. “COMBINING AUDIO CONTROL AND STYLE TRANSFER USING LATENT DIFFUSION”
直接MIDIをconditionに
入れたほうがOnset F1は高くなる
(ムリな音を出してまで
楽譜通りに生成しようとする?)
構造から音色を推論できないように
したほうが、音色の類似性・音質がよい
Confidential
論文紹介- N. Demerlé, P. Esling, G. Doras and D. Genova. “COMBINING AUDIO CONTROL AND STYLE TRANSFER USING LATENT DIFFUSION”
直接MIDIをconditionに
入れたほうがOnset F1は高くなる
(ムリな音を出してまで
楽譜通りに生成しようとする?)
楽曲レベルでのStyle transferでは、
原曲の構造に忠実でかつ、
Style Transfer先のジャンルとして識別されやすい
Confidential