IT之家 3 月 24 日音问,阿里巴巴通义实验室本日发布了 PrismAudio,这是一个视频生成音频(Video-to-Audio)框架,其琢磨要点是环境音 / 音效合成,比如马蹄声、风雨声、金属敲击声等与画面推行同步的布景声息,而不是给东谈主物配音。 IT之家附官方属目先容如下: PrismAudio 是首个强项化学习与念念维链风雅蚁集的视频生成环境音框架。浅陋来说,咱们教模子学会了“先念念考,再发声”,而且有四位“老诚”同期给它打分。 语义老诚盯着画面,教模子认准“这是马蹄声,不是鸟叫...
2026-03-28