• 打印
  • 收藏
收藏成功
分享

一种基于多模态感知的双声道音频生成方法


打开文本图片集

关键词:音频生成;卷积神经网络;多模态

中图分类号:TP393.03 文献标识码:A

人类听觉系统能够根据音频在两耳间的声级差以及声音到达两耳的时间差来定位音源方位与距离,感受环境的空间分布[1]。然而,目前大部分视频仍然使用单声道音频,无法通过左右声道的差异重现人类的真实听觉感受,视频中的空间位置并没有在音频中得以体现,从而降低了观看体验,无法还原真实的空间化听觉感受。(剩余8213字)

网站仅支持在线阅读(不支持PDF下载),如需保存文章,可以选择【打印】保存。

畅销排行榜
monitor