一种基于多模态感知的双声道音频生成方法

打开文本图片集

关键词：音频生成；卷积神经网络；多模态

中图分类号：ＴＰ３９３．０３文献标识码：Ａ

人类听觉系统能够根据音频在两耳间的声级差以及声音到达两耳的时间差来定位音源方位与距离，感受环境的空间分布［１］。然而，目前大部分视频仍然使用单声道音频，无法通过左右声道的差异重现人类的真实听觉感受，视频中的空间位置并没有在音频中得以体现，从而降低了观看体验，无法还原真实的空间化听觉感受。（剩余8213字）

~~试读结束~~

购买全文5.00元打印文章

网站仅支持在线阅读（不支持PDF下载），如需保存文章，可以选择【打印】保存。

下一篇基于用户消费行为的电力数据客户立体画像构建

畅销排行榜

计算技术与自动化

2022年04期

电子价￥10.89元

购买