基于生成对抗网络的语音画像方法

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：【目的】为应对当前语音驱动的人脸图像生成方法在特征提取和生成质量方面的挑战，特别是解决音频与人脸特征之间深层联系的探索和利用不足问题，提出了一种基于梅尔频率倒谱系数（MFCC）的InceptionResNet-V1音频特征提取网络。【方法】通过SEGAN对音频信号进行数据增强，以实现特征的精细提取和有效传递。（剩余14256字）

试读结束

购买全文6.00元下一篇基于改进退火算法的含风光水储的电力系统优化调度研究

河南科技

2025年06期

¥6.00/本

关于龙源 关于我们联系我们龙源大事记诚聘英才用户守则 购刊指南 电子刊购买流程会员介绍常见问题 客服中心 联系客服开具发票 商务合作 商务合作 网络信息举报
违法和不良信息举报电话：400-106-1235

举报邮箱：longyuandom@163.com
网上有害信息举报专区 支付方式 支付宝在线支付公司转账邮局汇款 特色服务 刊社入口友情链接

关注微信公众号
获取更多资讯
北京龙源网通电子商务有限公司
（署）网出证（京）字第188号丨京公网安备 11011302003690号丨京ICP备18053758号-2