一种新型的个性化语音交互数字人系统设计与实现

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要:针对资源受限的消费级终端在构建高保真、实时交互数字人时面临的“质量—效率”博弈难题,文章提出一种“3D几何驱动+2D神经渲染”异构架构。该方法以Gan2Shape自监督重建3D人脸几何,结合DeepFaceLive流式神经纹理渲染,解决大角度姿态下的面部崩坏;引入OBS虚拟摄像头实现跨进程零拷贝传输,降低延迟。(剩余12097字)

目录
monitor
客服机器人