融合文本、语音和表情的多模态情绪识别

打开文本图片集
文章编号: 1006-9798(2024)03-0020-11; DOI: 10.13306/j.1006-9798.2024.03.004
摘要: 针对情绪识别中信息不全面、易受噪声干扰等问题,基于Transformer网络构建了一种融合文本、视觉和听觉等信息的多模态情感识别网络模型(Bidirectional Encoder Representations from Transformers and Residual Neural Network and Connectionist Temporal Classification and Transformer,BRCTN)。(剩余12960字)