基于多角度融合与联合记忆网络的视频问答认知模型

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘  要: 为了解决现有视频问答模型认知推理能力不足的问题,引入旁观者记忆模块,提出了基于多角度融合与联合记忆网络的机器认知模型. 该模型根据问题定位目标对象,获得视频中对应的区域特征,同时联合视频的运动特征和外观特征,通过加入时间注意力机制的门控循环单元,有效地融合问题特征和视频特征,用(剩余21607字)

monitor