基于知识蒸馏的视频描述轻量化模型及性能优化

  • 打印
  • 收藏
收藏成功


打开文本图片集

关键词:视频描述生成;模型压缩;轻量化;知识蒸馏;预训练模型

中图分类号:TP391. 1 文献标志码:A 开放科学(资源服务)标识码(OSID):

文章编号:1003-3106(2024)11-2547-11

0引言

视频描述生成是计算机视觉和自然语言处理中一项具有挑战性的任务,旨在生成给定视频内容的文本描述[1-3],能为视觉受损或听力受损的人士提供无障碍服务、自动化内容审查系统识别不当或违规内容、为非母语观众自动生成字幕描述等[4]。(剩余9428字)

monitor
客服机器人