基于CLIP语义特征增强的图像描述

  • 打印
  • 收藏
收藏成功


打开文本图片集

中图分类号:TP391 文献标志码:A 文章编号:1001-3695(2026)03-006-0689-07

doi:10.19734/j. issn.1001-3695.2025.08.0270

0 引言

图像描述任务旨在为输入图像生成准确、有意义的自然语言描述。目前主流方法采用编码器-解码器的架构:编码器用于提取输人图像的语义信息;解码器用于将编码阶段获得的语义信息解码为自然语言。(剩余19974字)

目录
monitor