单向句法依存关系指导下的跨模态检索

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘  要:大多数现有的跨模态检索方法仅使用每个模态内的模态内关系或图像区域和文本词之间的模态间关系。文章中提出了一种基于自然语言的句法依存关系的视觉语言模型,称为Dep-ViLT。通过句法依存分析,构建句法依存树,利用单向的句法依存关系增强核心语义的特征表达,促进语言模态与视觉模态的特征交互。(剩余10999字)

目录
monitor