基于语码转换的低资源语言视觉问答方法研究

  • 打印
  • 收藏
收藏成功


打开文本图片集

中图分类号 TP391

DOI:10.12202/j.0476-0301.2025054

0 引言

随着社交媒体和移动互联网的普及,图像与文本逐渐成为信息传播的主要载体,如何有效理解和分析这些多模态数据是人工智能领域的重要挑战.得益于深度学习的快速发展,自然语言处理[1]和计算机视觉[2]取得突破,(剩余13730字)

monitor