基于深度学习实现增强更新的文本检测模型

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:为了应对场景文本检测的查询更新上依赖隐式更新的挑战,提出了基于深度学习实现增强更新的文本检测模型。该模型首先对边界框的控制点进行建模完成查询的初始化。在解码过程中,该模型不仅利用解码器的注意力机制,还结合当前解码器层及后续层的预测信息来指导查询进行更精确的增强更新。此外,还引入了预测聚合模块,它能够对相似的控制点预测进行聚合,从而提高了检测的鲁棒性。(剩余115字)

monitor
客服机器人