基于Vision Transformer的毫米波人体安检图像违禁品识别

打开文本图片集
作者简介:贾宝芝(1987-)男,博士,研究方向为人工智能,计算机视觉,深度学习。
摘要:毫米波人体安检图像因为成像质量和遮挡等问题,对于违禁品的识别存在识别难度大的问题。 因此采用更优的检测识别算法, 提升违禁品的识别速度和精度一直是业内重点研究的问题。 本文尝试将 Vision Transformer(ViT)应用到毫米波图像违禁品的识别过程中,通过将无监督预训练的 ViT 与经典的目标检测算法 Faster R-CNN 相结合,实现了高精度的毫米波人体安检图像违禁品识别。(剩余6543字)