融合注意力机制与改进ResNet50的服装图像属性预测方法

打开文本图片集
摘 要: 为了解决人工标注服装图像属性效率低下的问题,提出了一种融合注意力机制与改进ResNet50的服装图像属性预测方法。首先对传统多标签分类方法中的模型进行了改进,改进后的方法能更充分利用任务之间的相关性,并减少数据稀缺问题带来的影响;接着引入CBAM注意力机制,用于捕捉服装属性上的细节特征。结果表明:在未引入注意力机制的情况下,基于改进ResNet50的方法在多项评价指标上均优于传统多标签分类方法,准确率提高了25.96%;与ResNet34、EfficientNet_V2、VGG16模型相比,ResNet50模型在服装图像属性预测方面整体表现更佳;引入CBAM注意力机制后,基于改进ResNet50的方法的准确率再提高了1.72%。(剩余14058字)