• 打印
  • 收藏
收藏成功
分享

深度学习图像字幕生成技术文献特征研究

摘 要:基于视觉的监控已广泛应用于施工管理,由于施工现场的复杂性,施工现场图元的专业性及其解释语句的专业术语特性,导致基于日常生活的常规计算机视觉技术与图像字幕方法从施工图像中自动检索语义信息仍具挑战性。分析知名数据库中2019年至2022年的86篇有关深度学习图像字幕生成文献,结果显示,卷积神经网络(CNN)长于解读图像内容并识别其中图像中的对象,循环神经网络(RNN)或长短期记忆理论(LSTM)多用于语言生成,且CNN和LSTM组合方法优于CNN和RNN组合方法,组合方法显著提升运算效率与解释精准度。(剩余6460字)

网站仅支持在线阅读(不支持PDF下载),如需保存文章,可以选择【打印】保存。

目录
monitor