面向铁塔图纸的关键信息智能提取算法设计

打开文本图片集
摘 要:电力工程设计中铁塔设计图纸的自动识别与信息提取是一项急需解决的问题。该文提出一种基于深度学习和光学字符识别(Optical Character Recognition,OCR)技术的铁塔设计图纸智能识别系统。该系统由分段结构识别、文本识别和关键信息提取3个主要模块组成。分段结构识别模块采用改进的U-Net卷积神经网络模型;文本识别模块基于Tesseract 4.0进行优化,提高字符识别准确率;关键信息提取模块则使用基于规则的解析引擎,从识别出的分段结构和文本中抽取关键信息。(剩余10765字)