供应商投标文件关键信息数据自动提取方法
打开文本图片集
[摘 要]本论文研究智能招投标系统中针对供应商投标PDF电子文档的信息提取技术。研究内容包括PDF文本信息提取和表格提取中的表格结构还原和数据对齐问题。通过设计并实现相关功能和算法,包括软件架构、内容解析器类算法、文本提取模型和表格提取模型,实现了自动识别和提取关键信息并保存到数据库中。此外,将OCR技术与信息提取技术相结合,解决了扫描PDF文件的识别和提取问题,提高了文本和表格信息的完整性和准确性。(剩余7736字)
网站仅支持在线阅读(不支持PDF下载),如需保存文章,可以选择【打印】保存。