基于OCR技术的文本数据质量控制研究

  • 打印
  • 收藏
收藏成功


打开文本图片集

文本数据质量的发展离不开海量的原生数据和网络原生数字资源的支持。原生数据包括业务数据、文献数据和用户数据三大类型。其中,文本数据是支撑文献数据搜索引擎和知识化资源系统建设的主要对象。目前对于文本数据质量控制存在流程复杂、数量巨大和技术效率要求较高的问题,OCR识别技术因此备受关注,其采用人工智能的辅助算法,OCR可以提高其兼容性。(剩余4136字)

目录
monitor