基于OCR技术的文本数据质量控制研究  被引量:2

在线阅读下载全文

作  者:刘耀萱 

机构地区:[1]国家图书馆

出  处:《中国信息化》2024年第6期70-72,共3页

摘  要:文本数据质量的发展离不开海量的原生数据和网络原生数字资源的支持。原生数据包括业务数据、文献数据和用户数据三大类型。其中,文本数据是支撑文献数据搜索引擎和知识化资源系统建设的主要对象。目前对于文本数据质量控制存在流程复杂、数量巨大和技术效率要求较高的问题,OCR识别技术因此备受关注,其采用人工智能的辅助算法,OCR可以提高其兼容性。本文通过综述OCR技术的识别工作过程、关键技术、研究思路及在不同种类文献中的广泛应用,表明通过改善OCR技术可以提高对于文本数据的识别效率和准确度,实现文本数据的智能管理化。

关 键 词:OCR技术 文本数据 智能管理 人工智能 识别效率 用户数据 业务数据 数据质量控制 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象