基于外部知识的中文文本检错  

在线阅读下载全文

作  者:段建勇 李杰东 王昊 

机构地区:[1]北方工业大学信息学院 [2]CNONIX国家标准应用与推广实验室

出  处:《数字技术与应用》2022年第6期1-4,65,共5页Digital Technology & Application

基  金:国家自然科学基金项目(61972003);教育部人文社科基金:基于深度学习的汉语文本自动校对方法研究(21YJA740052)。

摘  要:中文文本检错是一项重要任务,在众多应用场景中都需要对各种场景转化而来的文本进行检错以便后续模型的运用。采用人工方式进行文本检错费时费力、效率低。研究者提出了自动检错的方法,但目前的研究多集中在以语义为基础进行检错,缺少对外部知识的引用。本文针对现有检错方法的不足,结合中文文本语句的特点,将输入的中文字符结合其拆字知识,同时将中文的分词结果结合其更小粒度的义原外部知识。

关 键 词:中文文本 中文字符 人工方式 义原 分词 检错 外部知识 应用场景 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象