检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李云汉 施运梅[1,2] 李宁[1,2] 田英爱[1,2] Li Yunhan;Shi Yunmei;Li Ning;Tian Ying ai(Beijing Information Science and Technology University,Beijing Key Laboratory of Internet Culture Digital Dissemination,Beijing 100101,China;School of Computer,Beijing University of Information Technology,Beijing 100101,China)
机构地区:[1]北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101 [2]北京信息科技大学计算机学院,北京100101
出 处:《中文信息学报》2022年第9期1-18,27,共19页Journal of Chinese Information Processing
基 金:国家重点研发计划项目(2018YFB1004100)。
摘 要:文本校对在新闻发布、书刊出版、语音输入、汉字识别等领域有着极其重要的应用价值,是自然语言处理领域中的一个重要研究方向。该文对中文文本自动校对技术进行了系统性的梳理,将中文文本的错误类型分为拼写错误、语法错误和语义错误,并对这三类错误的校对方法进行了梳理,对中文文本自动校对的数据集和评价方法进行了总结,最后展望了中文文本自动校对技术的未来发展。Text correction,an important research field in Natural Language Processing(NLP),is of great application value in fields such as news,publication,and text input.This paper provides a systematic overview of automatic error correction technology for Chinese texts.Errors in Chinese texts are divided into spelling errors,grammatic errors and semantic errors,and the methods of error correction for these three types are reviewed.Moreover,datasets and evaluation methods of automatic error correction for Chinese texts are summarized.In the end,prospects for the automatic error correction for Chinese texts are raised.
关 键 词:自动校对 拼写错误 语法错误 语义错误 数据集 评估指标
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.218.245.163