浅析中文分词方法  被引量:2

Chinese word segmentation method research

在线阅读下载全文

作  者:沈静[1] 

机构地区:[1]漳州职业技术学院计算机工程系,福建漳州363000

出  处:《漳州职业技术学院学报》2016年第3期45-48,共4页Journal of Zhangzhou Institute of Technology

摘  要:中文分词是中文文本挖掘和信息处理的基础环节,而中文文本挖掘首先面临的是中文的分词问题。中文分词的方法主要有基于字符串匹配的分词方法、基于统计的分词方法和基于理解的分词方法三种,第一种分词方法简单、快捷,但对词典的完备性要求很高;第二种充分利用文本信息,但完备性较差;第三种还处于理论研究阶段。本文对现有的三种中文分词方法进行了研究和对比。Chinese word segmentation is the foundation of Chinese text mining and information processing, and also the first problem faced in text mining. Chinese word segmentation methods mainly include word segmentation method based on string matching, word segmentation method based on statistics and word segmentation method based on the understanding, the first word segmentation method is simple, fast, but the dictionary completeness asked too much; The second make full use of text information, but poorer completeness; The third is still in the theoretical research stage. In this paper, the existing three methods were studied and compared in detail.

关 键 词:中文分词 文本挖掘 歧义切分 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象