基于中文文本分类的分词方法研究  被引量:22

Word Segmentation Method Research Based on Chinese Text Classification

在线阅读下载全文

作  者:湛燕[1] 陈昊[1] 袁方[1] 王熙照[1] 

机构地区:[1]河北大学数学与计算机科学学院,保定071002

出  处:《计算机工程与应用》2003年第23期87-88,91,共3页Computer Engineering and Applications

基  金:河北省自然科学基金(编号:698139);河北省教育厅科研计划项目(编号:2001206)

摘  要:文本分类有助于用户有选择地阅读和处理海量文本,因此其预备工作分词系统的研究是很有意义的。该文主要提出了一种基于中文文本分类的分词方法,区别于常用的基于字符串匹配等方法,并利用数据库特有的查询技术设计和实现了该分词系统,旨在通过新的分词方法提供更加准确的分词率,同时提高系统实现效率。Text classification is helpful for user to read and handle vast amounts of texts selectively,whose preliminary work-the research of word segmentation is significative.In order to offer a new method for exacter partition rate and improve system implementation efficiency,this paper mainly puts forward a word segmentation method based on Chinese text classification,which is different from regular methods such as based on character string matching,also designs and implements this word segmentation system using special querying technology in database.

关 键 词:文本分类 分词 查询 数据库 主题词 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术] TP311[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象