中文科技论文文本分类方法研究  

Text Classification Method Research of the Chinese Technology Text

在线阅读下载全文

作  者:陈频[1] CHEN Pin (Management Science Department, Xiamen University of Technology, Xiamen 361024, China)

机构地区:[1]厦门理工学院管理科学系,福建厦门361024

出  处:《电脑知识与技术》2009年第9期7189-7191,共3页Computer Knowledge and Technology

摘  要:随着人们对科学技术和社会发展的日益重视,学术领域呈现多元化、信息化、现代化的趋势。在这种情况下,研究者们比以往任何时候都迫切地需要高效、全面、方便的学术信息。因此中文科技论文文本分类研究已经成为信息领域中的一个热门话题。该文针对中文科技论文文本特殊的文体格式和语言风格进行了系统地研究,并提出了基于层次分类模型的文本分类算法。实验表明,随着分类类别粒度的细化.采用新的分类算法的分类器在精确率和召回率方面优势逐渐突出。相对于KNN、NB和SVM分类器更适合于中文科技论文文本的分类要求。With increasingly recognition of technology and society development, science domain is oriented to pluralistic and modem trend. In this case, the researcher need the high-effect, complete and convenient science information more urgently than ever. So,Chinese technology text classification research has bicome a hot theme in the information domain.This paper carries through research by the numhers in allusion to special style format and language color of the Chinese technology text. And put forward classification arithmetic based on bed-classification model.The experiment makes clear that this new classification arithnetic is gradually better than KNN,SB and SVM when the sorts gradually fine.

关 键 词:复杂特征结构 权重 层次分类模型 分类算法 

分 类 号:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象