一种面向专利文献数据的文本自动分类方法  被引量:14

Automatic text categorization for patent data

在线阅读下载全文

作  者:蒋健安[1] 陆介平 倪巍伟[1] 孙志挥[1] 

机构地区:[1]东南大学计算机科学与工程学院,南京210096 [2]江苏省镇江市科技局,江苏镇江212001

出  处:《计算机应用》2008年第1期159-161,167,共4页journal of Computer Applications

基  金:江苏省自然科学基金资助项目(BK2006095);教育部高等学校博士学科点科研基金资助项目(20040286009)

摘  要:中文专利文献自动分类目前尚无成熟适用的方法。分析了文本自动分类的关键技术,并结合专利数据的特点对无词典分词和权重计算进行了改进,提出了一种适用于专利数据分类的层次分类方法,给出了面向专利文献数据的文本自动分类系统的框架模型。实验表明,该系统具有较好的分类精度与效率。At present, there are no practical and mature automatic text categorization methods for patent data. Therefore, this paper made a research on several key techniques about text categorization, improved the non-dictionary segment and weight calculation, and then proposed a hierarchical categorization method and an automatic text categorization framework for patent data. The experiment testifies that the system has a good classification accuracy and efficiency.

关 键 词:文本分类 专利文献 国际专利分类码 K-近邻 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象