基于中文专利的新技术术语识别研究  被引量:6

Study of New Technology Detection Based on Chinese Patents

在线阅读下载全文

作  者:谷俊[1,2] 严明[3] 

机构地区:[1]南京大学信息管理系,江苏南京210093 [2]上海宝山钢铁股份有限公司,上海201900 [3]南京政治学院基础部,江苏南京210003

出  处:《情报科学》2013年第2期144-149,共6页Information Science

摘  要:首先利用ICTCLAS分词系统和停用词表抽取文档词元,通过改进的TFIDF模型计算词元权重并筛选出热点词元,再通过词间距测算对热点词元按顺序进行组配,经权重计算和阈值筛选后得到术语集,由专家人工判定识别出有效的新技术术语。最后给出了应用实例并进行分析,验证了方法的有效性。Firstly,the element of terms in patents are extracting by ICTCLAS segmentation system and stop words lists.Then the Hot elements of terms are filtered based on terms weights computing by improving TFIDF model.Secondly,the hot elements of terms are combined orderly by computing the distance between two words,and obtain the terms collection by terms weights computing and threshold filtering.The valid new technology terms are detected by the experts artificially.Finally the availability of the method is proved through the analysis of the applied example.

关 键 词:技术生命周期 术语识别 热点词元 

分 类 号:G306[文化科学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象