检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京大学信息管理系,江苏南京210093 [2]上海宝山钢铁股份有限公司,上海201900 [3]南京政治学院基础部,江苏南京210003
出 处:《情报科学》2013年第2期144-149,共6页Information Science
摘 要:首先利用ICTCLAS分词系统和停用词表抽取文档词元,通过改进的TFIDF模型计算词元权重并筛选出热点词元,再通过词间距测算对热点词元按顺序进行组配,经权重计算和阈值筛选后得到术语集,由专家人工判定识别出有效的新技术术语。最后给出了应用实例并进行分析,验证了方法的有效性。Firstly,the element of terms in patents are extracting by ICTCLAS segmentation system and stop words lists.Then the Hot elements of terms are filtered based on terms weights computing by improving TFIDF model.Secondly,the hot elements of terms are combined orderly by computing the distance between two words,and obtain the terms collection by terms weights computing and threshold filtering.The valid new technology terms are detected by the experts artificially.Finally the availability of the method is proved through the analysis of the applied example.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222