检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京中医药大学经贸管理学院,南京210046 [2]南京大学信息管理学院,南京210093
出 处:《现代图书情报技术》2012年第12期32-38,共7页New Technology of Library and Information Service
基 金:国家自然科学基金面上项目"面向知识服务的知识组织模式与应用研究"(项目编号:71273126);高技术研究发展计划(863计划)项目"以科技文献服务为主的搜索引擎研制"(项目编号:2011AA01A206);江苏省教育厅高校哲学社会科学研究基金项目"基于本体的高校突发事件网络舆情监控预警模式研究"(项目编号:2010SJB870003)的研究成果之一
摘 要:将短语结构标注引入CSSCI期刊论文题录信息分析,在关键词、术语构成上从语法角度深度探讨各组成词汇之间的语法关系,力图通过语法功能分析揭示其所蕴含的语义知识。在进行一定规模语料标注基础上,通过短语词汇、词性统计及短语语法功能分析获取学术文献中短语结构构成特征,并将这部分特征与清华树库语料短语特征混合,提高短语结构在科技文献中的识别率。The paper introduces a new syntax method as the solution of term phrase identification on CSSCI corpus, and obtains the inter - relationship among terms in academic literature from the linguistic aspect based on phrase components, such as words, part - of - speech, grammar functions, etc. These linguistic features are mixed with phrase features which are extracted from Tsinghua Treebank so as to leverage the accuracy of phrase auto - identification in academic corpus.
关 键 词:短语结构标记 CSSCI语料 混合特征 自动识别
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117