CSSCI语料中短语结构标注与自动识别  被引量:2

Chinese Phrase Tagging and Automated Annotation Based on CSSCI Corpus

在线阅读下载全文

作  者:谢靖[1] 苏新宁[2] 沈思[2] 

机构地区:[1]南京中医药大学经贸管理学院,南京210046 [2]南京大学信息管理学院,南京210093

出  处:《现代图书情报技术》2012年第12期32-38,共7页New Technology of Library and Information Service

基  金:国家自然科学基金面上项目"面向知识服务的知识组织模式与应用研究"(项目编号:71273126);高技术研究发展计划(863计划)项目"以科技文献服务为主的搜索引擎研制"(项目编号:2011AA01A206);江苏省教育厅高校哲学社会科学研究基金项目"基于本体的高校突发事件网络舆情监控预警模式研究"(项目编号:2010SJB870003)的研究成果之一

摘  要:将短语结构标注引入CSSCI期刊论文题录信息分析,在关键词、术语构成上从语法角度深度探讨各组成词汇之间的语法关系,力图通过语法功能分析揭示其所蕴含的语义知识。在进行一定规模语料标注基础上,通过短语词汇、词性统计及短语语法功能分析获取学术文献中短语结构构成特征,并将这部分特征与清华树库语料短语特征混合,提高短语结构在科技文献中的识别率。The paper introduces a new syntax method as the solution of term phrase identification on CSSCI corpus, and obtains the inter - relationship among terms in academic literature from the linguistic aspect based on phrase components, such as words, part - of - speech, grammar functions, etc. These linguistic features are mixed with phrase features which are extracted from Tsinghua Treebank so as to leverage the accuracy of phrase auto - identification in academic corpus.

关 键 词:短语结构标记 CSSCI语料 混合特征 自动识别 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象