检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:宋鸿彦[1] 刘军[1] 姚天昉[1] 刘全升[1] 黄高辉[1]
机构地区:[1]上海交通大学计算机科学与工程系,上海200240
出 处:《中文信息学报》2009年第2期123-128,共6页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(60773087)
摘 要:汉语意见型主观性文本是目前自然语言处理中的一个研究热点。该文介绍了汉语意见型主观性文本标注语料库构建方面的一些经验,讨论了设计和建设语料库方面的几个重要问题,包括语料的选取、标注、存储、检索和统计,以及语料库相关工具的设计等。汉语意见型主观性文本标注语料库与普通的语料库相比,其特点在于深度标注了主观性文本的词性、句法、语义和意见元素等信息,忠实记录了主观性文本的语言现象。汉语意见型主观性文本标注语料库的构建为人们分析和研究汉语主观性文本提供了有力的资源支持。Chinese opinioned-subjective text is a hotspot in the field of natural language processing. This paper introduces the construction of the annotated corpus for Chinese opinioned-subjective texts and discusses some important issues including corpus selection, annotation, storage, retrieval, statistics, as well as the design of corpus tools. Comparing to ordinary corpus, the annotated corpus for Chinese opinioned-subjective texts includes deep level information related to POS, syntax, semantics, opinioned elements, etc, and records the linguistic phenomenon of Chinese opinioned-subjective text faithfully. The construction of the annotated corpus for Chinese opinioned-subjective texts will provide a support to the resource for research and analysis of Chinese subjective text.
关 键 词:计算机应用 中文信息处理 主观性文本 汉语意见型主观性文本 语料库
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222