检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李琼[1]
机构地区:[1]华中师范大学国际文化交流学院,湖北武汉430079
出 处:《皖西学院学报》2011年第1期108-110,共3页Journal of West Anhui University
基 金:教育部人文社会科学研究青年基金项目"汉语复句书读前后语言片段的非分句识别"(09YJC740032)
摘 要:为了建设一个面向中文信息处理的大规模复句"精加工"语料库,首先要完成自动分词和词性标注工作,在此基础上进行分句层次和关系的自动划分和标注。由于标点符号是最直观而明晰的断句标记,我们编制的初始程序让计算机一"碰到"标点符号就把它前后的语言片段都判定为分句。这就为今后基于句法和语义知识的非分句识别奠定了良好的基础。In order to build an "advanced" compound-sentence corpus for Chinese Information Process,automatic word segmentation and POS tagging work should be completed first of all.Then on this basis,automatic classification and labeling of levels and relationship between clauses should be conducted.As punctuation marks are the most intuitive and clear marks,we programmed the computer to regard the language fragments between punctuation as clauses.Doing so much is risking,because it will "victimize" a lot of non-clause language fragments which are subject to be identified through other means.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28