检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京大学中文系 [2]北京大学计算语言学研究所,北京100871
出 处:《中文信息学报》2002年第2期40-46,共7页Journal of Chinese Information Processing
基 金:国家自然科学基金项目 (6 99730 0 5 );国家 973项目(G19980 30 5 0 7- 4 );北大985项目支持
摘 要:“是”字句是现代汉语中比较特殊的、又是比较常见的一种句子形式 ,对其主语部分和宾语部分的自动界定和标注将有助于机器翻译、信息检索、信息提取等的研究。本文通过考察语料中“是”字句的句法表现 ,总结、提取了“是”字句的自动标注规则 ,对《人民日报》一个月语料中的“是”字句进行了自动标注。实验结果表明 ,对没有逗号的句子 ,标注正确率可达到 99%以上 ;对有逗号的句子 ,标注正确率为 89%。是' sentence is a special and often used sentence in mandarin Chinese.This paper examines '是' sentences in the corpus,and presents some rules for automatic bracketing the subject and object of them.The result is agreeable:the precision is over 99% in the sentences containing no comma and 89% in the sentences containing comma.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.40