“是”字句主语和宾语的自动界定  被引量:1

Automatic Bracketing of the Subject and Object of "是"Sentence

在线阅读下载全文

作  者:吴云芳[1] 段慧明[2] 俞士汶[2] 

机构地区:[1]北京大学中文系 [2]北京大学计算语言学研究所,北京100871

出  处:《中文信息学报》2002年第2期40-46,共7页Journal of Chinese Information Processing

基  金:国家自然科学基金项目 (6 99730 0 5 );国家 973项目(G19980 30 5 0 7- 4 );北大985项目支持

摘  要:“是”字句是现代汉语中比较特殊的、又是比较常见的一种句子形式 ,对其主语部分和宾语部分的自动界定和标注将有助于机器翻译、信息检索、信息提取等的研究。本文通过考察语料中“是”字句的句法表现 ,总结、提取了“是”字句的自动标注规则 ,对《人民日报》一个月语料中的“是”字句进行了自动标注。实验结果表明 ,对没有逗号的句子 ,标注正确率可达到 99%以上 ;对有逗号的句子 ,标注正确率为 89%。是' sentence is a special and often used sentence in mandarin Chinese.This paper examines '是' sentences in the corpus,and presents some rules for automatic bracketing the subject and object of them.The result is agreeable:the precision is over 99% in the sentences containing no comma and 89% in the sentences containing comma.

关 键 词:“是” 字句 自动标注 浅层分析 现代汉语 主语 宾语 自动界定 自然语言处理 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] H146.3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象