现代汉语“V+N”序列关系的平行处理  被引量:1

Parallel processing of contemporary Chinese "V+N" sequence relations

在线阅读下载全文

作  者:冯敏萱[1] 

机构地区:[1]南京师范大学文学院,南京210097

出  处:《计算机工程与应用》2010年第30期8-10,共3页Computer Engineering and Applications

基  金:国家社会科学基金项目(No.07BYY050);国家社会科学青年基金项目(No.10CYY021);江苏省哲学社会科学基金一般项目(No.10YYB007);南京师范大学"211工程"三期重点学科建设项目;南京师范大学特聘教授;高层次人才科研启动基金项目(No.184070H2A96)

摘  要:目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源。以现代汉语v+n序列的结构关系为研究对象,设计出在英汉平行语料中识别v+n结构关系的平行处理算法:首先利用各种单语资源,提取出构成不同结构关系的动词和名词相互间的制约规则,再分别依据v+n中汉语名词、动词的语义在英语译文中的具体形式及上下文模板来判断v+n的结构关系类型。实验证明,在自动分词和词性标注的PCCE1000文本中,v+n单语处理的F值为72.14%,而进一步利用汉英词典和英语译文信息,F值到达了88.81%,提高了16.67个百分点。At present,the Chinese text processing in English-Chinese parallel corpus,more confined to only use monolingual analysis results,without sufficient use bilingual resources.Structural relation of contemporary Chinese v+n sequence is regarded as the research object,and the parallel processing algorithm is designed for recognizing v+n structural relation in English-Chinese parallel corpus.At first,this paper utilizes various form single language resources to extract the restriction rules of verb and noun that having different structural relations.And then judges v+n structural relation type separately according to translation of Chinese noun and verb,and context template in parallel English text.The experiment proves,in PCCE1000 which having been word-segmented and POS-tagged,F value that using single language resources to process v+n is 72.14%,and further utilizing the Chinese-English dictionary and English translation information,F value has reached 88.81%,having improved by 16.67 percentage points.

关 键 词:平行语料 词语搭配 短语分析 自动识别 中文信息处理 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象