检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘小虎[1] 吴葳[1] 李生[1] 赵铁军[1] 蔡萌[1] 鞠英杰[2]
机构地区:[1]哈尔滨工业大学计算机科学与工程系 [2]黑龙江大学信息管理系
出 处:《情报学报》1997年第1期21-27,共7页Journal of the China Society for Scientific and Technical Information
摘 要:语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有效的对齐算法。首先利用词典的词的译文及其同义词在目标语中寻找对齐;其次利用汉语词汇与英语单词的共现统计信息以最大的互信息寻找对齐词汇以及相邻短语。Aligning the bilingual corpus at word level is very important to take the advantages of corpus.This paper presents an efficient aligning algorithm for a corpus aligned at sentence level,using the lexical information and statistic information. First,the information of dictionary and thesaurus is used.Second,the mutual information between Chinese words(or adjacent phrases)and English words(of adjacent phrases)is used.Our experiments has proved this method to be effective.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117