检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:诺明花[1] 刘汇丹[1] 马龙龙[1] 吴健[1] 丁治明[1]
机构地区:[1]中国科学院软件研究所
出 处:《中文信息学报》2013年第4期63-69,共7页Journal of Chinese Information Processing
基 金:国家重大科技专项资助项目(2010ZX01036-001-002;2010ZX01037-001-002);国家自然科学基金资助项目(61202219;61202220)
摘 要:该文提出汉藏基本名词短语对齐框架。从汉语基本名词短语出发,找藏文正确译文过程中,参考英汉短语对齐的方法,针对藏语的特殊性,提出基于中心语块扩展的藏语基本名词短语识别方法。提出词典与自动词对齐结果相结合的方法和基于序列相交的方法抽取藏语中心语块,再以扩展可信度为依据扩展中心语块。实验结果表明,基于序列相交的方法所抽取的汉藏基本名词短语对能够节省人工校正的工作量,有效辅助于汉藏基本名词短语库的建设。This paper presents a Chinese-Tibetan base noun phrase alignment method. It's a two-phase procedure: Chinese base noun phrases identification and finding their Tibetan correspondences. We propose head-phrase exten- sion based Tibetan base noun phrase identification method in accordance with the morphologic characteristics of Ti- betan. In the first phase, we use sequence intersection operation to get Tibetan head-phrase. In the second phase, head-phrase extension confidence is defined and applied to determine the boundary of correspondence. Experimental result indicates that sequence intersection outperforms other methods in head-phrase extension. Chinese-Tibetan base noun phrase produced by our method is effective in reducing subsequent manual check, facilitating the construc- tion of translation lexicon on phrase level.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13