基于词典的藏汉跨语言检索系统研究  被引量:1

Dictionary-based Cross Language Retrieval System of Tibetan and Chinese

在线阅读下载全文

作  者:李亚超[1] 江涛[1] 于洪志[1] 加羊吉[1] 

机构地区:[1]西北民族大学中国民族语言文字信息技术重点实验室,甘肃兰州730030

出  处:《西北民族大学学报(自然科学版)》2011年第4期40-43,52,共5页Journal of Northwest Minzu University(Natural Science)

基  金:国家自然基金重点项目(61032008);模式识别重点实验室开发课题(201001051);西北民族大学中央高校基本科研业务费专项资金资助研究生项目(ycx11135);西北民族大学中央高校基本科研业务费(zyz2011101)

摘  要:针对跨语言检索中查询翻译歧义问题,文章从藏汉跨语言检索的特点出发,采用了平衡翻译(BalancedTranslation)方法,减少了歧义翻译数量,提高了翻译的准确度.在文档索引上,为了弥补藏文分词对于命名实体识别的不足,采用了4元组的索引方法,明显提高了检索的速度和准确度.For the query translation ambiguity problem of cross-language retrieval,this article used balanced translation method(Balanced Translation) to reduce the number of translation ambiguity and improved translation accuracy through the features of Tibetan cross-language retrieval.For the document index,it adapted 4-tuple index method in order to compensate the lack of named entity recognition for Tibetan word segmentation,significantly improved the speed and accuracy of retrieval.

关 键 词:跨语言检索 藏文分词 查询翻译 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象