多文种多向电子词典软件系统关键技术研究  被引量:1

RESEARCH ON KEY TECHNIQUES IN MULTI-LINGUAL MULTI-DIRECTIONAL E-DICTIONARY SYSTEM

在线阅读下载全文

作  者:买日旦.吾守尔 维尼拉.木沙江 

机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046

出  处:《计算机应用与软件》2011年第4期170-173,共4页Computer Applications and Software

基  金:新疆维吾尔自治区高校科研计划重点资助(XJEDU2006113);新疆维吾尔自治区高校青年教师科研启动基金(XJEDU2008S14);新疆大学青年教师科学研究基金(QN070123)

摘  要:以汉、维、哈、柯等具有多种书写方向的多文种电子词典软件系统开发为背景,首先指出了其中与语种相关的技术难点,提出相应的解决方案,即通过XML的标注属性和字母的UNICODE区域从属关系来判断词语的书写方向;其次计算组成词语的各个字母来自不同语言的概率来判断词语的文种;最后对开源索引工具Lucene进行修改将其成功应用到了电子词典中词库的索引中。应用结果表明该技术方案的可行性和有效性。In the background of designing Chinese,Uyghur,Kazak,Kirghiz Multi-lingual Multi-directional electronic dictionary system,in this paper we first point out the technical difficulties in it pertinent to the specific language,then we describe corresponding solutions: i.e.to determine the writing directions of words by analysing XML's annotation attributes and Unicode region's affiliation relation of the letter;to detect the language the words belong to by calculating the appearance-probability of the letters composing the word in different languages;and to modify the open source indexing tool Lucene and to successfully apply it to the indices of vocabulary base of e-dictionary.Application results have proven the feasibility and validity of these solutions.

关 键 词:电子词典 多语种 自动判别 LUCENE XML 

分 类 号:TP311.52[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象