检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046
出 处:《计算机应用与软件》2011年第4期170-173,共4页Computer Applications and Software
基 金:新疆维吾尔自治区高校科研计划重点资助(XJEDU2006113);新疆维吾尔自治区高校青年教师科研启动基金(XJEDU2008S14);新疆大学青年教师科学研究基金(QN070123)
摘 要:以汉、维、哈、柯等具有多种书写方向的多文种电子词典软件系统开发为背景,首先指出了其中与语种相关的技术难点,提出相应的解决方案,即通过XML的标注属性和字母的UNICODE区域从属关系来判断词语的书写方向;其次计算组成词语的各个字母来自不同语言的概率来判断词语的文种;最后对开源索引工具Lucene进行修改将其成功应用到了电子词典中词库的索引中。应用结果表明该技术方案的可行性和有效性。In the background of designing Chinese,Uyghur,Kazak,Kirghiz Multi-lingual Multi-directional electronic dictionary system,in this paper we first point out the technical difficulties in it pertinent to the specific language,then we describe corresponding solutions: i.e.to determine the writing directions of words by analysing XML's annotation attributes and Unicode region's affiliation relation of the letter;to detect the language the words belong to by calculating the appearance-probability of the letters composing the word in different languages;and to modify the open source indexing tool Lucene and to successfully apply it to the indices of vocabulary base of e-dictionary.Application results have proven the feasibility and validity of these solutions.
关 键 词:电子词典 多语种 自动判别 LUCENE XML
分 类 号:TP311.52[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15