国家自然科学基金(60663006)

作品数:18被引量:70H指数:5
导出分析报告
相关作者:吐尔根·依布拉音艾山吾买尔禹龙田生伟艾山·吾买尔更多>>
相关机构:新疆大学伊犁师范学院中国科学院上海交通大学更多>>
相关期刊:《计算机应用与软件》《小型微型计算机系统》《民族语文》《电脑知识与技术》更多>>
相关主题:维吾尔语汉文句子对齐双语语料库词干提取更多>>
相关领域:自动化与计算机技术自然科学总论语言文字更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于词干的混合策略维吾尔语文本聚类特征选择方法研究被引量:2
《计算机应用与软件》2012年第12期30-32,50,共4页刘源 吐尔根.依布拉音 阿力木江.艾沙 张亚军 
国家自然科学基金项目(60663006);国家社会科学基金项目(10AYY006);新疆维吾尔自治区高校科研计划青年教师科研基金项目(XJEDU2011S42);昌吉学院科研基金项目(2011SSQD029)
维吾尔语文本聚类中特征选择对聚类的效率和效果都有直接影响。根据维吾尔语构词法规律,在原有基于文档频率特征选择算法基础上,提出新的维吾尔语文本聚类的特征提取算法。新方法将词干作为文本的特征项,在原算法上融合了基于特征贡献...
关键词:文本聚类 维吾尔语 特征选择 
一种提高维吾尔语-汉语词语对齐的方法研究被引量:9
《小型微型计算机系统》2012年第11期2551-2555,共5页麦热哈巴·艾力 王志洋 吐尔根·依布拉音 
国家自然科学基金项目(60663006)资助;国家自然科学基金重点项目(61032008)资助;国家工信部电子发展基金项目(工信部财(2009)453)资助
维吾尔语是典型的粘着性语言,其复杂的形态以及众多的词缀影响维吾尔语-汉语词语对齐的质量.本文提出对维吾尔语词进行形态分析并词干与词缀分离,再进行对齐;并根据维吾尔语遵循语音和谐规律的特点,对维吾尔语词缀的变体采用统一的表示...
关键词:词对齐 维吾尔语 形态分析 GIZA++ 
一种改进的维吾尔语句子相似度计算方法被引量:8
《中文信息学报》2011年第4期50-53,共4页卡哈尔江.阿比的热西提 吐尔根.依布拉音 姚天昉 艾山.吾买尔 艾山.毛力尼亚孜 
国家社会科学基金重点资助项目(10AYY006);国家自然科学基金资助项目(60663006);国家工信部电子发展基金资助项目(工信部财(2009)453)
在基于实例的维吾尔语汉语机器翻译系统中维吾尔语相似度计算起重要作用。维吾尔语的黏着性特性要求对单词进行词干提取。本文提出的方法结合简单的句子结构相似度计算方法,通过对单词词干提取进行句子相似度计算。小规模实验结果比较...
关键词:维吾尔语句子相似度计算 EBMT 句子结构相似度 
基于统计机器翻译的汉维词对齐研究被引量:4
《计算机应用与软件》2011年第4期57-59,90,共4页刘建明 吐尔根.依不拉音 艾山.吾买尔 
国家自然科学基金(60663006);国家语委科研项目(MZ115-75)
描述了一个基于统计机器翻译的汉维词对齐系统。系统处理过程分为两个模块:预处理和词对齐。预处理过程包括汉文文本预处理和维吾尔文文本预处理,其中维吾尔文文本预处理过程为:首先将维吾尔文转换成拉丁维文,然后将拉丁维文中个别字符...
关键词:词对齐 IBM Model1-3 启发式优化 
维吾尔语动词的体及其时间指向功能被引量:2
《民族语文》2010年第4期20-26,共7页阿不都热依木.热合曼 
新疆大学计算机科学与技术博士后研究项目(74150);新疆大学博士毕业生科研启动基金项目(200972);国家自然科学基金项目(60663006)
本文探讨维吾尔语动词体标记的时间指向功能,"时"和"体"的关系、句法分布以及功能上的差异等。
关键词:维吾尔语 功能 指向 时间 动词 句法分布 体标记 “体” 
基于最大熵的维吾尔语句子边界识别模型被引量:7
《计算机工程》2010年第6期24-26,38,共4页艾山.吾买尔 吐尔根.依步拉音 
国家自然科学基金资助项目(60663006);新疆维吾尔自治区高技术计划基金资助项目(200712109);新疆维吾尔自治区高校科研计划基金资助重点项目(XJEDU2008I08)
采用最大熵模型实现维吾尔语句子边界识别,该模型的训练过程不需要提供手工收集规则、词性标注及形态分析,仅使用较容易获取的单词长度和音节等特征。为确定最佳特征模板,在特征空间上组合出不同特征模板进行测试。实验结果表明,最佳特...
关键词:维吾尔语 句子边界识别 特征选择 最大熵 
汉文-维吾尔文双语语料库中段落对齐技术研究被引量:6
《新疆大学学报(自然科学版)》2010年第1期102-105,共4页热西旦.塔依 吐尔根.依布拉音 
国家自然科学基金(编号:60663006);新疆维吾尔自治区高新技术计划项目(200712109)
随着信息技术的普及与推广,双语电子文本资源呈指数形式增长,这给构建大规模双语语料库提供了可能.双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视.针对目前可收集到的双语资源大都没有做到段落对齐,本文提出了基于...
关键词:汉文-维吾尔文双语语料库 段落对齐 多层次分段对齐 
基于自顶向下算法的维吾尔语句法分析初探被引量:3
《电脑知识与技术》2010年第02Z期1182-1183,1185,共3页阿布都克力木·阿不力孜 哈里旦木·阿布都克里木 吐尔根·依布拉音 帕里旦·吐尔逊 艾山·吾买尔 
国家自然科学基金(60663006);新疆维吾尔自治区高新技术研究与发展计划项目(200712109);新疆大学校院联合资助项目(XY080124)
该文通过研究国内外相关的句法分析算法与理论,再结合维吾尔语自身的特点对基于规则的维吾尔语句法分析方法进行讨论,由于维吾尔语作为一种自然语言,具有自然语言所共有的一些规则,发现国外经典的句法分析方法同样适合于维吾尔语的...
关键词:维吾尔 句法分析 自顶向下 
汉文-维吾尔文双语语料库中基于词典译文的句子对齐方法研究被引量:4
《新疆大学学报(自然科学版)》2009年第3期359-363,共5页热西旦.塔依 吐尔根.依布拉音 
国家自然科学基金资助(编号:60663006);新疆维吾尔自治区高新技术计划项目(200712109)
双语语料库的自动对齐已成为机器翻译研究中一个十分重要的研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,本文根据汉文-维吾尔文的特点,在分析目前双语句子对齐方法的基础上,提出了基于译文的对齐方法,通过使用一部翻...
关键词:汉文 维吾尔文 机器翻译 句子对齐 双语语料库 
基于规则的维吾尔语对偶词识别算法研究被引量:2
《新疆大学学报(自然科学版)》2009年第2期221-226,共6页扎依达.木沙 吐尔根.依布拉音 
国家自然科学基金项目(60663006);新疆维吾尔自治区高新技术研究与发展计划项目(200712109)
维吾尔语对偶词的自动识别是维吾尔语自然语言处理中的一项基础性工作.维吾尔语对偶词的自动识别是维吾尔语自动分词的难点之一,也是一个重点.在维吾尔语中,内部成分平等连接而形成的词汇单位叫做对偶词.本文首先介绍了对偶词的基本概...
关键词:维吾尔语 对偶词 规则 识别 
检索报告 对象比较 聚类工具 使用帮助 返回顶部