艾山吾买尔

作品数:45被引量:210H指数:9
导出分析报告
供职机构:新疆大学信息科学与工程学院更多>>
发文主题:维吾尔语维吾尔文机器翻译条件随机场词干提取更多>>
发文领域:自动化与计算机技术电子电信自然科学总论文化科学更多>>
发文期刊:《中文信息学报》《计算机工程与设计》《微型电脑应用》《计算机工程与应用》更多>>
所获基金:国家自然科学基金国家重点基础研究发展计划国家社会科学基金博士科研启动基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
维吾尔语词向量的评测研究被引量:3
《厦门大学学报(自然科学版)》2019年第2期209-216,共8页吴浩 艾山.吾买尔 王路路 卡哈尔江.阿比的热西提 吐尔根.依布拉音 
国家重点研发计划(2017YFB1002103);国家自然科学基金(61331011;61662077;61462083)
目前探究维吾尔语词向量表示的相关研究报道很少,在对其性能评价、实际使用等方面存在一些问题亟待解决.基于此,构建了维吾尔语版wordsim240和word analogy词向量评测数据集;提出了新的单词语义相似度评测方法,并以命名实体识别任务作...
关键词:词向量 维吾尔语 评测任务 
基于深度神经网络的维吾尔文命名实体识别研究被引量:11
《中文信息学报》2019年第3期64-70,共7页王路路 艾山.吾买尔 吐尔根.依布拉音 买合木提.买买提 卡哈尔江.阿比的热西提 
国家973计划(2014CB340506);国家自然科学基金(61462083;61262060;61662077;61331011);新疆多语种信息技术实验室开放课题(2016D03023)
现有的维吾尔文命名实体识别主要采用基于条件随机场的统计学习方法,但依赖于人工提取的特征工程和领域知识。针对该问题,该文提出了一种基于深度神经网络的学习方法,并引入不同的特征向量表示。首先利用大规模未标注语料训练的词向量...
关键词:维吾尔文命名实体识别 长短时记忆网络 条件随机场 注意力机制 
基于LDA的英汉维文本聚类系统的设计与实现被引量:2
《现代电子技术》2019年第3期122-126,共5页田亮 吐尔根.依布拉音 艾山.吾买尔 卡哈尔江.阿比的热西提 
国家重点基础研究发展计划(2014CB340506);国家自然科学基金(61331011);国家自然科学基金(61662077);国家自然科学基金(61262060);国家自然科学基金(61462083);新疆多语种信息技术实验室开放课题(2016D03023);"自治区青年科技创新人才培养工程"青年博士项目(QN2015BS004)~~
以英汉维三种大规模文本聚类为目标,针对三种语言的特点实现基于LDA模型的静态文本聚类系统。因为存在博客、微博等网络媒体的文本不太规范及涉及的话题范围广泛等现象,对文本特征的提取及聚类算法的选择带来一定的难度。通过对样本文...
关键词:文本聚类 LDA模型 多语言 文本特征提取 相似度聚类 权重 
基于条件随机场的维吾尔文机构名识别被引量:5
《计算机工程与设计》2019年第1期273-278,共6页买合木提.买买提 王路路 吐尔根.依布拉音 艾山.吾买尔 卡哈尔江.阿比的热西提 
国家自然科学基金项目(61462083;61262060;61331011;61463048);国家973重点基础研究发展计划基金项目(2014CB340506);"自治区青年科技创新人才培养工程"青年博士基金项目(QN2015BS004)
为缓解目前维吾尔文机构名识别方法依赖于人工编写规则、识别效率低的问题,提出一种基于条件随机场模型(CRF)的维吾尔文机构名识别方法。根据维吾尔语的语言特性,结合词、词性、音节、机构名特征词表、地名词表等特征,实现维吾尔文机构...
关键词:命名实体 机构名识别 维吾尔语 条件随机场 黏着语 
人物简历汉维机器翻译系统的设计与实现
《现代电子技术》2018年第24期101-105,共5页王路路 斯拉吉艾合麦提.如则麦麦提 艾山.吾买尔 吐尔根.依布拉音 买合木提.买买提 卡哈尔江.阿比的热西提 
国家"973"计划资助项目(2014CB340506);国家自然科学基金资助项目(61331011);国家自然科学基金资助项目(61262060);国家自然科学基金资助项目(61662077);国家自然科学基金资助项目(61462083);新疆多语种信息技术实验室开放课题(2016D03023);"自治区青年科技创新人才培养工程"青年博士项目(QN2015BS004)~~
为解决将汉语人物简历翻译成维吾尔语版本所面临的高成本、低效率等问题,设计并实现了一种基于模板与词典相结合的人物简历汉维机器翻译系统。通过分析汉语简历的句子结构特点,泛化命名实体并自动创建汉语的简历模板,然后利用正则表达...
关键词:人物简历 汉维机器翻译 模板库 命名实体 正则表达式 句子结构 
基于神经网络的维汉翻译系统实现被引量:6
《现代电子技术》2018年第24期157-161,共5页张胜刚 艾山.吾买尔 吐尔根.依布拉音 买合木提.买买提 米尔夏提.力提甫 
国家重点基础研究发展计划(2014CB340506);国家自然科学基金(61463048);国家自然科学基金(61331011);国家自然科学基金(61662077);国家自然科学基金(61462083);新疆多语种信息技术实验室开放课题(2016D03023);"自治区青年科技创新人才培养工程"青年博士项目(QN2015BS004)~~
小语种的机器翻译由于开发成本和用户规模等原因一般在开源系统的基础上实现在线服务系统。目前,神经机器翻译提供的源代码以theano编写的居多,但是theano编写的机器翻译因翻译速度较慢而无法满足用户需求。在此以如何实现基于theano的...
关键词:小语种 机器翻译 theano 神经网络 开源系统 负载均衡 
基于CRF和半监督学习的维吾尔文命名实体识别被引量:14
《中文信息学报》2018年第11期16-26,33,共12页王路路 艾山.吾买尔 买合木提.买买提 卡哈尔江.阿比的热西提 吐尔根.依布拉音 
国家973计划(2014CB340506);国家自然科学基金(61462083;61262060;61662077;61331011);新疆多语种信息技术实验室开放课题(2016D03023)
目前,维吾尔文命名实体识别研究主要集中在单类实体,且没有引入半监督学习方法,从而无法利用未标注语料的无监督语义和结构信息。该文以条件随机场为基本框架,提出了一种基于半监督学习的维吾尔文命名实体识别方法。通过引入词法特征、...
关键词:维吾尔文命名实体识别 条件随机场 半监督学习 
基于多编码器多解码器的大规模维汉神经网络机器翻译模型被引量:7
《中文信息学报》2018年第9期20-27,共8页张金超 艾山.吾买尔 买合木提.买买提 刘群 
国家自然科学基金(61331911;61262060);新疆多语种信息技术实验室开放课题(2016D03023);自治区青年科技创新人才培养工程青年博士项目(QN2015BS004)
为提升维汉机器翻译模型的翻译能力,该文提出使用多编码器多解码器的结构,搭建大规模的维汉神经网络机器翻译模型。相比于单编码器单解码器的浅层的小模型,多编码器多解码器模型具有多个编码器,可以对源语言进行多层次、多视角的压缩表...
关键词:维汉机器翻译 神经网络 多编码器多解码器 
基于堆栈降噪自编码的维吾尔语事件共指关系识别
《计算机工程》2018年第6期305-310,共6页王淑媛 田生伟 禹龙 冯冠军 艾山.吾买尔 李圃 赵建国 
国家自然科学基金(61662074;61563051;61262064);国家自然科学基金重点项目(61331011);新疆自治区科技人才培养项目(QN2016YX0051)
结合维吾尔语的语言特点,基于堆栈降噪自编码(SDAE),提出一种新的维吾尔语事件共指关系识别方法。将维吾尔语事件两两构成候选事件对,抽取事件基本属性、触发词、事件距离等9项特征,利用Word Embedding富含语义信息的特性,将其计算得到...
关键词:共指关系 维吾尔语 语义相似度 堆栈降噪自编码 深度学习 
中亚语言自然语言处理综述被引量:6
《中文信息学报》2018年第5期1-13,21,共14页吐尔根.依布拉音 卡哈尔江.阿比的热西提 艾山.吾买尔 买合木提.买买提 
国家自然科学基金(61462083;61762084;61331011;61463048);国家973计划(2014cb340506)
该文对中亚地区属于同一个语族的土耳其语、哈萨克语等诸语言的自然语言处理现状进行了综述。首先分别回顾土耳其语、哈萨克语和其他中亚语言在词法分析、句法分析、命名实体识别、机器翻译方面的研究进展,随后讨论了与具体语言无关的...
关键词:土耳其语 哈萨克语 黏着语 形态复杂语 
检索报告 对象比较 聚类工具 使用帮助 返回顶部