国家自然科学基金(61063025)

作品数:6被引量:10H指数:2
导出分析报告
相关作者:桑海岩陈莉牛宁宁孙瑞娜古丽拉·阿东别克更多>>
相关机构:新疆大学信息技术实验室新疆财经大学更多>>
相关期刊:《计算机工程》《计算机工程与应用》更多>>
相关主题:哈萨克语词性标注哈萨克文自然语言处理HMM更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-6
视图:
排序:
哈萨克语“v+n+n”格式的歧义消解
《计算机工程》2014年第12期141-145,共5页户冰心 古丽拉.阿东别克 祁卉 
国家自然科学基金资助项目(61063025)
通过研究大量包含歧义的短语实例,分析计算机处理过程中遇到的短语结构边界判定的歧义问题。针对"v+n+n"这种常见的歧义格式,采用条件随机场模型进行消歧。结合哈萨克语的语言特点,提出基于哈萨克语词尾的类别及位置信息来构建特征模板...
关键词:哈萨克语 自然语言处理 歧义 附加成分 条件随机场模型 模板 
基于排序集成的哈萨克语固定短语抽取
《计算机工程与应用》2014年第21期205-209,223,共6页桑海岩 古丽拉·阿东别克 孙瑞娜 陈莉 
国家自然科学基金(No.61063025);新疆多语种信息技术重点实验室开放项目(No.049807)
短语抽取是文本自动分类、主题提取及专利检索分析等文本信息理解等工作中都要应用到的一项关键技术。固定短语抽取作为短语研究的一部分,对短语标注、辞典编撰等自然语言处理任务都具有重要的现实意义。哈萨克语是黏着语,词形变化丰富...
关键词:自然语言处理 固定短语 排序集成 互信息 似然比 C-value算法 
哈萨克语阿拉伯文与斯拉夫文间的智能转换被引量:3
《计算机工程与应用》2014年第18期226-229,共4页萨合多拉.木巴拉克 古丽拉.阿东别克 
国家自然科学基金(No.61063025);新疆多语种信息技术重点实验室开放项目(No.049807)
由于历史原因,哈萨克语(下面简称哈语)在不同的地区形成了不同的文字形式,哈萨克斯坦哈萨克人用斯拉夫字母为基础的斯拉夫字母哈萨克文,而中国哈萨克人用的是阿拉伯字母为基础的阿拉伯字母哈萨克文。为了方便两国之间经济文化的交流,开...
关键词:阿拉伯字母哈萨克文 斯拉夫字母哈萨克文 智能转换 
基于HMM的柯尔克孜语词性标注的研究被引量:1
《计算机工程与应用》2014年第15期120-124,共5页陈莉 古丽拉.阿东别克 
国家自然科学基金(No.61063025)
柯尔克孜语的语言信息处理研究,对新疆柯尔克孜族是否能跨入信息时代,传承民族文化起着至关重要的作用。采用两级标注法,基于传统的HMM理论,改进了HMM模型参数的计算、数据平滑和未登入词的处理方法,更好地体现了上下文依赖关系。同时,...
关键词:柯尔克孜语 自动分词词典 隐马尔可夫模型(HMM) 词性标注 
基于HMM的联机手写哈萨克文字的识别研究被引量:2
《计算机工程与应用》2014年第1期145-148,共4页达吾勒.阿布都哈依尔 古丽拉.阿东别克 
国家自然科学基金(No.61063025);新疆多语种信息技术重点实验室开放课题(No.049807)
以基于隐马尔可夫模型和统计语言模型的研究作为基础,着重研究联机手写哈萨克文的切分技术、连体段分类和特征参数的独特提取技术。系统先将提取延迟笔划后的连体段主笔划作为HMM识别器的输入,再根据被识别的主笔划的编号和延迟笔划标...
关键词:哈萨克文 联机手写 隐马尔可夫模型 连体段 连体段分类 Hidden MARKOV Model(HMM) 
基于最大熵的哈萨克语词性标注模型被引量:4
《计算机工程与应用》2013年第11期126-129,165,共5页桑海岩 古丽拉.阿东别克 牛宁宁 
国家自然科学基金(No.61063025)
最大熵模型能够充分利用上下文,灵活取用多个特征。使用最大熵模型进行哈萨克语的词性标注,根据哈语的粘着性、形态丰富等特点设计特征模板,并加入了向后依赖词性的特征模板。对模型进行了改进,在解码中取概率最大的前n个词性分别加入...
关键词:自然语言处理 词性标注 最大熵模型 哈萨克语 
检索报告 对象比较 聚类工具 使用帮助 返回顶部