甘肃省自然科学基金(1107RJZA157)

作品数:6被引量:16H指数:2
导出分析报告
相关作者:曹晖董晓芳于洪志孟祥和加羊吉更多>>
相关机构:西北民族大学河海大学更多>>
相关期刊:《西北民族大学学报(自然科学版)》《科技风》《云南大学学报(自然科学版)》《中文信息学报》更多>>
相关主题:藏文候选规则相句子断句方法更多>>
相关领域:自动化与计算机技术理学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-6
视图:
排序:
藏文Web网络环境下的搜索策略研究
《中文信息学报》2015年第1期183-190,共8页陈新一 夏建华 杜玉祥 万福成 于洪志 
国家科技支撑计划(2009BAH41B04);甘肃省自然科学基金(1107RJZA157);中央高校基本科研业务费专项资金(2014B33014)
该文分析了藏文Web网络的度分布和最大度优先搜索算法存在的问题,提出了搜索效率更高的二分度搜索算法和双遍历器的二分度与最大度同步搜索算法。根据社区划分原理,设计和构建了藏文Web社区环境下的搜索算法,实验结果表明,其平均搜索步...
关键词:藏文Web网络 度分布 最大度链路 双遍历器 社区划分 
基于藏文新闻文本话题检测的聚类算法研究被引量:2
《华中师范大学学报(自然科学版)》2014年第1期37-41,共5页曹晖 孟祥和 
甘肃省自然科学基金项目(1107RJZA157)
话题检测的提出是为了帮助人们从海量的新闻报道中发现未知的新话题,其中文本聚类算法的研究,是实现藏文新闻文本的话题检测技术的核心.本文提出一种聚类算法,是基于简易聚类算法的改进,首先改进了文本顺序对聚类结果产生的影响,其次通...
关键词:聚类算法 种子话题 藏文新闻文本 话题检测 
统计与规则相结合的藏文句子自动断句方法被引量:7
《云南大学学报(自然科学版)》2012年第6期653-657,663,共6页徐涛 加羊吉 于洪志 
国家自然科学基金资助项目(61032008;60970071);甘肃省自然科学基金资助项目(1107RJZA157)
藏文句子断句是藏文信息处理领域的难点之一,也是藏汉机器翻译、藏文文本分类等工作的一项重要基础性研究.提出了一种统计与规则相结合的藏文句子自动断句方法以解决藏文标点符号功能的歧义问题,实验结果表明该方法具有比较好的效果,F1...
关键词:藏文句子自动断句 复句分析 二次候选句子 最大熵 
藏文报纸词语统计研究被引量:1
《西北民族大学学报(自然科学版)》2012年第3期50-54,共5页曹晖 董晓芳 孟祥和 
国家科技支撑项目(2009BAH41B04);国家语委"十二五"科研2011年度一般项目(YB125-2);中国民族语言文字信息技术重点实验室开放课题(2010KF006);甘肃省自然基金项目(1107RJZA157)
当前,我国的社会语言生活空前活跃,全面准确地把握语言生活的动态显得十分必要而紧迫.藏族的语言生活是我国社会语言生活的一部分,对于藏语语言生活的调查研究也显得十分重要.通过对平面媒体2010年度四种藏文报纸语料的词语进行分析研究...
关键词:词种 高频词 独用 共用 覆盖率 新词 
中学藏语文教材词汇计量统计分析
《科技风》2012年第20期187-189,共3页曹晖 韩小斌 董晓芳 
国家科技支撑项目(2009BAH41B04)资助;甘肃省自然科学基金项目(1107RJZA157)资助;西北民族大学中青年科研基金项目(XBMU-2010-BD-7)资助
文章对五省(区)藏语文编写委员会编著的初中和高中藏语文教材词汇进行计量统计,包括分体裁用词统计及课文正文用词统计两部分,统计项目包括分体裁词条统计、分册词条、词总、独用词统计、分频段统计等,并对统计数据进行分析说明,为客观...
关键词:中学 藏语文教材 词汇 计量统计 
基于短语的藏汉统计机器翻译系统被引量:6
《科技风》2012年第17期60-61,共2页董晓芳 曹晖 江涛 
国家自然基金重点项目多民族文字识别及理解的理论与方法研究(61032008)模式识别重点实验室开发课题(201001051);西北民族大学中央高校基本科研业务费(zyz2011101);国家科技支撑项目(2009BAH41B04);甘肃省自然基金项目(1107RJZA157);国家语委"十二五"科研2011年度一般项目(YB125-2)资助
本文针对藏文词法及句法的特点,借助开源统计机器翻译平台,搭建起基于短语的藏汉统计机器翻译系统,重点描述了系统中的藏文编码转换和藏文自动分词的实现方法。最后采用500句新闻领域藏文语料对翻译系统进行测试,取得了Bleu值为0.3425...
关键词:藏汉 统计机器翻译 编码转换 自动分词 
检索报告 对象比较 聚类工具 使用帮助 返回顶部