国家社会科学基金(05AYY001)

作品数:8被引量:59H指数:4
导出分析报告
相关作者:卢亚军贺胜才让加史晓东王正平更多>>
相关机构:西北民族大学南京师范大学青海师范大学厦门大学更多>>
相关期刊:《南京师范大学学报(工程技术版)》《西北民族大学学报(自然科学版)》《计算机工程与应用》《图书与情报》更多>>
相关主题:藏语语料库语料库藏文词类输入法更多>>
相关领域:自动化与计算机技术语言文字文化科学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-8
视图:
排序:
央金藏文分词系统被引量:30
《中文信息学报》2011年第4期54-56,共3页史晓东 卢亚军 
福建省自然科学基金资助项目(2006J0043);福建省重点科技项目(2006H0038);国家863资助项目(2006AA010108);国家社科基金重点项目(05AYY001)
藏文分词是藏文信息处理的一个基本步骤,该文描述了我们将一个基于HMM的汉语分词系统Segtag移植到藏文的过程,取得了91%的准确率。又在错误分析的基础上,进行了训练词性的取舍、人名识别等处理,进一步提高了准确率。
关键词:藏文分词 自然语言处理 HMM 
藏语语料库加工方法研究被引量:13
《计算机工程与应用》2011年第6期138-139,146,共3页才让加 
国家语委基金(No.MZ115-018);国家社会科学基金(No.07BYY035);国家社会科学重点基金(No.05AYY001);973计划前期研究专项(No.2010CB334708)
为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料...
关键词:藏语语料库 规范 词类 标记集 词典 分词标注 
藏语语料库词类描述方法研究被引量:7
《计算机工程与应用》2011年第4期146-148,共3页才让加 
国家社会科学基金(No.07BYY035);国家社会科学重点基金(No.05AYY001);国家语委项目(No.MZ115-018);国家973计划前期研究专项(No.2010CB334708)
藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动...
关键词:自然语言 藏文 词类标记 语法信息 
藏语语料库词语分类体系及标记集研究被引量:18
《中文信息学报》2009年第4期107-112,共6页才让加 
国家语委资助项目(MZ115-018);国家社会科学基金(07BYY035);国家社会科学重点基金(05AYY001)
青海师范大学藏文信息处理与机器翻译省级重点实验室已完成1 000万字的藏语语料库的加工实验,加工的主要目的是使计算机能够对藏语语料库中的藏语词语进行自动切分和自动标注。该文在对大规模藏语语料库进行自动切分和人工分析的基础上...
关键词:计算机应用 中文信息处理 语料库 藏语词语 分类体系 标记集 
CLUCENE在语料库建设中的应用
《南京师范大学学报(工程技术版)》2008年第4期118-122,共5页贺胜 曲维光 卢亚军 
江苏省社会科学基金(07YYB003;06JSBYY001);国家自然科学基金(60773173);国家社会科学基金(07BYY050);国家社会科学基金2005重点项目(05AYY001);国家"973"计划(2004CB318102)资助项目
深入分析了现有语料库的构建模式和语料库应具备的功能模块,提出基于文件系统和Clucene全文检索引擎工具包的语料库建设方案.实验证明,Clucene具有丰富的接口设计和良好的扩展性,为语料库建设提供了一种较好的技术实现方式.
关键词:CLUCENE 语料库 语料库建设 
面向大规模语料库的全文检索系统研究
《图书与情报》2008年第4期93-97,共5页贺胜 卢亚军 
江苏省社会科学基金项目<语料库通用加工与应用工具开发研究>(批准号:07YYB003);国家社科基金2005重点项目<藏语语料库建设研究>(批准号:05AYY001)研究成果之一
随着语料库规模的不断扩大和基于语料库的应用研究逐步拓展,对语料库的全文检索成为语料库系统中不可缺少的重要的组成部分。文章对面向大规模语料库的全文检索系统的索引模式、检索算法、检索表达式的构建、自动分词、系统组成等进行...
关键词:语料库 全文检索 自动分词 
基于IMM-IME结构的藏文输入法研究被引量:1
《西北民族大学学报(自然科学版)》2008年第1期29-32,共4页贺胜 卢亚军 王正平 
国家社科基金2005重点项目<藏语语料库建设研究>(05AYY001)
IMM-IME(输入法管理器-输入法编辑器)结构是Windows多语言支持的核心组件之一,为输入法的开发提供了强有力的支持.通过讨论中文Windows操作系统平台下输入法的基本工作原理,分析了中文Windows平台下基于IMM-IME结构的输入法的构成、接...
关键词:藏文 输入法 IME IMM 
基于藏文编码(基本集)国家暨国际标准的藏文输入法研究被引量:2
《图书与情报》2007年第6期45-49,共5页贺胜 卢亚军 
国家社科基金2005年重点项目"藏语语料库建设研究"(批准号:05AYY001)研究成果
藏文输入法是藏文信息处理领域的基础性研究课题,也是藏文信息化建设的一个瓶颈。文章论述了针对现有藏文输入法存在的问题,旨在突破由"文字"信息处理向"语言"信息处理过渡的难题,研究并开发一种基于藏文编码(基本集)国家暨国际标准和Un...
关键词:藏文 信息处理 输入法 OPENTYPE 
检索报告 对象比较 聚类工具 使用帮助 返回顶部