语料库加工

作品数:6被引量:58H指数:5
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:才让加头旦才让周毛先那顺乌日图雪艳更多>>
相关机构:青海师范大学内蒙古大学北京大学语言文字应用研究所更多>>
相关期刊:《计算机工程与设计》《语言文字应用》《中文信息学报》《计算机工程与应用》更多>>
相关基金:国家自然科学基金国家社会科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-6
视图:
排序:
汉维哈柯双语语料库加工系统句子对齐技术的研究
《电脑知识与技术》2011年第10期6797-6799,共3页谭勋 吐尔根·依布拉音 艾山·吾买尔 艾山·毛力尼亚孜 
工信部电子发展基金一维哈柯语言文字软件开发及产业化一维哈柯文辅助翻译软件;新疆大学博士启动基金;新疆多语种信息技术开放课题;新疆维吾尔自治区自然科学基金(2011211807);青年教师科研培育基金(XJEDU2010S07)
在自然语言处理的研究和开发中,双语平行语料库的作用日益突显出来,平行语料库的建设对于机器翻译、双语词典编纂、词义消歧和跨语言信息检索具有重要的价值。因此,设计了高效实用的汉维哈柯双语语料库加工系统。该系统将文档对齐、...
关键词:双语语料 平行语料库 句子对齐 
藏语语料库加工方法研究被引量:13
《计算机工程与应用》2011年第6期138-139,146,共3页才让加 
国家语委基金(No.MZ115-018);国家社会科学基金(No.07BYY035);国家社会科学重点基金(No.05AYY001);973计划前期研究专项(No.2010CB334708)
为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料...
关键词:藏语语料库 规范 词类 标记集 词典 分词标注 
PowerGREP与语料库加工被引量:7
《外语电化教学》2010年第3期57-62,共6页严华 王立非 
语料库标注处理是语料库语言学研究中的一个重点和难题。除了词性标注,其他各类标注(包括语义、句法、话语、语用等标注)均较难实现批量或自动化生成。本文简述PowerGREP的检索、编辑与替换、采集三大功能以及与语料库加工密切相关...
关键词:PowerGREP 正则表达式 语料库加工 
规则与统计相结合的分词一致性检验被引量:7
《计算机工程与设计》2008年第7期1814-1816,1827,共4页刘博 郑家恒 张虎 
国家自然科学基金项目(60473139);山西省自然科学基金项目(20051034)
建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处...
关键词:中文信息处理 大规模语料库 分词一致性检验 分词 语料库加工 
语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》被引量:11
《语言文字应用》2003年第4期16-24,共9页靳光瑾 郭曙纶 肖航 章云帆 
国家语委"十五"重大项目<现代汉语语料库的建设及深加工>(项目编号:ZDA105-44);863计划的"智能化中文信息处理平台"课题(编号2001AA114040);973的"中文语料库建设"课题(编号G199803051A-05)资助。
本文就制定《信息处理用现代汉语词类标记集规范》阐述我们对于规范问题的看法和做法。规范不是强制的 ,只规范加工结果 ,不规范加工过程。《规范》研制的目的在于为中文信息处理研究提供一套可以作为国家规范的现代汉语词类标记集体系 ...
关键词:词类标记集 规范 语料库 《信息处理用现代汉语词类标记集规范》 
汉语短语的自动划分和标注被引量:21
《中文信息学报》1997年第1期1-10,共10页周强 
国家自然科学基金
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个...
关键词:自动划分 标注 语料库加工 汉语分析器 汉语短语 
检索报告 对象比较 聚类工具 使用帮助 返回顶部