邢富坤

作品数:16被引量:119H指数:6
导出分析报告
供职机构:解放军外国语学院更多>>
发文主题:语料库语言教学语言技术外语教学易读性更多>>
发文领域:语言文字文化科学自动化与计算机技术社会学更多>>
发文期刊:《语料库语言学》《外语电化教学》《计算机应用与软件》《计算机应用研究》更多>>
所获基金:国家自然科学基金国家社会科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
邢富坤谈语料库语言学与计算机技术被引量:2
《语料库语言学》2015年第2期26-35,115,共11页邢富坤 
1.您觉得哪些计算机技术与语料库语言学研究密切相关?计算机技术可以分为3个层面来看待,分别是(1)工具;(2)方法;(3)思想。不同层面的计算机技术都与语料库语言学研究有联系。1)工具层面。计算机是用于表示、存储和处理数据的工具。语料...
关键词:研究 工具 层面 语言学 语料库 计算机技术 
面向语言处理的语料库标注:回顾与反思被引量:8
《解放军外国语学院学报》2015年第3期8-13,共6页邢富坤 
国家社会科学基金项目"面向语言工程的现代汉语词类体系与词性标注研究"(14FYY015);国家社会科学基金项目"基于语料库的军事英语综合研究"(11BYY126);国家社会科学基金项目"基于语料库的学术英语元话语特征对比研究"(14BYY150);中央文献对外翻译与传播协同创新中心2013年度科学研究项目"面向中央文献对外翻译的多语言知识网络研究"(2013XT07)
语料库是语言处理的重要知识源,语料库标注则是挖掘语料库潜在价值的重要方法和途径。本文在已有语料库标注实践的基础上,总结分析了语料库标注的本质、作用与分类,并以词性标注为例详细说明了标注体系、标注规范、标注过程以及自动标...
关键词:语料库 语料标注 标注体系 标注规范 
基于维基百科的领域实体发现研究被引量:5
《计算机应用研究》2015年第2期347-350,367,共5页邢富坤 
国家社会科学基金资助项目(11BYY126);中央文献对外翻译与传播协同创新中心2013年度科学研究项目(2013XT07)
提出一种基于维基百科的领域实体发现方法,该方法将构成领域实体的典型字或词作为种子元素,利用少量种子元素作为实体发现的初始知识,有效地克服了传统方法在获取种子词条时过分依赖领域专家的局限,同时还利用维基百科词条中的分类信息...
关键词:领域实体 维基百科 隶属度 自动发现 
中文分词中未登录词分布规律及处理方法研究被引量:2
《解放军外国语学院学报》2013年第5期27-32,共6页邢富坤 
本文以较大规模汉语语料库为基础,对中文分词中的未登录词分布规律进行考察,提出了词增长代价、语料效率等评价指标,借此来定量考察语料规模与未登录词之间的内在关系。调查结果显示,随着语料规模的不断扩大,未登录词的覆盖率也随之增大...
关键词:中文分词 机器学习 未登录词 伪未登录词 
多词单位的描写识别与词典编纂被引量:3
《当代语言学》2012年第4期407-417,438,共11页邢富坤 
多词单位负载的意义稳定,在信息检索、机器翻译、自动问答等语言应用系统和语言研究中日益受到重视,但由于其类型多样、构成复杂、变化灵活,较难给出形式化表达,进而造成其在语言研究和实际应用中面临诸多困难。当前,多词单位的研究集...
关键词:多词单位 描写分类 识别算法 词典编纂 
基于隶属度的命名实体自动获取研究被引量:1
《计算机应用与软件》2012年第8期41-45,61,共6页邢富坤 
国家自然科学基金项目(60872121)
利用维基百科(Wikipedia)和已有命名实体资源,提出维基百科类的隶属度计算方法,通过匹配、计算、过滤、扩展、去噪五个步骤构建出具有较高质量和较大规模的命名实体实例集。在英语维基百科数据上进行实验,结果显示,基于隶属度方法自动...
关键词:命名实体 自动获取 维基百科 隶属度 
信息化条件下的语言资源建设与应用被引量:3
《高等教育研究学报》2011年第2期118-120,共3页邢富坤 
信息技术在语言教学领域的广泛使用对语言资源建设提供了新的机遇,同时也提出了新的挑战。在分析已有语言资源建设存在的问题基础上,提出了语言资源建设要遵循的主要原则,并描述了以互联网新闻资源为基础的语言资源建设工作。
关键词:信息化建设 语言教学 语言技术 语言资源 
多语种语言资源的建设原则与方法被引量:1
《现代教育技术》2011年第5期73-78,共6页邢富坤 
高效率地建设多语种语言资源,为信息化条件下的语言教学提供有力支持是当前亟待解决的问题。笔者在分析多语种语言资源的类型及其特点的基础上,提出了以人机互助为主要原则的多语种语言资源建设思想,并对多语种语言资源建设中涉及的主...
关键词:语言教学 语言技术 语言资源 人机互助 
基于互联网的多语种动态语言资源库建设与应用被引量:6
《中国电化教育》2011年第2期81-85,共5页邢富坤 
本文描述了以互联网为来源的多语种动态语言资源库的建设与应用工作,并以自主开发的多语种语言资源自动获取与加工系统为例,介绍了语言资源库建设的主要方法与内容。该系统目前已经实现了以CNN、BBC、新华社等近十家主要新闻媒体网站为...
关键词:语言教学 语言技术 多语种语言资源 自动获取 自动加工 
基于统计语言模型的英语易读性研究被引量:12
《解放军外国语学院学报》2010年第6期19-24,共6页邢富坤 程东元 
英语易读性研究有着悠久的历史,其研究成果在英语教学及研究中发挥着重要作用。近年来,随着统计自然语言处理技术的快速发展,英语易读性研究逐渐摆脱了过去单纯依靠测量词长、句长等因素的局限,开始从建立统计语言模型的角度进行探索,...
关键词:统计语言模型 易读性 语料库 自然语言处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部