国家自然科学基金(60473139)

作品数:13被引量:71H指数:6
导出分析报告
相关作者:郑家恒谭红叶张虎李荣卢娇丽更多>>
相关机构:山西大学忻州师范学院教育部哈尔滨工业大学更多>>
相关期刊:《计算机工程与设计》《河南师范大学学报(自然科学版)》《电脑开发与应用》《计算机应用》更多>>
相关主题:中文信息处理未登录词词性标注分词支持向量机更多>>
相关领域:自动化与计算机技术电子电信更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于向量相似度计算的半监督的名实体识别被引量:1
《计算机工程与设计》2008年第19期5047-5050,共4页谭红叶 赵铁军 王浩畅 
国家自然科学基金项目(60575041、60473139、60775041);国家863高技术研究发展计划基金项目(2006AA01Z150);山西省青年科技基金项目(20051018)
提出一种基于向量相似度计算的半监督的NER方法,主要思想是:首先利用bootstrapping方法获取NER所需的各种特征;然后将待测实例表示为实例特征向量,每一类名实体表示为类特征向量;最后根据每个类特征向量与实例特征向量的相似度进行分类...
关键词:名实体识别 特征向量 向量相似度 半监督学习 自举 
基于分类的汉语语料库词性标注一致性检查被引量:3
《计算机工程》2008年第8期90-92,共3页张虎 郑家恒 
国家自然科学基金资助项目(60473139);山西省自然科学基金资助项目(20051034);山西大学青年基金资助项目(2006011)
制约语料库加工质量的一个重要方面是多标记词语的词性标注一致性问题。该文通过对大规模语料库兼类词的词性标注结果的分析,提出一种语料库词性标注一致性检查的方法,分析词性标记序列的特征并建立兼类词语境向量模型,运用k最近邻法,...
关键词:分类 词性标注 兼类词 词性标注一致性 
规则与统计相结合的分词一致性检验被引量:7
《计算机工程与设计》2008年第7期1814-1816,1827,共4页刘博 郑家恒 张虎 
国家自然科学基金项目(60473139);山西省自然科学基金项目(20051034)
建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处...
关键词:中文信息处理 大规模语料库 分词一致性检验 分词 语料库加工 
现代汉语缩略语自动识别的方法研究被引量:8
《计算机工程与设计》2007年第16期4052-4054,共3页武子英 郑家恒 
国家自然科学基金项目(60473139);山西省自然科学基金项目(20051034);山西大学青年基金项目(2006011)
在中文信息处理领域,缩略语识别是研究中很重要的一个方面。针对缩略语词典资源稀少的现状,提出一种在生语料中自动抽取现代汉语缩略语的方法。首先获取候选缩略语的源短语候选集,然后利用基于上下文的源短语与缩略语配对方法,可自动生...
关键词:源短语 缩略语 上下文 余弦相似度 未登录词 
中文分词中歧义切分处理策略被引量:10
《山西大学学报(自然科学版)》2007年第2期163-167,共5页郑家恒 张剑锋 谭红叶 
国家自然科学基金(60473139);山西省自然科学基金(20051034)
文章试图从歧义字段本身的特点,即从伪歧义与真歧义这两个角度,以规则库为辅助手段,构建相应概率统计模型来解决歧义字段切分的问题.概率模型中特征的选取考虑了相邻词语和相邻词语的语义信息.实验表明该模型在解决歧义切分问题上是有效的.
关键词:自动分词 伪歧义 真歧义 概率模型 
基于语料库的名词短语识别方法被引量:2
《济南大学学报(自然科学版)》2007年第3期243-245,271,共4页李荣 郑家恒 
国家自然科学基金(60473139);忻州师范学院科研基金(200623)
名词短语识别是自然语言处理领域的非常重要的子任务。利用最大熵法(ME)、支持向量机法(SVM)和隐马尔可夫模型(HMM)3种有代表性的统计方法对汉语文本进行名词短语识别,并对实验结果进行比较分析。结果表明HMM法在封闭测试中优势明显,SV...
关键词:中文信息处理 最大熵 支持向量机 隐马尔可夫模型 短语识别 
汉语NP识别方法的实验比较研究
《河南师范大学学报(自然科学版)》2007年第3期27-29,共3页李荣 郑家恒 
国家自然科学基金(60473139);忻州师范学院科研基金(200623)
利用错误驱动法、支持向量机法和隐马尔可模型3种方法对汉语文本进行名词短语识别,对实验进行比较分析,结果表明SVM与HMM的识别效果总体上要好于错误驱动法,HMM法在封闭测试中优势明显.研究表明错误驱动法适用于解决从语料库中学习转换...
关键词:错误驱动 支持向量机 隐马尔可夫模型 短语识别 
基于改进的隐马尔科夫模型的汉语词性标注被引量:10
《计算机应用》2006年第S2期197-198,207,共3页王敏 郑家恒 
国家自然科学基金资助项目(60473139);山西省自然科学基金资助项目(20051034)
基于传统隐马尔科夫(HMM)模型的基础上,对词语的词汇发射概率做出了新的假设,从而更好地体现了该词语与上下文依赖关系。还利用指数线性插值平滑算法对参数进行了有效平滑,并且给出了未登录词词汇发射概率估计模型。实验结果证明,改进...
关键词:中文信息处理 词性标注 隐马尔科夫模型 平滑算法 未登录词 
汉语句法树库检索系统的设计与实现
《电脑开发与应用》2006年第11期12-14,共3页魏善德 郑家恒 
国家自然科学基金(60473139)项目;山西省自然科学基金(20051034)项目资助
句法树库是一项重要资源,它能为汉语语言研究和信息处理提供一个有利的数据平台。汉语句法树库检索的实现用到了流操作和GD I+图形操作。汉语句法库检索系统是基于句法树库的应用系统,提供了对句法树库的检索和统计,并且能够根据树库中...
关键词:句法树库 短语功能 短语结构 
农作物信息抽取系统的设计与实现被引量:5
《计算机工程》2006年第7期197-198,220,共3页郑家恒 菅小艳 
国家"863"计划基金资助项目(2001AA4031);国家自然科学基金资助项目(60473139);山西省自然科学基金资助项目(20051034)
研究了特定领域的文本的信息抽取,主要考虑了文本分布的观点。首先从未标注的语料中学习主题和主题间的关系,然后把它应用在同领域的文本信息抽取。经测试,其信息抽取的效果有所提高。
关键词:主题 信息抽取 聚类 K近邻 
检索报告 对象比较 聚类工具 使用帮助 返回顶部