国家高技术研究发展计划(2006AA010109)

作品数:17被引量:167H指数:7
导出分析报告
相关作者:陈家骏黄河燕张海军袁春风史树敏更多>>
相关机构:南京大学中国科学院中国科学技术大学北京理工大学更多>>
相关期刊:《中文信息学报》《计算机技术与发展》《模式识别与人工智能》《计算机应用与软件》更多>>
相关主题:未登录词计算机应用中文信息处理机器翻译人工智能更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于大规模语料划分的频繁模式查找算法被引量:1
《计算机科学》2012年第3期149-152,169,共5页丁溪源 黄河燕 张海军 王树梅 
国家863计划重点项目(2006AA010109)资助
频繁模式查找对新词识别、网络舆情监测、生物信息序列检测等领域有很高的应用价值。为处理规模远超出内存的语料,提出了一种实用的频繁模式查找算法。先将语料按后缀首字符划分为多个集合,通过逐条扫描集合数据,搜索出最大化最长公共...
关键词:频繁模式 重复串 语料划分 子串归并 
基于句法树结构的情感评价单元抽取算法被引量:9
《计算机应用研究》2011年第9期3229-3234,共6页黄亿华 濮小佳 袁春风 武港山 
国家自然科学基金资助项目(61072152;61021062);国家"863"计划资助项目(2006AA010109)
情感评价单元的抽取是情感分析的基础任务之一,目前大部分的抽取方法都基于句法路径等扁平化的特征,区分中文评价文本中噪声的能力不强。提出了一种基于短语句法的树型结构来表示情感评价单元模式,并使用近似卷积树核的方法来计算这种...
关键词:情感分析 情感评价单元 句法树 卷积树核 相似度计算 商品评价 
基于分词提取重复串的未登录词遗漏量化模型被引量:5
《中文信息学报》2011年第2期122-128,共7页张海军 史树敏 丁溪源 黄河燕 
国家自然科学基金资助项目(60672149);国家863计划重点资助项目(2006AA010109)
基于重复串构造候选词集合是未登录词识别(UWI)的重要方法,目前有两种策略用于重复串提取:基于字符和基于分词。该文针对这两种策略实施了大量对比研究,并提出了基于分词提取重复串的未登录词遗漏量化模型,用以评估未登录词漏召问题。...
关键词:未登录词识别 重复串 条件随机域模型 中文分词 
一种应用组合特征的中文未登录词词性猜测研究被引量:4
《小型微型计算机系统》2010年第7期1402-1406,共5页张海军 冯冲 史树敏 黄河燕 
国家自然科学基金项目(60672149)资助;国家"八六三"高技术研究发展计划项目(2006AA010109)资助
未登录词词性猜测是未登录词识别的重要步骤.论文中应用条件随机域模型,使用词的外部和内部特征(组合特征),进行中文未登录词的词性猜测.文中提出增加一种新颖的内部特征--汉字偏旁,来提高词性猜测效果.试验表明,使用组合特征的词性猜...
关键词:中文分词 未登录词 条件随机域模型 词性猜测 
基于语义树的中文词语相似度计算与分析被引量:36
《中文信息学报》2010年第6期23-30,共8页张亮 尹存燕 陈家骏 
国家863高技术发展研究计划资助项目(2006AA010109);国家自然科学基金资助项目(60673043)
词语相似度的分析与计算是自然语言处理关键技术之一,对句法分析、机器翻译、信息检索等能提供很好的帮助。基于语义资源Hownet的中文词语相似度计算是近年来的研究热点,但大多数的研究都是对中国科学院计算技术研究所刘群提出的计算方...
关键词:语义树 词语相似度 《知网》2007 语义距离 
一种数据库汉语查询接口的设计与实现被引量:4
《计算机技术与发展》2010年第6期13-17,共5页郝亮 张文东 袁春风 
国家自然科学基金(60673043);国家高技术863计划项目(2006AA010109)
使数据库自然语言接口(NLIDB)能够处理灵活多变的查询语句,增强NLIDB的可用性,是NLIDB研究的一个重要目标。设计并实现了一种数据库汉语查询接口。该查询接口采用语义依存树作为查询语句向SQL转化的中间语言,在构建了基于Nivre算法的语...
关键词:数据库自然语言接口 自然语言查询接口 语义依存树 自然语言向SQL的转化 
一种基于共坐标上升算法的人名识别方法被引量:2
《计算机应用与软件》2010年第4期7-9,22,共4页戴播 毛奇 袁春风 
国家863高科技重点项目(2006AA010109);国家自然科学基金(60673043)
共坐标上升算法(coordinate ascent algorithm)是一种迭代优化技术,可以用来指导特征权值的训练。提出一种基于该算法的中国人名识别方法,避免了已有的一些方法中人为指定特征权值的问题,更好地体现特征之间存在的隐含关系。该方法从基...
关键词:共坐标上升算法 人名识别 特征权重训练 
中文新词识别技术综述被引量:40
《计算机科学》2010年第3期6-10,16,共6页张海军 史树敏 朱朝勇 黄河燕 
国家自然科学基金项目(60672149);国家863计划重点项目(2006AA010109)资助
新词识别是中文信息处理领域的关键技术。新词识别主要包括候选字串的提取过滤和词性猜测两项任务。中文没有特定符号标志词边界,因此任何相邻字符都有成词的可能性,这给新词提取过滤带来了很大困难;由于没有先验知识和统计数据,新词词...
关键词:新词识别 未登录词 候选字串 训练语料 词性猜测 
基于规则和统计的日语分词和词性标注的研究被引量:4
《中文信息学报》2010年第1期117-122,共6页姜尚仆 陈群秀 
国家863计划重点资助项目(2006AA010109)
日语分词和词性标注是以日语为源语言的机器翻译等自然语言处理工作的第一步。该文提出了一种基于规则和统计的日语分词和词性标注方法,使用基于单一感知器的联合分词和词性标注算法作为基本框架,在其中加入了基于规则的词语的邻接属性...
关键词:人工智能 机器翻译 日汉机器翻译系统 日语分词 日语词性标注 联合分词 
基于话题要素相似度计算的报道关系识别方法
《计算机应用与软件》2010年第1期35-37,64,共4页赵艳 戴播 濮小佳 袁春风 
国家863高科技重点项目(2006AA010109);国家自然科学基金(60673043)
报道关系识别是话题识别与跟踪TDT(Topic Detection and Tracking)研究内容中的基本任务之一,根据新闻话题的几大要素:时间、地点、人物、内容等,提出了一种基于话题要素的话题报道表示模型,并给出了基于话题要素相似度计算的报道关系...
关键词:话题识别与跟踪 报道关系识别 话题要素 相似度计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部