国家高技术研究发展计划(2002AA117010-09)

作品数:18被引量:70H指数:4
导出分析报告
相关作者:赵铁军王晓龙刘秉权刘远超杨沐昀更多>>
相关机构:哈尔滨工业大学东北林业大学昆明理工大学更多>>
相关期刊:《黑龙江工程学院学报》《计算机应用研究》《哈尔滨工业大学学报》《计算机工程与应用》更多>>
相关主题:基本名词短语识别英语最大熵模型汉语遗传算法更多>>
相关领域:自动化与计算机技术语言文字更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种基于软模式的语义类发现方法
《哈尔滨工业大学学报》2007年第11期1776-1779,共4页谭红叶 赵铁军 
国家自然科学基金资助项目(60302021;60473139);国家高技术研究发展计划资助项目(2002AA117010-09);山西省青年科技基金资助项目(20051018)
为解决基于模式的方法发现语义类时召回率和精确率低的问题,提出了一种基于软模式的语义类发现方法,该方法首先利用bootsrapping方法获得传统的模式,即硬模式,然后再扩展生成软模式,最后通过计算待测模式的分值实现软模式的模糊匹配,从...
关键词:模式 软模式 语义类 命名实体 
利用词性信息改进Katz平滑算法
《哈尔滨工业大学学报》2007年第9期1445-1448,共4页赵岩 王晓龙 徐志明 刘秉权 
国家自然科学基金重点资助项目(60435020);国家高技术研究发展计划资助项目(2002AA117010-09)
对已有的N-gram平滑算法进行了系统地分析,分别实现了Absolute、W-B和Katz平滑算法.为解决传统Katz平滑算法在处理某些汉语固定搭配时无法进行概率折扣的问题,利用词性信息构造了新的折扣系数.新的折扣系数使词频越大,折扣越小,后接词越...
关键词:N-GRAM模型 数据稀疏 词性信息 Katz平滑 
基于多知识源融合的关键词重要性评价研究
《哈尔滨工业大学学报》2007年第7期1138-1141,共4页刘远超 吴冲 王晓龙 
国家863计划资助项目(2002AA117010-09);国家自然科学基金重点资助项目(60435020)
词的重要性评价是关键词抽取研究中比较重要的环节,其中一种比较常用的方法是对词的相关属性进行加权分析,并根据综合权值确定重要性程度.词所处的位置、词频、词性以及与线索词的同现信息等都是影响关键词抽取的重要因素.本文首先对可...
关键词:关键词抽取 参数优化 遗传算法 知识源 
一种基于SVM/RS的中文机构名称自动识别方法被引量:4
《电子与信息学报》2006年第5期895-900,共6页宇缨 王晓龙 刘秉权 
国家自然科学基金(60175020);国家863计划(2002AA117010-09)资助课题
该文提出一种支持向量机(support Vector Machines,SVM)和粗糙集(Rough Set,RS)相结合的巾文机构名称短语识别方法。该方法借助词的基术语义搭配关系表示短语的构成规则,并通过粗糙集属性约简的方法自动学>J 到机构名称构成规则的无冗...
关键词:模式识别 SVM 特征选择 语义 粗糙集 语义搭配 
融合聚类触发对特征的最大熵词性标注模型被引量:20
《计算机研究与发展》2006年第2期268-274,共7页赵岩 王晓龙 刘秉权 关毅 
国家自然科学基金项目(60175020);国家"八六三"高技术研究发展计划基金项目(2002AA117010-09)~~
为解决传统HMM词性标注模型不能包含远距离词特征的问题,提出了形如“WA→WB/TB”的触发对来承载远距离词特征信息,并采用平均互信息量度对触发对特征进行选择·在最大熵框架下,将选择后的触发对特征加入到词性标注系统中·利用矢量空...
关键词:词性标注 最大熵模型 矢量空间模型 语义相似度计算 触发对 
基于多重线性回归模型的翻译等价对获取
《计算机工程与应用》2006年第4期1-3,26,共4页张春祥 赵铁军 李生 
国家863高技术研究发展计划资助项目(编号:2002AA117010-09);国家自然科学基金资助项目(编号:60375019)
翻译等价对在词典编纂、机器翻译和跨语言信息检索中有着广泛的应用。文章从双语句对的译文等价树中抽取翻译等价对。使用译文直译率、短语对齐概率和目标语-源语言短语长度差异等特征对自动获取的等价对进行评价。提出了一种基于多重...
关键词:翻译等价对 多重线性回归模型 N—Best策略 
基于关联度评价的中心词扩展的英文文本语块识别被引量:3
《计算机研究与发展》2006年第1期153-158,共6页梁颖红 赵铁军 刘博 杨沐昀 
国家自然科学基金项目(60302021;60375019);国家"八六三"高技术研究发展计划基金项目(2002AA117010-09);科技部政府间国际合作基金项目(CI-2003-03)
传统的英文文本语块识别的方法大多是通过设定相应的短语标识符号,最终把语块识别问题转化成词性标注问题来解决·实验表明,这种方法不能充分考虑相邻词性的关系和每种短语的内部组成规律·关联度评价中心词扩展的英文文本语块识别方法...
关键词:中心词扩展 关联度 怀疑度 可信度 
基于聚类分析策略的用户偏好挖掘被引量:8
《计算机应用研究》2005年第12期21-23,共3页刘远超 王晓龙 刘秉权 钟彬彬 
国家自然科学基金资助项目(60373100);国家"863"计划资助项目(2002AA117010-09)
利用训练文档集准确高效地挖掘隐藏的用户文本偏好和概念向量是文本信息过滤和多文档自动文摘等自然语言处理应用的关键技术之一。针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的文本偏好挖掘方法。其基本思...
关键词:偏好挖掘:文档聚类 概念向量 Rocchio算法 
基于子类的汉语动词SCF获取回退被引量:1
《计算机工程与应用》2005年第30期158-161,共4页韩习武 赵铁军 
国家自然科学基金项目:1.汉语动词次范畴化自动获取技术的研究(编号:60373101);2.基于双语信息的英汉译文消歧技术研究(编号:60375019);国家863高技术研究发展计划(编号:2002AA117010-09)
研究证明基于动词子类的回退方法能够改进次范畴化(SCF)自动获取的性能,不同的子类划分方法起到重要的作用。本文利用《同义词词林》、《知网1.2版》和《现代汉语动词大词典》分别对30个测试动词进行分类,并以分类结果来改进汉语动词SC...
关键词:汉语动词 子类 SCF 回退 
中文名实体识别中的特征组合与特征融合的比较被引量:7
《计算机应用》2005年第11期2647-2649,共3页赵健 王晓龙 关毅 
国家自然科学基金资助项目(60435020);国家863计划项目(2002AA117010-09)
先分析了最大熵模型常用的特征线性组合方法中的权值偏置问题,然后提出了在线性组合之前,对特征进行融合,并根据融合特征和目标类别之间的互信息选择有效复合特征的方法。通过在包含2000个人名的语料库上的测试,表明特征融合能有效地提...
关键词:名实体识别 特征组合 权值偏置 特征融合 最大熵模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部