王宝勋

作品数:5被引量:29H指数:3
导出分析报告
供职机构:哈尔滨工业大学更多>>
发文主题:答案抽取K-近邻支持向量机段落划分文本特征更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《电子学报》《中文信息学报》《智能计算机与应用》《自动化学报》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划哈尔滨市科技创新人才研究专项资金项目黑龙江省自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-5
视图:
排序:
基于论坛话题段落划分的答案识别被引量:7
《自动化学报》2013年第1期11-20,共10页王宝勋 刘秉权 孙承杰 王晓龙 孙林 
国家自然科学基金(60973076;61100094);语言语音教育部-微软重点实验室开放基金(HIT.KLOF.2010061);哈尔滨市科技创新人才研究专项资金项目(2010RFXXG003)资助~~
在论坛话题中识别答案是面向论坛的问答对挖掘中的核心问题.在论坛话题的讨论中通常存在隐式的结构,这种结构信息非常有助于最佳答案的定位和识别.本文提出了一种基于中文论坛话题段落划分的答案识别方法:首先将论坛话题重新组织为若干...
关键词:话题段落划分 非文本特征 答案识别 在线论坛 问答对挖掘 
网络问答资源挖掘综述
《智能计算机与应用》2012年第6期54-58,共5页王宝勋 刘秉权 孙承杰 王晓龙 
国家自然科学基金(61100094;61272383);高等学校博士学科点专项科研基金(20102302120053)
由大规模问答对组成的问答知识库对于自动问答技术的巨大支持作用是不言而喻的,从互联网获取知识并以问答对的形式加以保存是扩充和完善问答知识库的必要手段。阐述了面向互联网数据源的问答资源挖掘对于问答系统构建和自然语言处理研...
关键词:问答资源挖掘 问答语义相关度计算 答案摘要 模式化答案抽取 
基于模式学习的形式化答案抽取技术与置信度评价方法被引量:3
《电子学报》2008年第12期2339-2343,共5页李鹏 乔佩利 王晓龙 王宝勋 
国家自然科学基金重点项目(No.60435020);国家863高技术研究发展计划重点项目(No.2006AA01Z197)
本文提出一种基于模式学习的形式化答案抽取方法,区别于传统基于特征的答案抽取方法,通过问题模式和答案模式的自动匹配,直接获取问题答案.本文通过机器学习的方法自动生成用于答案抽取的形式化模板,克服了人工方法费时、费力以及覆盖...
关键词:模式学习 问答系统 答案抽取 置信度 逻辑回归 
一种基于无监督学习的词变体识别方法被引量:3
《中文信息学报》2008年第3期32-36,114,共6页王宝勋 王晓龙 刘秉权 李鹏 
国家自然科学基金资助项目(60435020;60673037);863计划资助项目(2006AA01Z197;2007AA01Z172);黑龙江省自然科学基金资助项目(E200635)
本文提出了一种生物医药领域词变体的识别策略。首先使用最小编辑距离算法和字符匹配算法从语料中分别获得特定目标词的形态学变体和缩略词,并将其作为候选词变体。本文采用系统相似模型获得每个词变体上下文语义的量化评价。本文的方...
关键词:计算机应用 中文信息处理 词变体 缩略词 最小编辑距离 系统相似模型 
一种基于混合策略的失衡数据集分类方法被引量:16
《电子学报》2007年第11期2161-2165,共5页李鹏 王晓龙 刘远超 王宝勋 
国家自然科学基金重点项目(No.60435020);国家863高技术研究发展计划重点项目(No.2006AA01Z197)
提出了一种有效应用于失衡数据集的分类方法,其核心思想是从样本预处理和分类器改进两方面入手,为失衡数据集的分类问题提供全面的解决方案.首先创造性地采用动态自组织映射聚类的方法对失衡数据集进行重采样,这种采样方法,有效地解决...
关键词:失衡数据集 分类 支持向量机 动态自组织映射 K-近邻 
检索报告 对象比较 聚类工具 使用帮助 返回顶部