国家自然科学基金(61103112)

作品数:15被引量:43H指数:3
导出分析报告
相关作者:段建勇张梅谢宇超徐骥超刘云峰更多>>
相关机构:北方工业大学更多>>
相关期刊:《情报杂志》《语言文字应用》《信息与电脑(理论版)》《计算机应用与软件》更多>>
相关主题:维基百科信息抽取知识挖掘查询纠错更多>>
相关领域:自动化与计算机技术语言文字更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于维基百科的领域本体自动构建方法研究被引量:2
《计算机应用与软件》2016年第7期72-75,共4页吴洁明 刘雁昆 段建勇 
国家自然科学基金项目(61103112);国家科技支撑计划项目(2012BA H04F01;2012BAH04F03);北京市科技创新平台基金项目(PXM2013_014212_000011);北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130502)
随着互联网的发展,本体被广泛应用于知识工程、信息检索等领域。传统的本体构建方法无法满足日益增长的需求,提出一种基于维基百科的领域本体构建方法。通过提取维基百科的知识体系和知识属性,实现原始领域本体的自动化构建。提出的一...
关键词:本体 维基百科 有效性 自动构建 
基于统计和特征相结合的查询纠错方法研究被引量:3
《现代图书情报技术》2016年第2期34-42,共9页段建勇 关晓龙 
北京市社会科学基金项目"北京市公共危机事件在网络传播中的演化机制与模型研究"(项目编号:13SHC031);国家自然科学基金项目"面向维基百科的多粒度一体化信息抽取方法研究"(项目编号:61103112)的研究成果之一
【目的】提高搜索引擎查询纠错过程中的准确率和召回率,改善用户的检索体验。【方法】提出一种基于统计和特征相结合的查询纠错模型,建立混淆集生成模型,将用户输入的查询关键字生成其对应的混淆集;建立混淆集排序模型,对混淆集中的词...
关键词:查询纠错 混淆集 N-GRAM模型 N-gram相似度 编辑距离 点击词频 
搜索引擎的一种在线中文查询纠错方法被引量:2
《中文信息学报》2016年第1期71-78,共8页胡熠 刘云峰 杨海松 张小鹏 段建勇 张梅 乔建秀 
国家自然科学基金(61103112);国家社会科学基金(11CTQ036);国家语委十二五规划基金(YB125-10);北京市哲学社会科学规划基金(13SHC031)
该文主要解决中文搜索引擎的查询纠错问题。错误的查询,已经偏离用户真实的搜索意图时,搜索质量很差,甚至导致搜索结果数为零。为此该文提出了一种服务于实际搜索引擎,较为完整的查询纠错方案。该文重点描述了纠错查询候选生成、纠错查...
关键词:中文查询纠错 多特征 核函数排序 
网页搜索中查询时效性的实时计算模型被引量:2
《中文信息学报》2016年第1期79-84 100,共7页胡熠 刘云峰 段建勇 熊展志 乔建秀 张梅 
国家自然科学基金(61103112);国家社会科学基金(11CTQ036);国家语委十二五规划基金(YB125-10);北京市哲学社会科学规划基金(13SHC031)
网页搜索中的查询时效性是指查询对新闻网页的需求。这种时间相关的因素,在网页排序过程中用于平衡其他非时间性因素,使排序更好地满足用户体验。为此该文提出了一种查询时效性的实时计算模型:从用户搜索和媒体报道两个角度,分别对时效...
关键词:查询时效性 时效性用户模型 时效性媒体模型 
IBATIS框架下文本抽取系统的研究
《电子科学技术》2015年第2期214-218,共5页段建勇 高会娟 
国家自然科学基金(No.61103112);国家社会科学基金(No.11CTQ036)
由于网络的快速发展,网络信息骤然增加,增大了文本的抽取难度。针对这种情况,提出IBATIS框架下基于HtmlParser技术的文本抽取模式,将HtmlParser高效的过滤器和访问者模式与实现业务逻辑、数据访问、页面展示相分离的IBATIS框架相融合,...
关键词:在线评论 HTMLPARSER 信息抽取 IBATIS 抽取模式 
面向网络评论的文本信息抽取方法研究被引量:1
《北方工业大学学报》2015年第1期7-12,50,共7页段建勇 高会娟 张梅 
国家自然科学基金(61103112);北京市哲学社会科学规划基金(13SHC031);北京市青年拔尖人才培育计划(CIT&TCD201404005)
为对网络在线评论进行高效率的文本分析与提取,本文提出一种基于HtmlParser的文本抽取解析算法.首先通过语言与格式规则进行标签筛选,实现基于HtmlParser的网页文本数据抽取算法,然后采用Regex模式对抽取文本进行清洗去噪.最后通过实验...
关键词:网页提取 信息抽取 URL采集 模式匹配 
维基百科中翻译对的模板挖掘方法研究被引量:2
《中文信息学报》2015年第2期190-198,共9页段建勇 闫启伟 张梅 胡熠 
国家自然科学基金(61103112);北京市哲学社会科学规划基金(13SHC031);北京市青年拔尖人才培育计划(CIT&TCD201404005);国家语委十二五规划基金(YB125-10)
双语翻译对在跨语言信息检索、机器翻译等领域有着重要的用途,尤其是专有名词、新词、俚语和术语等的翻译是影响其系统性能的关键因素,但是这些翻译对很难从现有的词典中获得。该文针对维基百科的领域覆盖率和结构特征,提出了一种从维...
关键词:双语翻译对 维基百科 模板挖掘 信息抽取 
维基百科中查询分类知识挖掘方法研究被引量:1
《小型微型计算机系统》2014年第7期1591-1595,共5页段建勇 窦光辉 张梅 谢宇超 
国家自然科学基金项目(61103112)资助;国家社会科学基金项目(11CTQ036)资助;北京市哲学社会科学规划基金项目(13SHC031)资助;国家语委十二五规划基金项目(YB125-10)资助
查询分类需要建立查询意图的分类知识体系,每个查询类别中的分类知识规模相对比较大,因而不能保证每一个查询类别都能被覆盖.提出基于随机游走方式的查询分类知识挖掘方法,首先抽取维基百科中的全部词条与分类知识形成集合,并采用随机...
关键词:随机游走 查询分类 维基百科 信息抽取 
网络舆情分析中共性知识挖掘方法研究被引量:4
《现代图书情报技术》2013年第10期59-65,共7页段建勇 程利伟 张梅 高振安 
教育部人文社会科学基金项目"基于多层次情感分析的网络文本舆情监测方法研究"(项目编号:10YJC870003);北京市哲学社会科学规划基金项目"北京市公共危机事件在网络传播中的演化机制与模型研究"(项目编号:13SHC031);国家自然科学基金项目"面向维基百科的多粒度一体化信息抽取方法研究"(项目编号:61103112)的研究成果之一
共性知识挖掘是网络舆情中实现领域可移植的有效途径,提出从共性情感元素、共性语言模式两方面建立共性舆情知识库。共性情感元素挖掘主要通过半自动方法识别并从训练库中学习量化权值实现动态扩展知识库;共性语言模式挖掘主要从语法、...
关键词:舆情分析 共性知识挖掘 情感元素 语言结构 
基于网络日志的用户兴趣模型构建被引量:8
《情报科学》2013年第9期78-82,共5页段建勇 魏晓亮 张梅 徐骥超 
国家社会科学基金项目(11CTQ036);国家自然科学基金项目(61103112);教育部人文社会科学青年基金项目(10YJC870003)
了解用户查询意图对改善搜索引擎质量起到了至关重要的作用,对具有特定兴趣的用户进行查询分析,使搜索引擎更能了解用户的真实需求。本文通过对网络查询日志进行聚类分析,将相似度大的查询词聚类,建立用户兴趣模型对用户的兴趣进行分析...
关键词:查询日志 兴趣模型 个性化推荐 
检索报告 对象比较 聚类工具 使用帮助 返回顶部