WEB数据源

作品数:11被引量:63H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:赵朋朋崔志明蔡欣宝陈洪平赵星更多>>
相关机构:苏州大学江苏省现代企业信息化应用支撑软件工程技术研究开发中心纽约州立大学武汉大学更多>>
相关期刊:《软件学报》《计算机工程》《情报杂志》《软件导刊》更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金湖北省自然科学基金江西省教育厅科学技术研究项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
大数据环境下Web数据源质量评估方法研究被引量:19
《计算机工程》2017年第2期48-56,共9页赵星 李石君 余伟 杨莎 丁永刚 胡亚慧 
国家自然科学基金(61502350;61672393;U1536114);中央高校基本科研业务费专项资金项目(2042014kf0057);湖北省自然科学基金(2014CFB289)
在大数据环境下Web数据资源的开放性和多源性使得不同互联网平台提供的数据质量参差不齐,严重影响人们从互联网中有效准确地获取信息。为此,提出一种Web数据源质量评估方法。建立面向多源互联网平台的统一数据模型和数据质量标准模型,...
关键词:大数据 WEB数据源 数据质量评估 全样本分析 MAPREDUCE框架 
基于HITS的冲突Deep Web数据多真值发现算法被引量:5
《计算机工程》2016年第9期158-162,共5页王继奎 李少波 
国家社科基金资助项目"基于大数据整合的空气质量测度方法研究"(14GSD95);全国统计科研基金资助重点项目"海量异源异物数据的采集;存储和分析方案研究"(2013LZ44);陇原创新人才扶持计划基金资助项目(14GSD95);甘肃省财政厅高校基本科研业务费基金资助项目(GZ14007;GZ14023)
目前多数真值发现算法建立在真值唯一的基础上,无法处理多真值的情况。为此,针对冲突Deep Web数据的多真值发现问题,借鉴HITS算法思想,定义视图权威度与视图描述可信度,两者相互影响。在此基础上,定义视图链接关系图,提出多真值迭代发...
关键词:WEB数据源 数据模型 可信度 视图 真值发现 
Web数据挖掘及其在电子商务系统中的应用被引量:3
《软件导刊》2015年第11期144-145,共2页徐艳丽 
在互联网快速发展时代,Web数据挖掘应用成为研究热点。将Web数据挖掘技术应用到电子商务领域可有效处理信息,提高企业管理效率,增强竞争力。探讨Web数据挖掘的含义、分类及电子商务系统中Web数据挖掘的数据源和方法。
关键词:WEB数据挖掘 数据挖掘 电子商务系统 WEB数据源 
Web数据源选择技术被引量:16
《软件学报》2013年第4期781-797,共17页万常选 邓松 刘喜平 廖国琼 刘德喜 江腾蛟 
国家自然科学基金(61173146);江西省高等学校科技落地计划(产学研合作)(KJLD12022);江西省教育厅科技项目(GJJ12733;GJJ12732;GJJ11729)
在Web数据集成的过程中,如何从大量的Web数据源集合中选择合适数量的数据源,使得在满足特定查询需求的前提下尽可能地减少所需访问的数据源数量,同时保持返回数据结果的高质量,成为Web数据集成中的一个热点问题.以近十几年的研究实践为...
关键词:数据集成 WEB数据源 文本 结构化与半结构化 源摘要 
基于本体的DeepWeb数据源发现方法被引量:1
《计算机工程》2012年第4期52-54,共3页李道申 刘勇 
国家自然科学基金资助项目(70671035)
提出一种基于本体的Deep Web数据源发现方法,采用网页分类、表单内容分类、表单结构分类方式,确定符合某领域的DeepWeb查询接口。在网页分类和表单内容分类中引入本体的半自动构建和自动扩展模块,在表单结构分类中添加启发式规则。实验...
关键词:深网 本体 数据源 半自动构建 分类模型 
跨库集成检索系统Web数据源分析策略被引量:2
《情报杂志》2011年第B06期135-137,97,共4页袁瑛 刘晓娟 高玲 
在跨库集成检索系统中,注册新的数据源时需要对数据源做检索模式的分析。为了获得正确、有效的检索模式,依据Web数据源的请求方式、参数情况等方面的特点,对Web数据源进行了分类,并针对各类数据源提出相应的分析流程,用于生成正确、有...
关键词:跨库集成检索系统 封装器 数据源分类 检索模式 数据源分析流程 
多Web数据源环境下的重复实体识别方法研究被引量:3
《计算机科学与探索》2010年第7期599-607,共9页刘伟 肖建国 
国家自然科学基金No.60875033;中国博士后科学基金No.20080440256;200902014~~
Web中大量可访问的数据源为人们获取有用的信息带来了极大的便利。作为Web数据源集成的一个必要的步骤,需要将存在于不同数据源表达形式各异的重复Web实体准确地识别出来。在已有的重复实体识别的工作中,主要是在两个数据源之间进行。由...
关键词:Web实体 重复实体识别 WEB数据集成 迭代训练 
基于本体的Deep Web数据源聚焦搜索系统研究被引量:1
《微计算机信息》2010年第6期27-29,共3页张素智 李丽娜 
Deep Web中包含内容丰富、主题专一的高质量信息,为了自动地采集和集成这些数据,数据源的发现是关键。本文设计了一种基于本体的DeepWeb数据源聚焦搜索系统,给出了核心搜索算法。并通过实验,表明该方法是可行有效的。
关键词:本体 DEEP WEB数据源 聚焦搜索 
一种Deep Web聚焦爬虫爬行策略被引量:2
《微电子学与计算机》2009年第8期117-120,共4页蔡欣宝 陈洪平 赵朋朋 崔志明 
国家自然科学基金项目(60673092);2008年江苏省重大科技支撑与自主创新项目(BE2008044);江苏省现代企业信息化应用支撑软件工程技术研发中心开放基金项目(SX200904)
实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径.Deep Web爬虫是Deep Web数据源集成的关键组成部分.提出一种针对结构化Deep Web的聚焦爬虫爬行策略.通过对查询接口的特征分析来判断Deep Web数据源的主题相关性...
关键词:结构化Deep WEB数据源 聚焦爬虫 决策树分类器 
Deep Web数据源聚焦爬虫被引量:11
《计算机工程》2008年第7期56-58,共3页林超 赵朋朋 崔志明 
国家自然科学基金资助项目(60673092);2005年度教育部科研基金资助重点项目(205059);教育部高校博士学科点科研基金资助项目(20040285016);江苏省高技术研究计划基金资助项目(BG2005019)
Internet上有大量页面是由后台数据库动态产生的,这部分页面不能通过传统的搜索引擎访问,被称为Deep Web。数据源发现是大规模Deep Web数据源集成的关键步骤。该文提出一种针对DeepWeb数据源的聚焦爬行算法。在评价链接重要性时,综合考...
关键词:DEEP WEB数据源 聚焦爬虫 贝叶斯分类器 
检索报告 对象比较 聚类工具 使用帮助 返回顶部