DEEP_WEB

作品数:232被引量:453H指数:13
导出分析报告
相关作者:崔志明赵朋朋申德荣孟小峰聂铁铮更多>>
相关机构:苏州大学吉林大学河北大学东北师范大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金教育部科学技术研究重点项目国家高技术研究发展计划国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程x
条 记 录,以下是1-10
视图:
排序:
面向Deep Web本地化数据集成的数据源两层选择模型被引量:3
《计算机工程》2017年第3期32-39,共8页鲜学丰 崔志明 方立刚 顾才东 孙逊 
国家自然科学基金(61440053;61472268;41201338);苏州市科技计划研究项目(SYG201342;SYG201343;SS201344)
针对基于数据源质量选择方法的数据源在数据爬取时存在代价大、重复率高的问题,提出一种结合两层选择模型的Deep Web数据源选择和集成方法。该方法根据数据源本身质量和数据源的效用构建数据源的两层选择模型。给出基于该模型的递归增...
关键词:深层网页 数据集成 数据源选择 数据源质量 效用模型 递归增量策略 
一种Deep Web爬虫爬行策略被引量:4
《计算机工程》2012年第11期284-286,共3页刘徽 黄宽娜 余建桥 
四川省教育厅科研基金资助项目(10ZB023)
Deep Web包含丰富的、高质量的信息资源,由于没有直接指向Deep Web页面的静态链接,目前大多搜索引擎不能发现这些页面,只能通过填写表单提交查询获取。为此,提出一种Deep Web爬虫爬行策略。用网页分类器的分层结果指导链接信息提取器提...
关键词:DEEP WEB页面 反馈机制 爬行策略 聚焦爬虫 网络数据库 分类器 
基于布尔矩阵的Deep Web复杂模式匹配被引量:3
《计算机工程》2011年第12期47-49,共3页龚桂芬 伏玉琛 程远虎 
国家自然科学基金资助项目(60873116);江苏省现代企业信息化应用支撑软件工程技术研究开发中心开放基金资助项目(SX200902);苏州大学科研预研基金资助项目(Q3118965)
在正负关联规则中引入布尔矩阵的概念,在双重相关性挖掘算法的基础上提出一种Deep Web复杂模式匹配算法。将查询接口模式中的属性项转化成布尔矩阵,通过对矩阵进行正关联规则运算挖掘组属性,对矩阵进行负关联规则运算挖掘同义属性。实...
关键词:布尔矩阵 模式匹配 查询接口 深网 
基于搜索引擎的Deep Web数据源发现被引量:1
《计算机工程》2011年第5期77-79,82,共4页王海龙 胡景芝 赵朋朋 崔志明 
国家自然科学基金资助项目(60970015);2008年江苏省重大科技支撑与自主创新计划基金资助项目(BE2008044)
提出一种利用搜索引擎发现数据源的方法。为向搜索引擎提交高质量的关键词,将本体作为等级化组织词汇的架构引入到初始词构建过程。对所有词汇按在当前领域中出现频率高低进行分类,并根据搜索引擎返回接口集元素数量进行二次分类,确保...
关键词:数据源发现 深层网 本体 
一种基于WatiJ的Deep Web蜘蛛研究
《计算机工程》2011年第4期264-266,共3页刘邵斌 张祖平 龙军 
国家自然科学基金资助项目(60873081;60970095;M0921005);湖南省自然科学基金资助项目(07JJ6122)
Deep Web中相当一部分内容因为动态网页存在而不能进行有效抓取。为此,设计并实现一种基于Web自动化测试工具——WatiJ的Deep Web网络蜘蛛。阐述利用WatiJ实现用户提交查询表单、循环点击翻页按钮等拟人交互方式的原理,通过实例给出动...
关键词:动态网页 自动化测试 网络蜘蛛 
基于关联规则的Deep Web查询接口集成被引量:1
《计算机工程》2011年第4期52-54,共3页岳亮 王海龙 赵朋朋 崔志明 
国家自然科学基金资助项目(60970015);2008年江苏省重大科技支撑与自主创新基金资助项目(BE2008044);江苏省基础研究计划企业博士创新基金资助项目(BK2009563)
论述查询接口集成的相关工作,提出基于查询单项间关联规则的接口模式匹配方法解决查询接口集成中模式匹配问题,同时给出复杂模式匹配处理方法。以图书、房产等领域为实验对象,模式匹配的平均准确率达到91.6%,匹配中能准确发现复杂模式匹...
关键词:接口集成 模式匹配 关联规则 复杂匹配 
基于查询接口文本的Deep Web数据源分类被引量:1
《计算机工程》2010年第12期66-68,共3页华慧 伏玉琛 周小科 
国家自然科学基金资助项目(60673092);2007质检公益项目科研专项基金资助项目(10-60);江苏省高校自然科学基金资助项目(07KJD520187);江苏省现代企业信息化应用支撑软件工程技术研究开发中心开放基金资助项目(SX200902)
根据Deep Web数量的爆炸性增长特点,提出一种基于查询接口文本的Deep Web数据源分类算法,对于分类的查询接口,采用2种方法:基于向量空间的TF-IDF方法和基于知网的语义相似度方法。综合2种方法获得接口之间的相似度。借鉴K-NN算法,提出WD...
关键词:深层网 数据源分类 知网 K—NN算法 语义分类 
基于包装器的Deep Web自动语义标注被引量:4
《计算机工程》2010年第12期52-54,57,共4页杨晓琴 鞠时光 曹庆皇 王秀红 
国家自然科学基金资助项目(60773049);江苏大学博士生创新基金资助项目(CX08B_18X)
为最准最全地对页面抽取的数据进行语义标注,提出一种基于包装器自动语义标注的方法。该方法利用多个标注源进行组合标注,有效解决单标注源标注率不高问题,同时针对标注不完全问题,给出利用多个数据源的互补关系来标注,生成高效率的标...
关键词:深层网络 语义标注 同步标注 包装器 
基于Deep Web的教育资源检索系统被引量:1
《计算机工程》2010年第3期76-78,82,共4页张世明 覃正 徐和祥 夏德元 
针对《基础教育教学资源元数据应用规范》中资源建设标准的缺陷,提出一种基于Deep Web集成技术的教育资源跨库检索系统设计方案。该系统包含知识发现、集成查询、知识库和系统监控等模块,加入了环境变化监控构件,并在多个环节中采用自...
关键词:DEEP Web集成技术 信息孤岛 跨库检索 知识发现 
基于关键词相关度的Deep Web爬虫爬行策略被引量:7
《计算机工程》2008年第15期220-222,共3页田野 丁岳伟 
Deep Web蕴藏丰富的、高质量的信息资源,为了获取某Deep Web站点的页面,用户不得不键入一系列的关键词集。由于没有直接指向Deep Web页面的静态链接,目前大多数搜索引擎不能发现这些页面。该文提出的Deep Web爬虫爬行策略,可以有效地下...
关键词:Deep WEB页面 爬行策略 关键词选择 相关度权重 覆盖率 
检索报告 对象比较 聚类工具 使用帮助 返回顶部