DEEP_WEB

作品数:232被引量:453H指数:13
导出分析报告
相关作者:崔志明赵朋朋申德荣孟小峰聂铁铮更多>>
相关机构:苏州大学吉林大学河北大学东北师范大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金教育部科学技术研究重点项目国家高技术研究发展计划国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与应用x
条 记 录,以下是1-7
视图:
排序:
Deep Web接口的自动识别技术研究
《计算机工程与应用》2017年第7期109-114,共6页杨永红 高磊 余航 徐欣辰 
获取Deep Web中信息的主要途径是通过在其提供的查询接口上提交查询来实现的,目前大部分的研究以表单内的
标签获得表单内容结构,判断是不是一个Deep Web查询接口。提出了接口块的概念,设计了一种基于页面信息和视觉信息的...
关键词:DeepWeb接口 文档对象化模型树 接口块 多类分类 
基于抽样的Deep Web模式匹配框架
《计算机工程与应用》2015年第3期117-123,共7页袁淼 王鑫 
安徽省自然科学基金(No.090412051)
针对DCM(Dual Correlation Mining)框架匹配特殊模式集时查准率低下的缺陷,借鉴机器学习领域中的bagging方法,提出一种基于抽样的Deep Web模式匹配框架。该框架随机在模式集中抽取多个子模式集,分别对子模式集进行复杂匹配,集成各个子...
关键词:DEEP WEB 模式匹配 相关性挖掘 抽样 
主题分布在Deep Web数据库选择中的应用
《计算机工程与应用》2013年第10期136-139,215,共5页郑东 施化吉 
国家自然科学基金(No.60572112)
随着越来越多的信息隐藏在Deep Web中,针对用户查询找出最相关的Web数据库成为亟待解决的问题。提出了一种基于Web数据库主题分布的方法用于Deep Web数据集成中的Web数据库选择。获取主题覆盖度形式的Web数据库内容描述,而后利用选定的...
关键词:DEEP WEB Web数据库选择 主题分布 主题覆盖度 
一种Deep Web查询结果的实体抽取方法被引量:4
《计算机工程与应用》2012年第36期160-163,共4页赵海霞 李道申 刘勇 赵嘉诚 
国家自然科学基金(No.70671035)
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结...
关键词:深度网 数据抽取 文件对象模型(DOM)树 索引 相似度 
频繁项集在Deep Web数据源聚类中的应用
《计算机工程与应用》2012年第14期152-157,共6页张蓬飞 朱群雄 
在Deep Web页面的背后隐藏着海量的可以通过结构化的查询接口进行访问的数据源。将这些数据源按所属领域进行组织划分,是DeepWeb数据集成中的一个关键步骤。已有的划分方法主要是基于查询接口模式和提交查询返回结果,存在查询接口特征...
关键词:深层网络 数据源聚类 文本聚类 频繁项集 数据集成 
Deep Web下基于中文分词的聚类算法
《计算机工程与应用》2011年第4期138-140,145,共4页刘荣辉 郑建国 
河南省2009科技发展计划项目(重点项目)基金(No.092102210251)
随着Deep Web飞速的发展,使用商业网站上所提供的查询接口从Web数据库中获取高质量数据并对这些数据进行分析加工处理显得尤为重要。通过动态提交关键词,利用查询接口得到检索页面,对检索页面中的中文信息进行抽取并进行分词处理,对分...
关键词:DEEP WEB 数据抽取 中文分词 TF/IDF 聚类 
基于最大熵分类器的Deep Web查询接口自动判定被引量:1
《计算机工程与应用》2008年第21期133-137,共5页方巍 黄黎 崔志明 
国家自然科学基金( the National Natural Science Foundation of China under Grant No.60673092);2005年度教育部科研重点项目(the Key Project of Chinese Ministry of Education under Grant No.205059);2006 年江苏省“六大人才高峰”项目( the“Six Talent Peak”Project of Jiangsu Province under Grant No.06-E-037);2006 年度江苏省软件和集成电路业专项经费项目(the Specialized Fund Pro-ject for the Software and IC of Jiangsu Province in 2006 under Grant No.[2006]221- 41);2007 年江苏省重点实验室开放基金项目(theProject of Jiangsu Key Laboratory of Computer Information Processing Technology)
Web中包含着海量的高质量信息,它们通常处在网络深处,无法被传统搜索引擎索引,将这样的资源称为Deep Web。因为查询接口是Deep Web的唯一入口,所以要获取Deep Web信息就必须判定哪些网页表单是Deep Web查询接口。由于最大熵模型可以综...
关键词:DEEP Web 网页表单 特征提取 最大熵模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部