检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李齐会[1]
机构地区:[1]武汉理工大学计算机科学与技术学院,武汉430063
出 处:《计算机与数字工程》2009年第3期131-134,共4页Computer & Digital Engineering
摘 要:互联网的飞速发展,给人类带来了海量的可供访问信息,但是,现今搜索引擎索引的绝大部分是表层SurfaceWeb网的信息,限于一些技术原因,搜索引擎几乎无法索引到Deep Web网中的信息。由于查询接口是Deep Web的唯一入口,但并非所有的网页表单都是查询接口,为了能充分利用Deep Web后台数据库信息,首先要找到进入Deep Web后台数据库的入口,所以对查询接口的正确判定至关重要。文中介绍了利用决策树C4.5分类算法自动判定网页表单是否为DeepWeb查询接口的方法。The rapid development of the Internet brought a mass of information, but the search engine indexed most of the Surface Web, limited to a number of technical reasons, the search engine was almost impossible to index Deep Web. The query interface was the only entrance to the Deep Web, but not all of the web forms were query interfaces. In this paper, using C4.5 decision tree classification algorithm automatic web form to determine whether the Deep Web query interface.
关 键 词:DEEP WEB 查询接口 网页表单 决策树C4.5分类算法
分 类 号:TP393.03[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117