检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《重庆邮电大学学报(自然科学版)》2012年第6期788-791,共4页Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition)
基 金:国家自然科学基金(61003256);中国博士后基金(20110490082);重庆市教委科技项目基金(KJ120506);重庆邮电大学自然科学基金(A2011-20)~~
摘 要:基于MEDL模型提出了一种以内容为导向的,将HTML转换为XML数据的方法。在该方法中,根据网页中值域和属性域的识别,并结合MEDL模型对HTML中的数据进行提取,并将其转换为符合要求的格式。该方法具有提取信息精确、转换格式统一等优点,且具备很好的扩展性,能够为深入开展Web数据挖掘提供很好的支持。A content-oriented method of converting information from HTML to XML base on MEDL model is proposed.The presented method identifies information according to attribute area and value area,extracts HTML data based on the MEDL model,and obtained the final data with the structured format.The proposed method has high accuracy of extracting information.The extracted information based on this method has unified format.This method has good scalability and can provide good support for Web Data Mining.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.173