检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]武汉大学计算机学院
出 处:《石油工业计算机应用》2003年第2期36-38,5,共3页Computer Applications Of Petroleum
摘 要:HTML是当前编写网页使用的最多的语言,如何利用HTML这种标记性语言的特点,让计算机提供给用户快速的获取知识的途径成为许多计算机工作者的一大难题。文章介绍一个有效的从互联网上提取知识的方法供大家参考。这种方法可分成4个途径:①规范化基于HTML的网页脚本;②将网页结构和内容用一棵内容树表示;③比较相似网页的内容树生成提取规则;④将规则和下载程序结合得到最终的知识获取软件。HTML is currently the most popular language used to edit webpages. The computer engineers are faced with a big issue of how to utilize the characteristics of the HTML markup language to help the users rapidly access information on the Internet. The paper introduces an effective approach of acquiring information from the Internet, which includes 4 processes: (1) HTML-based normalization webpage script;(2)the webpage structure and content can be expressed with one content tree; (3)the acquisition rule is generated by comparing the similar content trees;(4)The rule and download procedure are incorporated to obtain the final knowledge acquisition software.
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.236