基于Swing的HTML解析器的实现与应用  

Implementation and Application of HTML Parser Based on Swing

在线阅读下载全文

作  者:宋宇[1] SONG Yu(Library of Nanjing University of Chinese Medicine,Nanjing,Jiangsu Province,210023 China)

机构地区:[1]南京中医药大学图书馆,江苏南京210023

出  处:《科技资讯》2024年第14期43-45,49,共4页Science & Technology Information

摘  要:HTML页面解析是一切工作的基础。首先,通过分析HTML解析器感兴趣的标签与超链接的分类,在Java的Swing包的基础上实现了一个HTML解析器,用来提取HTML文档的超链接和锚文本;其次,把HTML解析器应用到多媒体信息检索系统的搜索器Spider的开发中,通过设定若干个种子网站,选择合适的搜索算法,从中筛选出包含音频、视频和Flash动画的Web页面,并将其存放在数据库中。HTML page parsing is the foundation of all work.By analyzing the tags and classification of hyperlinks that HTML parsers are interested in,an HTML parser has been implemented based on Java's Swing package to extract hyperlinks and anchor text from HTML documents;Then,the HTML parser is applied to the development of the search engine Spider for multimedia information retrieval systems.By setting several seed websites and selecting appropriate search algorithms,web pages containing audio,video,and Flash animations are filtered out and stored in a database.

关 键 词:解析器 HTML SWING 超文本链接 链接文本 

分 类 号:G250[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象