Java XML与面向Web的智能数据抽取  被引量:8

Intelligence Data Extraction Based on Java XML and Web

在线阅读下载全文

作  者:文艺[1] 刘循[1] 

机构地区:[1]四川大学计算机学院,成都610065

出  处:《四川大学学报(自然科学版)》2004年第2期315-318,共4页Journal of Sichuan University(Natural Science Edition)

摘  要:采用标准Web技术———HTML,XML和Java,开发一种基于Web用Java把Web数据转换为XML的数据挖掘方法.该方法标识数据源并把它映射成XHTML,根据一定的相关关系查找数据内的引用点并进行智能数据抽取,将数据映射成XML.这种数据抽取方法比较简单,通过选择可靠的数据源以及在这些数据源中选取与内容相关但与格式无关的锚点,可以较为方便地建立一个强壮的数据抽取系统.A method for web-based data mining is developed using the standard technologies of the web--HTML,XML, and Java. convert existing web pages into XML with XML. The data extraction method is very simple only by selecting some reliable data resources and anchor-points which are dependent on those data resources and content of web pages, but independent of the form of web pages.

关 键 词:XML XEITML XSL 数据抽取 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象