基于HTML结构的Web文本主题挖掘研究  被引量:1

Research of Web Text Mining Based on HTML Modal

在线阅读下载全文

作  者:隋丽萍[1] 徐承韬[1] 李瑞芳[1] 

机构地区:[1]沈阳化工学院计算机学院,辽宁沈阳110142

出  处:《电脑与电信》2007年第1期47-51,共5页Computer & Telecommunication

摘  要:随着数据挖掘应用的深入,非结构化和半结构化数据的挖掘,将成为下一个数据挖掘应用的热点。文本挖掘是一种典型的非结构化数据挖掘,而Web挖掘则是典型的半结构化数据挖掘。所以将信息处理技术中的汉语分词、信息抽取、语义分析等技术应用到Web挖掘研究技术是必然的发展趋势。本文根据Web挖掘的特点,运用数据抽取进行数据结构转换并把语义分析技术应用到数据抽取的过程中的思想,以便使数据提取更加准确。This paper focuses on the key technology in information Processing of Chinese and uses this technology for web text mining. It has become an inevitable trend to apply the Chinese word segmentation information processing technologies, information extraction and semantic analysis technologies to the study of Web mining technology. So,, according to the characteristics of Web mining, data extraction will be used for data structure conversion and the semantic analysis technology will be apply to data extraction processing so as to ensure the accuracy of the data extraction.

关 键 词:数据挖掘 WEB 自动分词 数据提取 语义分析 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象