基于特定领域的Web文本信息获取系统的研究  被引量:3

Research and Design of a Special Field-based Text Information Achieving System on Web

在线阅读下载全文

作  者:赵栓柱[1] 陈俊杰[1] 

机构地区:[1]太原理工大学信息工程学院,山西太原030024

出  处:《太原理工大学学报》2006年第2期165-168,共4页Journal of Taiyuan University of Technology

摘  要:从特定领域用户获取Web文本信息的实际应用角度出发,在分析了系统相关开发理论基础上,通过从内容和语义上指导Web信息的搜索,尝试设计了一个基于特定领域的Web文本信息获取系统模型,并从实现技术上提出了开发这个系统的体系结构,分析了各组成模块的主要特点及其功能。着重研究了该系统的几项关键技术:Robot技术、Web页面内容的分析和站点结构的分析技术、中文文本的分类问题,包括中文的分词、特征提取、特征匹配及权值计算等的综合应用技术。This paper discusses the development of a text information achieving system from the application requirement of specific-field users, and attempts to design a frame structure for them to obtain the needed web text quickly and intelligently. We also analyze the basic developing principle related to the system and the main characteristics and functions of each module composing the system from the implement technology. At the same time, the key technologies to realize the system is also discussed in detail, such as robot technology, analysis of Web page content, the hyperlink structure and Chinese text classification, which includes Chinese words segmentation, feature extraction, feature match and wight value calculating technology etc.

关 键 词:Web文本信息 特定领域 分类系统 中文分词 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象