AIS—基于文本挖掘的增强型Web信息处理技术  被引量:3

AIS:An approach to Web information processing based on Web text mining

在线阅读下载全文

作  者:张文[1,2] 唐锡晋[3] 吉田武稔[2] 

机构地区:[1]中国科学院软件研究所互联网实验室,北京100190 [2]北陆先端科学技术大学院大学 [3]中国科学院数学与系统科学研究院,北京100190

出  处:《系统工程理论与实践》2010年第1期96-104,共9页Systems Engineering-Theory & Practice

基  金:国家自然科学基金(70571078)

摘  要:回顾了中文和英文语言环境下的Web文本挖掘现状,阐明了其现阶段的特点和技术瓶颈.之后提出了一种基于Web文本挖掘的网页内容挖掘技术:AIS(Augmented information support),介绍了相关实现所涉及的基础技术和功能.最后将AIS技术应用于香山科学会议网站,开发了AIS4XSSC文本挖掘系统并展示了现阶段其主要功能.实践表明AIS技术能够从大量的Web文本中有效提炼信息,提高用户检索效率并向用户推送有价值的信息.Web text mining (WTM) is a technology for information support as one component of the machine system of HWMSE. Concerning the deficiencies of current search engine for retrieval of WWW, improvements are expected. In this paper, a brief review on recent WTM developments was presented at first. Then a technology on augmented information support, AIS, was proposed to cope with "information explosion" based on WTM technologies. Finally, AIS is applied to the development of the AIS4XSSC (AIS for Xiangshan Science Conference) system, which is customized for information retrieval and knowledge discovery from XSSC Website. The practical application demonstrates that AIS is useful to extract information from Web documents and improve the performance of information retrieval.

关 键 词:WEB文本挖掘 知识发现 AIS 综合集成研讨厅 香山科学会议 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象