检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京大学计算机科学技术系人工智能实验室,北京100871
出 处:《计算机应用研究》2003年第9期65-68,90,共5页Application Research of Computers
摘 要:在当今的信息时代,网上每天都有海量的数字化信息在生成、存储、传播和转换。这种趋势不可避免地加剧了信息获取的困难,如何有效地利用这些海量信息也成为了亟待解决的难题。给出了一个自适应式的海量半结构化数据采集引擎(AEEMSI)的框架,提出了自适应数据模板、数据网关等概念,并利用此结构框架,开发设计出了可投入实际商业应用的运行系统,完成了对Web中的海量半结构化信息进行提取和重新整合的工作。Nowadays,the Internet is becoming an information highway where massive digital information is being created,stored,populated and transformed.It's more and more difficult for people to find valuable information on the Internet.In this article,we show the framework of AEEMSI (Adaptive Extraction Engine based on Massive Semistructural Information) system.And some fresh concepts such as adaptive data template and adaptive data gateway are included in this paper.
关 键 词:信息提取 半结构化数据 自适应数据模板 自适应数据网关
分 类 号:TP247.2[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145