检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院合肥智能机械研究所
出 处:《微电子学与计算机》2008年第6期18-21,共4页Microelectronics & Computer
基 金:国家“八六三”计划项目(2006AA102237);国家科技支撑计划项目(2006BAD10A1410)
摘 要:讨论了信息抽取的必要性及其现状,并提出一个基于多Agent技术的分布式信息抽取系统模型.系统主要有信息抽取Agent、数据清洗Agent、数据保存Agent等以及相应的知识库组成.并采用分而治之的思想,把信息抽取中遇到的问题分解,分配到各个Agent去完成.提出一种新的规则表示方法,抽取规则可以根据网页结构进行调整,该系统具有一定的自适应性.The information extraction necessity and the present situation is discussed, and a distributed information extraction system model based on the multi-agent technology is proposed. This system is composed of the user interface agent, the agent manager, the information extraction agent, the data clean agent; the data preserves agent and corresponding knowledge library. Using thought called divide and conquer, the question which was met in process of information extraction is decomposed and assigned to each agent to solve. At the same time, the extraction rules are able to adjust themselves to the homepage structure; this system has certain adaptability.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.15.3.240