检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京理工大学计算机科学工程系人工智能研究所,北京100081
出 处:《计算机工程与应用》2002年第23期110-113,共4页Computer Engineering and Applications
摘 要:为了提高Internet上的信息搜索效率,基于内容的搜索引擎成为迫切的用户需求。但内容信息的手工获取是一项繁重的工作。从文本或半结构化文档中自动地抽取用户关心的内容信息且表示成计算机能理解的形式是一项极具实用价值的挑战性研究。该文从知识表示与推理的角度研究了提高信息抽取智能性的途径,提出了将Ontology与模板规则相结合的技术,并针对线性模板表示的局限提出了基于二侧树结构的模板规则表示,同时实现了此表示下的假设生成———冲突消解推理。该技术成功地应用于招聘广告的信息抽取。To make information searching across Internet more efficient ,content-based search engine become s more and more efficient.However,the manual marking-up of content information is a laboring work.Automatic extraction of content information from text or semi -structured documents is a demanding and challenging technology.This paper aims at enhancing the intelligence of information extraction systems with improved knowledge representation techniques.It proposes to combine the Ontology representation with pattern rules,and to use bi -side tree as the structure of composing a pattern from pattern elements in replace of traditional sequential structure.In such representation,an information -extraction engine based on hypothesis -generation&conflict -resolution procedure is implemented.The proposed technique is successfully applied to information extraction system for job-recruitment advertisements.
关 键 词:Oontology 信息抽取 INTERNET 搜索引擎 模板规则
分 类 号:TP393.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229