检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]内蒙古农业大学计算机学院,呼和浩特010018 [2]内蒙古农业大学理学院,呼和浩特010018
出 处:《内蒙古农业大学学报(自然科学版)》2012年第4期218-222,共5页Journal of Inner Mongolia Agricultural University(Natural Science Edition)
基 金:教育部"春晖计划"项目(Z2009-1-01062);内蒙古自然科学基金项目(2010BS0902);国家核高基项目(2010ZX01036-001-001)
摘 要:如何从互联网Web页面中快速、准确获得用户感兴趣的数据内容成为信息抽取领域的研究热点。本文总结现有Web信息抽取分类方法,并提出按用户参与程度对Web信息抽取系统进行分类的方法,分为人工创建系统、用户监督系统和无人监督系统,并从7个方面对Web信息抽取系统进行分析、比较。How to obtain accurate and efficient information from the web has been a hot spot in information extraction field. This paper summarizes the classification method of the existing web information extraction, and classifies these web information extraction systems according to user's participation level, divides these web infolanation extraction systems into Manual - created systems, User - superv/sed systems and Un - supervised systems, and this paper analyzes and compares these web information extraction systems from seven aspects.
关 键 词:WEB信息抽取 WEB信息抽取系统 ACME DOM HYPERTREE ILP 模板
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229