检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院计算技术研究所软件室,北京100080
出 处:《微电子学与计算机》2004年第1期1-6,共6页Microelectronics & Computer
摘 要:从企业网页中抽取与企业相关的信息是商业上的实际需求,与之相关的研究既有挑战,又有理论意义。文章提出了一个能对中文网页中企业的各种不同类型的属性信息进行抽取的模型,并实现了一个企业相关属性信息抽取系统—CAIES。对该系统进行的测试结果统计表明,它不仅能够满足从网上获取企业竞争情报的实际需求,而且具有较高的抽取正确率与精确率。To extract the corporation attribute information from the Web pages of different corporation websites is a factual business demand and the researching about it is also a challenge to us.This paper discusses the key techniques used in the process of extracting these different kinds of corporation attribute information and introduced the design and implementation of an information extraction system-CAIES(Corporation Attributes Information Extraction System).Experiments show that CAIES can do well in extracting different kinds of corporation attribute information.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222