检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:任娟 Ren Juan(Yuncheng County Medical Security Bureau,Heze,China)
机构地区:[1]郓城县医疗保障局,山东菏泽
出 处:《科学技术创新》2024年第1期110-113,共4页Scientific and Technological Innovation
摘 要:文章利用模板化信息提取算法,在规则生成器识别出目标实体分隔符后,运用模板生成器实现分割标记在模板中的有效配置,而后再运用信息抽取器按照生成的模板提取所需的信息。而后对Web信息智能抽取系统进行了测试分析,通过与其他信息抽取系统对比发现,此系统可根据模板完成各类网页信息的快捷、准确抽取,具有信息抽取精准、信息召回率高、信息提取高效的优势。In this paper,template-based information extraction algorithm is used.After the target entity separator is identified by the rule generator,the template generator is used to realize the effective configuration of segmentation marks in the template,and then the information extractor is used to extract the required information according to the generated template.Then,the Web information intelligent extraction system is tested and analyzed.Through comparison with other information extraction systems,it is found that this system can complete the fast and accurate extraction of various webpage information according to the template,and has the advantages of accurate information extraction,high information recall rate and efficient information extraction.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.127.79