检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈华城[1] 杜学绘[1] 陈性元[1] 夏春涛[1]
机构地区:[1]解放军信息工程大学电子技术学院,郑州450004
出 处:《计算机应用研究》2013年第4期1187-1190,共4页Application Research of Computers
基 金:国家"973"计划资助项目(2011CB311801);河南省科技创新人才计划资助项目(114200510001)
摘 要:传统的XML文档检索方法主要是基于关键词匹配的检索,忽略了关键词的语义信息和蕴涵于信息组合中的潜在信息。针对上述问题,提出了基于D-S证据理论的XML文档潜在信息的获取算法。该算法通过引入本体定义了概念间的语义关系和信息的组合方式,提出了基于D-S证据理论的检索模型和指标权重的计算方法,并结合似然函数设计了一个动态的阈值,有效地消除语义匹配过程中存在的不确定性,解决了信息组合中潜在信息的获取问题。此外,还将该算法应用于电子政务领域个人和企业敏感信息的检测中,实验证明了该算法比传统的方法有着更高的查准率和查全率。Traditional XML document retrieval methods are mainly based on keywords' ' match,which ignore Key words' semantics and latent information contained in information combination.This paper proposed an algorithm of XML document latent information extraction based on D-S evidence theory.Firstly it used ontology to define the relationships between semantic concepts and the combination mode,and next proposed a retrieval model based on D-S evidence theory.Then it presented the computation of evidence weight,and finally designed a dynamic threshold with plausible function.It solved the problems of uncertainty in semantic match and retrieve of latent information.Furthermore,it presented the algorithm's application in the detection of personal and enterprises' sensitive information in e-government domain.The experiment proves that the proposed algorithm has higher precision and recall.
关 键 词:D-S证据理论 可扩展标记语言 潜在信息 本体 动态阈值
分 类 号:TP393.08[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.184