检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]漳州师范学院计算中心,福建漳州363000 [2]国网信息通信有限公司,北京100053
出 处:《计算机应用》2009年第10期2791-2795,共5页journal of Computer Applications
摘 要:提出了一种新的基于贝叶斯网络对XML文档信息进行查询的模型方法。该模型支持针对XML文档信息的结构化查询。基于XML信息查询的特点,利用XML数据集中语词、元素和结构化单元的统计信息对模型的拓扑结构和条件概率进行了学习;结合概率函数的方法,利用模型的概率推理进程对XML文档和结构化查询条件的相关度进行了估算。最后在基于INEX测试集的实验中证明了该方法的有效性和可靠性。In this paper, a Bayesian model for XML document information retrieval was proposed, supporting content and structure queries. The topology and conditional probabilities of the Bayesian model were mined from the XML document collection by statistics of terms, elements and structural units contained in the collection. Combined with probability functions, the relevance of a document to a given structured query was obtained by an inference process through a complex dependences network of this model. Experimental results on the INEX corpus of XML documents show the validity and reliability.
关 键 词:贝叶斯网络 XML信息检索 结构化查询 概率函数
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.15.229.189