检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]天津大学系统工程研究所,天津300072 [2]河北大学数学与计算机学院,河北保定071002 [3]河北大学图书馆,河北保定071002
出 处:《计算机工程》2011年第13期43-45,共3页Computer Engineering
基 金:中国博士后科学基金资助项目(20070420700)
摘 要:分析结构化文档的表示方法及检索特点,对一种用于结构化文档检索的贝叶斯网络进行研究。讨论该贝叶斯网络的构造方法、概率估计及推理过程。用网络节点表示文档索引术语和结构单元,用弧表示术语和结构单元的隶属关系,根据TF-IDF方法估计各节点的先验概率,当给定一个查询时,通过计算每个结构单元的条件概率得到该结构单元的相关值。实例验证了该贝叶斯网络的有效性。This paper analyzes the representation method and characteristics of retrieval,studies a Bayesian network for structured document retrieval.It discusses the construct method and probability estimates of Bayesian network,and the retrieval process.Index terms and structural units can be represented by nodes,relationship among nodes can be described by arcs,and prior probability of nodes can be estimated according to TF-IDF.The relevance of each structural unit can be computed and ranked by its conditional probability when a user query is given.Example proves the effectiveness of the Bayesian network
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145