一种无结构P2P系统中基于层次兴趣树的语义检索机制  被引量:3

A HIT-Based Semantic Search Approach in Unstructured P2P Systems

在线阅读下载全文

作  者:徐泉清[1] 代亚非[1] 崔斌[1] 

机构地区:[1]北京大学区域光纤通信网与新型光通信系统国家重点实验室,北京100871

出  处:《北京大学学报(自然科学版)》2010年第1期17-29,共13页Acta Scientiarum Naturalium Universitatis Pekinensis

基  金:国家重点基础研究发展计划项目(2004CB318204);国家自然科学基金(60673183);高等学校博士学科点专项科研基金(20060001044)资助

摘  要:提出了一种无结构P2P系统中有效的语义检索方法:基于层次兴趣树(HIT)的语义检索。每个节点中所有的文档根据分类目录被分类成层次兴趣树,并发送至该节点所属的超级节点。同时,每个类中前n个关键词的倒排文档索引,也会依据它们的χ2统计值被发送至超级节点。当节点发送一个查询并给出类别语义相似性阈值Simth时,查询消息通过一个有效的查询路由算法被转发,结果则通过搜索HIT返回。不同的节点可以给出各自不同的Simth,其灵活性可以为每个节点提供更好的个性化服务。实验表明在无结构的P2P系统中,基于HIT的语义检索方法比以前的方法具有更好的准确性和有效性。An effective semantic search approach based on hierarchical interest tree (HIT) is proposed in unstructured P2P systems. Documents owned by a peer are classified into categories to build a HIT, which is sent to a super peer. Meanwhile, the 2 inverted document index (IDI) of top n terms for each category is also sent to a super peer according to their Chi-square (x^2) statistic values. When a regular peer sends a query and gives a category semantic similarity threshold Simth, query messages are forwarded via an effective query routing algorithm and the results are returned by searching HIT. It is flexible for each peer since it can set the Simth which can provide a better personal service. The experiments show that HIT-based semantic search approach is more accurate and efficient than previous methods.

关 键 词:P2P 语义检索 层次兴趣树 查询路由 语义相似性 

分 类 号:TP393.02[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象