检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西安理工大学自动化与信息工程学院,西安710048
出 处:《计算机工程与应用》2007年第25期172-174,191,共4页Computer Engineering and Applications
基 金:国家部委预研演示验证项目。
摘 要:从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,因此引入局部密集因子LDF(Local Density Factor)的概念。为了解决Web内容的重叠性,基于切平面的概念提出了一种新的主题提取算法(CPTDA)。CPTDA不但可以发现用户最感兴趣的主题页面集合,还可以发现与查询相关的其他页面集合。在10个查询上的实验结果表明,与HITS算法相比,CPTDA算法不仅可以减少30%-52%的主题漂移率,而且可以发现与查询相关的多个主题。To interpret the procedure of hypertext induced topic search based on a semantic relation model,the reason about the topic drift of HITS has been found that Web pages are projected to a wrong latent semantic basis.A new concept LDF(Local Density Factor) has been introduced and based on cut-plane a new topic distillation algorithm CPTDA(Cut-Plane based Topic Distillation Algorithm) has been presented to improve the quality of topic distillation.CPTDA has been applied not only to avoid the topic drift,but also to explore relative topics of user query.The experimental results on 10 queries show that CPTDA reduces topic drift rate by 30% to 52% compared to that of HITS,and discovers several relative topics to queries that have multiple meanings.
关 键 词:局部密集因子 切平面 超链归纳主题搜索 主题提取 主题漂移
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31