检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]长江师范学院数学与计算机学院,重庆408100 [2]中冶赛迪技术股份有限公司
出 处:《计算机时代》2012年第11期1-3,7,共4页Computer Era
基 金:重庆市教委科技基金项目(KJ091315)
摘 要:为了更好地向用户提供个性化的Web检索服务,实现了一种改进的个性化词典的生成算法——IGAUPD,用于在用户浏览的大量兴趣网页中挖掘出真正符合用户兴趣的词语,以此缩小传统词库的容量,使得在用户兴趣建模时,能更快更准确地形成兴趣网页的特征描述,并更好地支持个性化检索。IGAUPD算法采用新的词权计算公式IWTUPD,以更好地描述词语在网页集中的重要性,有效排除频繁词。最后,用实验验证了由IGAUPD算法生成的个性化词典的优势。For the sake of providing better personalizing service of web information retrieval for users,an improved generating algorithm of user personalizing dictionary has been accomplished in the paper,which can be used for mining the terms which can tally with interests of users truly from a mass of web pages that browsed by users,resulting in narrowing the size of traditional dictionary,helping to generate the feature description of interested web pages more quickly and accurately,and supporting the personality retrieval better.The importance of words in the web pages is better described and frequently-used words are excluded more efficiently in the IGAUPD,in which a new formula about the weight of words named IWTUPD has been used.Finally,some experiments have proved the advantages of the user personalization dictionary created by IGAUPD.
关 键 词:个性化词典 频繁词 用户兴趣建模 二级向量 Web检索服务
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15