检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《中文信息学报》2016年第2期121-127,共7页Journal of Chinese Information Processing
基 金:国家重点基础研究发展规划(973计划)项目(2014CB340406;2012CB316303;2013CB329602);国家自然科学基金(61173064);国家科技支撑计划项目(2015BAK20B03);国家科技支撑计划课题(2011BAH11B02;2012BAH39B04);国家242专项(2012F86)
摘 要:现有方法没有有效利用查询文本特征、点击行为和session信息来挖掘用户的搜索意图,获取的查询特征对于多意图查询在不同意图下的区分度不足,对于多意图查询的相关查询聚类效果不佳。针对以上问题,该文提出了基于查询图信息的GPLSI模型,并利用该模型学习所得的查询特征进行查询聚类。基于查询图信息的GPLSI模型利用查询的词语、点击和session共现现象,从查询的文本特征、点击行为和session信息等多个方面来模拟查询意图的产生和表现,学习查询在不同搜索意图上的概率分布。最后,实验结果验证了基于查询图信息的PLSI模型用于查询相似度计算和多意图查询聚类中的有效性。This paper proposes a probabilistic latent semantic indexing model based on query graph(GPLSI)to learn query features for query clustering in this paper.GPLSI for query-word co-occurrence and query-query co-occurrence simulates the generation of query intent and its representation based on query text,click and session information,and learns the probability distribution of query on different intents.Experimental results illustrate GPLSI's effectiveness in query similarity measurement and multi-intent query clustering.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145