一种无指导的子主题挖掘方法  被引量:1

An Unsupervised Approach to Subtopic Mining

在线阅读下载全文

作  者:郭程[1] 白宇[1] 郑剑夕 蔡东风[1] 

机构地区:[1]沈阳航空航天大学知识工程研究中心,辽宁沈阳110136

出  处:《中文信息学报》2016年第1期50-55,共6页Journal of Chinese Information Processing

基  金:国家科技支撑计划(2012BAH14F00);国家973计划(2010CB530401)

摘  要:为了解决用户查询经常存在表意模糊或歧义性等问题,明确用户的查询意图,该文提出了一种无指导的子主题挖掘方法。该方法首先在检索结果文档集中利用ATF×PDF模型挖掘候选主题词;其次,为保证子主题的多样性,该文基于HowNet语义相似度方法对候选主题词进行了层次聚类分析,进而得到潜在主题;最后,利用LCS算法生成多样性子主题。实验结果显示,系统平均D#-nDCG@10达到0.573,结果说明该方法在明确查询主题表意方面取得了较好效果。To deal with the vagueness and ambiguity in the user queries,this paper proposed an unsupervised approach to subtopic mining for user intents.Firstly,this method uses ATF × PDF model to extract candidate topic words in the search results.Then,it groups the latent topics via hierarchical clustering based on the HowNet semantic similarity.Finally,the method employs the LCS algorithm to generate diversified subtopics.The experimental results show an average score of 0.573 according to D#-nDCG@10index.

关 键 词:子主题挖掘 查询意图 潜在主题 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象