面向三类查询意图歧义性的查询表达式自动识别研究  被引量:3

Query Classification of Three Types of Ambiguity Intent

在线阅读下载全文

作  者:桂思思 徐健[1] GUI Si-si;XU Jian(Nanjing Agricultural University,Nanjing 210095,China)

机构地区:[1]南京农业大学信息管理学院,江苏南京210095

出  处:《情报科学》2021年第11期90-95,共6页Information Science

基  金:国家社会科学基金青年项目“面向学术搜索的查询意图研究”(19CTQ023)。

摘  要:【目的/意义】针对查询意图歧义性自动识别,探讨特征有效性及采用不同分类算法识别三类查询意图歧义性的分类准确率,以期对后续研究提供借鉴与指导。【方法/过程】首先提出了一个面向查询意图歧义性的查询表达式分类体系;随后,构建了查询表达式特征及相关文档特征共六类;最后,分别采用决策树算法、神经网络算法及k最邻近算法,探讨采用不同特征组合的有效性及不同分类算法的分类准确率。【结果/结论】(1)分类准确率较基准实验提升比例为49.5%;(2)使用查询表达式特征分类优于使用相关文档特征;(3)决策树的分类准确率略高于其他两类分类算法。【创新/局限】构建了一个面向查询意图歧义性的查询分类体系;完成了面向三类查询意图歧义性的分类任务;然限于数据集获取途径,仅对200数据验证。【Purpose/significance】This paper investigates the effectiveness of classification features and compares the performance of three classifiers in a query ambiguity intent classification task.【Method/process】This paper first constructs a query taxonomy of ambiguity and then extracts query-based features and document-based features.Later,it tests accuracy,using decision tree,neural network,k-nearest neighbor individually,with various combinations of features.【Result/conclusion】(1)An accuracy is increased by 49.5%compared with the baseline;(2)Compared with document-based features,using query-based features achieves better accuracy;(3)Decision tree performs best among the tested classifiers.【Innovation/limitation】A query taxonomy of ambiguity is constructed;A query classification task based on three types of ambiguity is realized;Due to dataset accessibility,our experiments are done on a limited size dataset.

关 键 词:查询意图 歧义性 自动分类 特征构建 效果测评 

分 类 号:G254[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象