利用URL-Key进行查询分类  被引量:2

Query Classification by Using URL-Key

在线阅读下载全文

作  者:李雪伟[1] 吕学强[1] 董志安[1] 刘克会[2,3] 

机构地区:[1]北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101 [2]北京理工大学管理与经济学院,北京100081 [3]北京城市系统工程研究中心,北京100035

出  处:《北京大学学报(自然科学版)》2015年第2期220-226,共7页Acta Scientiarum Naturalium Universitatis Pekinensis

基  金:国家自然科学基金(61271304);北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037);北京市科学技术研究院创新工程(PXM2013-178215-000004)资助

摘  要:针对查询分类问题,借助互联网中人工组织的分类网站领域URL,利用URL-key在各个类别中使用的频度,提出基于方差的领域URL-key识别方法,利用机器翻译、拼音翻译和搜索结果反馈等技术对URL-key进行过滤,构建领域URL-key。然后结合伪相关反馈技术,选取URL-key为特征,构建URL-key向量,利用SVM对查询串进行分类。实验结果表明,该方法不仅F值比对比方法提高7%,而且资源的使用也远远小于对比方法,提高了系统的时效性。For the problem of query classification, a variance based method is proposed to identify domain URL- key by the domain URL organized manually from aggregator sites and the use frequency of URL-key in each category. Then, the URL-key is filtered by using machine translation, pinyin and search results feedback technology. Finally, coupled with relevance feedback, the authors classify the query by selecting the URL-key as feature and establishing the URL-key vector with a SVM multi-class classifier. Experimental results show that the proposed method uses less resources and the F-value is 7% higher than contrast method.

关 键 词:查询分类 URL URL-key 伪相关反馈 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象