检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李雪伟[1] 吕学强[1] 董志安[1] 刘克会[2,3]
机构地区:[1]北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101 [2]北京理工大学管理与经济学院,北京100081 [3]北京城市系统工程研究中心,北京100035
出 处:《北京大学学报(自然科学版)》2015年第2期220-226,共7页Acta Scientiarum Naturalium Universitatis Pekinensis
基 金:国家自然科学基金(61271304);北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037);北京市科学技术研究院创新工程(PXM2013-178215-000004)资助
摘 要:针对查询分类问题,借助互联网中人工组织的分类网站领域URL,利用URL-key在各个类别中使用的频度,提出基于方差的领域URL-key识别方法,利用机器翻译、拼音翻译和搜索结果反馈等技术对URL-key进行过滤,构建领域URL-key。然后结合伪相关反馈技术,选取URL-key为特征,构建URL-key向量,利用SVM对查询串进行分类。实验结果表明,该方法不仅F值比对比方法提高7%,而且资源的使用也远远小于对比方法,提高了系统的时效性。For the problem of query classification, a variance based method is proposed to identify domain URL- key by the domain URL organized manually from aggregator sites and the use frequency of URL-key in each category. Then, the URL-key is filtered by using machine translation, pinyin and search results feedback technology. Finally, coupled with relevance feedback, the authors classify the query by selecting the URL-key as feature and establishing the URL-key vector with a SVM multi-class classifier. Experimental results show that the proposed method uses less resources and the F-value is 7% higher than contrast method.
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49