2005年863网页检索ICST评测报告  被引量:1

863 Web Track(2005) Experiments at ICST-PKU

在线阅读下载全文

作  者:程羽心[1] 路斌[1] 刘缙[1] 杨建武[1] 马龙[1] 

机构地区:[1]北京大学计算机研究所,100871

出  处:《中文信息学报》2006年第B03期102-106,共5页Journal of Chinese Information Processing

摘  要:2005年863评测任务是在CWT100G这个90G的数据桑上检索相关网页。评测给出了50个包含title、dese、narr的主题,要求根据这些主题自动和人工生成查询。ICST在这次评测中使用了倒排索引技术蛤数据桑建索引,通过给多个查询调整权重和多个文档查询域调整权重的方法,综合给出网页的得分。2005年的评测结果显示,排在最前的一些网页大部分是相关网页,前10个结果的准确率超过了50%。召回率也达到了30%以上。评测结果也表明,手工选词生成查询的结果要优于自动生成的查询。The task of 863 web track(2005) is to find relative pages from CWT100G, which contains 90GB Chinese web pages. The queries are made from 50 topics either by machine or by manual. Inverted list index are used by ICST to build indices. By tuning the weights of queries and the importance of fields, the scores of web pages are given. The result shows that the most high-scored pages are most probably desired. And the queries written by manual are better than those spawned by machine. The P@ 10 measure is higher than 50%, and the recall is over 30%.

关 键 词:相关检索 863评测 CWTl00G 查询生成 域查询 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象