检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:昝红英[1] 苏玉梅[1] 孙斌[1] 俞士汶[1]
机构地区:[1]北京大学计算语言学研究所
出 处:《中文信息学报》2003年第5期27-33,共7页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(69973005);863资助项目(2001AA14040);北大-IBM创新研究院资助项目
摘 要:本文介绍了北京大学天网知名度系统的设计与开发工作,重点论述了中文名人网页相关度评价的因素、算法和相应的检索结果。针对目前搜索引擎服务的不足之处,该工作旨在改进网上信息服务的质量,提高个性化网上信息服务的能力。本系统在北京大学天网搜索引擎的基础上,利用自然语言处理、特别是中文信息提取的新技术,结合网页信息的特点,针对名人网页的检索提出了一种新的网页相关度评价算法,改善了检索结果排序的合理性,提高了名人网页检索服务的质量。This paper introduced the design and implementation of Tianwang Fame System. It mainly discussed on the factors and algorithms that affect matching of a named entity with Chinese webpages' relevance evaluation on the celebrities. Aiming at shortages of the current Search Engines, the project is to improve the quality of the web information services, and to enhance the ability of the personalizing services. Based on the Tianwang Search Engine of Peking University, the Fame System adopted new techniques in Nature Language Processing, especially in Chinese information extraction according to the features of webpage information. The paper proposed a new method to the relevance evaluation of webpages against attributes of named enties. This method optimizes the order of the search results, and improves the service quality of Tianwang Fame System.
关 键 词:计算机应用 中文信息处理 相关度 检索服务 信息提取 特征信息
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249