检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中山大学教育学院,广东广州510275 [2]广东工业大学计算机学院,广东广州510006
出 处:《计算机工程与科学》2014年第8期1609-1614,共6页Computer Engineering & Science
基 金:国家自然科学基金资助项目(60970044);广东省自然科学基金资助项目(S2011040004281)
摘 要:针对通用搜索引擎缺乏对网页内容的时态表达式的准确抽取及语义查询支持,提出时态语义相关度算法(TSRR)。在通用搜索引擎基础上添加了时态信息抽取和时态信息排序功能,通过引入时态正则表达式规则,抽取查询关键词和网页文档中的时态点或时态区间等时态表达式,综合计算网页内容的文本相关度和时态语义相关度,从而得到网页的最终排序评分。实验表明,应用TSRR算法可以准确而有效地匹配与时态表达式相关的关键词查询。General search engine lacks of extraction and retrieval of temporal semantic from the text content of the Web pages.To address the temporal query problem,the Temporal Semantic Relevancy Ranking (TSRR) algorithm is proposed by integrating the temporal information extraction and ranking functions.Firstly,the rule of the temporal regular expression is introduced to extract the temporal points or temporal intervals from the query keywords and the text content of the web pages.Secondly,the scores of web pages are re-evaluated and the returned results are ranked according to the text relevancy and the temporal semantic relevancy.Experiments show that the TSRR algorithm precisely and effectively matches the keywords queries related to the temporal expression.
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15