时态信息的语义抽取与排序方法研究及系统实现  被引量:3

Study on extraction and ranking of temporal semantics and system implementation

在线阅读下载全文

作  者:舒忠梅[1] 左亚尧[2] 张祖传[2] 

机构地区:[1]中山大学教育学院,广东广州510275 [2]广东工业大学计算机学院,广东广州510006

出  处:《计算机工程与科学》2014年第8期1609-1614,共6页Computer Engineering & Science

基  金:国家自然科学基金资助项目(60970044);广东省自然科学基金资助项目(S2011040004281)

摘  要:针对通用搜索引擎缺乏对网页内容的时态表达式的准确抽取及语义查询支持,提出时态语义相关度算法(TSRR)。在通用搜索引擎基础上添加了时态信息抽取和时态信息排序功能,通过引入时态正则表达式规则,抽取查询关键词和网页文档中的时态点或时态区间等时态表达式,综合计算网页内容的文本相关度和时态语义相关度,从而得到网页的最终排序评分。实验表明,应用TSRR算法可以准确而有效地匹配与时态表达式相关的关键词查询。General search engine lacks of extraction and retrieval of temporal semantic from the text content of the Web pages.To address the temporal query problem,the Temporal Semantic Relevancy Ranking (TSRR) algorithm is proposed by integrating the temporal information extraction and ranking functions.Firstly,the rule of the temporal regular expression is introduced to extract the temporal points or temporal intervals from the query keywords and the text content of the web pages.Secondly,the scores of web pages are re-evaluated and the returned results are ranked according to the text relevancy and the temporal semantic relevancy.Experiments show that the TSRR algorithm precisely and effectively matches the keywords queries related to the temporal expression.

关 键 词:时态语义 信息抽取 排序 搜索引擎 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象