基于时序话题模型的新事件检测  被引量:3

New Event Detection based on Temporal Topic Model

在线阅读下载全文

作  者:仓玉 洪宇 姚建民 朱巧明 CANG Yu, HONG Yu, YAO Jianmin, ZHU Qiaoming (School of Computer Science and Technology, Sooehow University, Suzhou, Jiangsu 215006, China)

机构地区:苏州大学计算机科学与技术学院,江苏办州215006

出  处:《智能计算机与应用》2011年第1X期74-78,共5页Intelligent Computer and Applications

基  金:基金项目:国家自然科学基金(60970057,61003152).

摘  要:新事件检测(NewEventDetection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻。初步实验发现,构成事件的一项重要属性是事件发生的特定时间,因此时间是区分不同事件的重要标志。为此,提出时序话题模型(TemporalTopicModel,简称TTM)。TYM将话题和报道切分为若干对应不同时间表达式的事件。其中,时间表达式描述事件发生的特定时间。TTM基于时间表达式在话题中出现的频率和增长率,估量对应时间表达式的事件作为种子事件或相关新颖事件的概率。此外,时间表达式的频率与增长率也用于衡量事件在相关性匹配中权重。在此基础上,NED依赖时间特性快速遏制不同时间发生的事件匹配,并借助种子事件和新颖事件调整相关性判定的权重分配。New event detection (NED) is aimed at detecting the one being reported on a new event from one or multiple streams of news stories. Preliminary experiments show that the particular time of the events' occurrence is one of the important attributes that form the event. This paper pro- poses the Temporal Topic ModeI(TTM). TTM divides the topics and news into some events according to different time expressions which describe the particular time of the events' occurrence. TTM estimates probability of the time expressions as the key event or dependent novel event based on the frequency and growth rate in topics. The time expressions' frequency and growth rate are also used for mcisaring the weight of event in the relevance matching. On that basis, NED relies on time behavior to suppress the events matching occur in different time quickly and adjusts the weight distribution of relevance determination with the key event and novel event.

关 键 词:新事件检测 时间表达式 时序话题模型 

分 类 号:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象