基于短文本的食源性疾病事件探测技术  被引量:1

Foodborne diseases event detection based on short text

在线阅读下载全文

作  者:祝天刚 郭旦怀[1] 王学志[1] 黎建辉[1] 周园春[1] 

机构地区:[1]中国科学院计算机网络信息中心,北京100190 [2]中国科学院大学,北京100049

出  处:《大数据》2016年第2期88-99,共12页Big Data Research

基  金:国家自然科学基金资助项目(No.91224006);国家"十二五"科技支撑计划资助项目(No.2013BAD15B02);中国科学院战略性先导专项资助项目(No.XDA06010307);国家卫生和计划生育委员会行业专项资助项目(No.201302005)~~

摘  要:微博数据是短文本事件探测的典型数据源,由于微博内容的多样性、稀疏性和碎片性,现有事件探测方法使用的数据源单一且噪声较大,在时空信息的发现上粒度过大,导致结果的准确性差。因此,在事件探测算法上提出动态上下文窗口算法,构建候选微博进行事件探测,提高了事件探测的效率和精度。并提出利用微博内容发现特定事件地理位置信息的算法,提高了事件时空信息的获取精度。最后应用于食源性疾病事件的自动探测中,相比以往的事件探测方法,扩大了数据来源,且时间和空间维度上的准确性得到显著提高。Micro Blog is a typical short text data source for event detection. Because of diversity, sparsity and debris in Micro Blog content, using existing event detection method is ineffective, and the event spatio-temporal information is inaccurate. To the end, a dynamic context window algorithm was proposed, improved the efficiency and precision of event detection of foodborne diseases based on Micro Blog. Moreover, an algorithm was developed which can get spatio-temporal information from Micro Blog more accurate. Finally, extensive experiments on event detection of foodborne diseases show the proposed method can help to expand the data source and improve the accuracy of time and space dimension.

关 键 词:短文本 事件探测 时空信息 微博 食源性疾病 

分 类 号:TP399[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象