检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]山东大学计算机科学与技术学院,山东济南250101
出 处:《中文信息学报》2012年第6期98-108,共11页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(60970047);山东省自然科学基金资助项目(Y2008G19);山东大学自主创新基金资助项目(11150070613165)
摘 要:该文提出了一种基于衰退理论对Flickr数据进行热点事件检测的方法。该方法首先将从Flickr图像中提取的视觉词汇(Visual Words)与图像的文本信息加权合并成文档。然后训练LDA模型获得文档的主题分布作为其最终向量表示。在此基础上提出了一种改进的Single-Pass算法进行事件检测,该算法不仅考虑了图片的地理位置信息,而且基于衰退理论(Aging Theory)对检测到的事件进行生命周期建模,以便计算事件在每个时间段的能量值。最后,根据能量值进行事件排序,获得给定时间段内的热点事件。在真实Flickr数据集上的实验结果表明所提出的方法在精确率、召回率和F1测度上优于传统事件检测方法。This paper proposes an aging theory based method to detect hot events in Flickr data. For each Flickr pho to, visual words are first extracted from it and then combined with the content of the attached as a document. An LDA model is trained to predict the topic distribution of each document, which is used as the final vector representa- tion of the document. An improved single-pass clustering algorithm is then proposed to detect events, which take the geographic information of a photo into account. Then aging theory is used to model the life cycles of sequential detected events, determining the energy value of events in each time slot. Finally, hot events in a specific time slot can be detected by ranking the events in terms of their energy value. Experimental results from real Flickr data show that the proposed approach outperforms traditional event detection methods in terms of precision, recall, and F1 value.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38