检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:翟东海[1] 王佳君[2] 聂洪玉[1] 崔静静[1]
机构地区:[1]西南交通大学信息科学与技术学院,四川成都610031 [2]西藏大学工学院,西藏拉萨850000
出 处:《西藏大学学报(社会科学版)》2013年第4期82-87,共6页Journal of Tibet University
基 金:2012年度国家语委"十二五"科研规划项目"藏文网络舆情监测的研究"(项目号:YB125-49);2012年度教育部科学技术研究重点项目"基于动态向量空间模型的藏语突发性热点话题检测与跟踪的研究"(项目号:212167);2012年度中央高校基本科研业务费专项资金科技创新项目"基于条件随机域的藏语网络敏感话题识别技术研究"(项目号:SWJTU12CX096);2012年度国家级大学生创新创业训练计划项目资助课题"基于动态向量空间模型的热点话题检测系统的设计与实现"(项目号:2012CX023)阶段性成果
摘 要:针对舆情监测中现存的热点词提取方法精度不高、速度不快的问题,文章采用互信息作为热点词突发性的度量手段,并使用类间离散度作为调节因子来构建热点词的突发性度量公式。在此基础上,构造了改进后的动态突发性向量空间模型,并用于网络中突发性热点话题的发现与追踪。实例验证结果表明,文章提出的改进方法能够获得很好的准确度P、召回率R和F度量。In this paper,a new burst measurement formula of hot words was constructed based on the mutual information with between-class scatter as the adjusting factor in connection with low accuracy and speed of the hot words extraction method in the public opinion monitoring.Based on this,an improved dynamic bursty vector space model was built and applied in detecting and tracking hot topic in the network.The experimental results demonstrated that the improved approach can achieve high precision P,recall rate R and F-measure.
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.166