检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京交通大学电子信息工程学院,北京100044 [2]北京交通大学通信与信息系统北京市重点实验室,北京100044
出 处:《铁路计算机应用》2015年第3期19-21,32,共4页Railway Computer Application
基 金:国家自然基金(61172072);中央高校基本科研业务费(2014-JBM018)
摘 要:针对微博中充斥着的大量广告信息和其它的噪声微博,本文提出了基于C4.5决策树分类算法的用户分类过滤机制和基于特征值的计分过滤方法。利用微博文本的实时性和微博话题的时效性,还提出了一个基于时间参数的相似度计算方法。实验结果表明,该方法能提高对噪声过滤和话题检测的准确率和效率。Aiming at the big amount of advertising messages and other noise tweets, the paper proposed a user classiifcation ifltering mechanism based on C4.5 Decision Tree Classiifcation Algorithm and a scoring ifltering method based on characteristic value. Taking advantage of the instantaneity of micro-blog text and timeliness of micro-blog topic, the paper put forward a similarity calculation method based on time parameter. Experiments showed that this mechanism could detect topics and iflter noise with better accuracy and efifciency compared to the traditional approach.
分 类 号:U285[交通运输工程—交通信息工程及控制] TP39[交通运输工程—道路与铁道工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.191.89.16