检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:肖尚 房至一[2] 董洪良 赵帅 王涵瑜 XIAO Shang;FANG Zhiyi;DONG Hongliang;ZHAO Shuai;WANG Hanyu(Product Innovation Center,Tianchi Media Company Limited,Beijing 100020,China;College of Computer Science and Technology,JiIin University,Changchun 130012,China;Information and Data Research Lab,Banine Technologies Ltd,Changehun 130012,China;College of Information Science and Technology,Northeast Normal University,Changehun,130017,China)
机构地区:[1]天池传媒股份有限公司产品创新中心,北京100020 [2]吉林大学计算机科学与技术学院,长春130012 [3]吉林省竹玖信息技术有限公司数据与信息实验室,长春130012 [4]东北师范大学信息科学与技术学院,长春130017
出 处:《吉林大学学报(信息科学版)》2018年第6期674-680,共7页Journal of Jilin University(Information Science Edition)
基 金:依托广电网络的互动媒体应用聚合云服务系统研发基金资助项目(2014BAH02F00)
摘 要:随着信息科学技术的发展和互联网技术的普及,社会上出现了越来越多的以博取观众的眼球为目的的"标题党"现象。为了识别"标题党"新闻,给出了一种基于改进型的VSM结合余弦相似度的文本相似度计算方法和《知网》(How Net)文本相似度计算方法,并研究了基于改进型VSM-HowNet融合相似度算法,用这些文本相似度的计算方法分别和已有研究中的王氏主题-词形文本相似度计算方法做对比。此方法对"标题党"新闻识别的总准确率、总召回率及总F1值均高于其他文本相似度计算方法,对于识别一篇未知类型的新闻,改进型VSM-HowNet融合相似度算法相比于其他文本相似度计算方法更有优势。With the development of society,more and more "Sensational Headline"which does not match the text for the purpose of attracting the audience's attention phenomena has appeared.In order to identify the "Sensational Headline"news,methods of text similarity calculation based on an Improved VSM Combined with Cosine Similarity Method,the HowNet Method and an Improved VSM-HowNet Fusion Similarity Algorithm are introduced.These methods have higher total accuracy,total recall rate and total F1 value for the "Sensational Headline"news recognition than other text similarity calculation methods.For identifying an unknown type of news,the improved VSM-HowNet fusion similarity algorithm is more advantageous than other text similarity calculation methods.
关 键 词:“标题党”新闻 改进型VSM结合余弦相似度方法 《知网》(HowNet)方法 改进型VSM—HowNet融合相似度算法
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7