基于改进型VSM-HowNet融合相似度算法研究  被引量:5

Research on Improved VSM-HowNet Fusion Similarity Algorithm

在线阅读下载全文

作  者:肖尚 房至一[2] 董洪良 赵帅 王涵瑜 XIAO Shang;FANG Zhiyi;DONG Hongliang;ZHAO Shuai;WANG Hanyu(Product Innovation Center,Tianchi Media Company Limited,Beijing 100020,China;College of Computer Science and Technology,JiIin University,Changchun 130012,China;Information and Data Research Lab,Banine Technologies Ltd,Changehun 130012,China;College of Information Science and Technology,Northeast Normal University,Changehun,130017,China)

机构地区:[1]天池传媒股份有限公司产品创新中心,北京100020 [2]吉林大学计算机科学与技术学院,长春130012 [3]吉林省竹玖信息技术有限公司数据与信息实验室,长春130012 [4]东北师范大学信息科学与技术学院,长春130017

出  处:《吉林大学学报(信息科学版)》2018年第6期674-680,共7页Journal of Jilin University(Information Science Edition)

基  金:依托广电网络的互动媒体应用聚合云服务系统研发基金资助项目(2014BAH02F00)

摘  要:随着信息科学技术的发展和互联网技术的普及,社会上出现了越来越多的以博取观众的眼球为目的的"标题党"现象。为了识别"标题党"新闻,给出了一种基于改进型的VSM结合余弦相似度的文本相似度计算方法和《知网》(How Net)文本相似度计算方法,并研究了基于改进型VSM-HowNet融合相似度算法,用这些文本相似度的计算方法分别和已有研究中的王氏主题-词形文本相似度计算方法做对比。此方法对"标题党"新闻识别的总准确率、总召回率及总F1值均高于其他文本相似度计算方法,对于识别一篇未知类型的新闻,改进型VSM-HowNet融合相似度算法相比于其他文本相似度计算方法更有优势。With the development of society,more and more "Sensational Headline"which does not match the text for the purpose of attracting the audience's attention phenomena has appeared.In order to identify the "Sensational Headline"news,methods of text similarity calculation based on an Improved VSM Combined with Cosine Similarity Method,the HowNet Method and an Improved VSM-HowNet Fusion Similarity Algorithm are introduced.These methods have higher total accuracy,total recall rate and total F1 value for the "Sensational Headline"news recognition than other text similarity calculation methods.For identifying an unknown type of news,the improved VSM-HowNet fusion similarity algorithm is more advantageous than other text similarity calculation methods.

关 键 词:“标题党”新闻 改进型VSM结合余弦相似度方法 《知网》(HowNet)方法 改进型VSM—HowNet融合相似度算法 

分 类 号:N37[自然科学总论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象