基于机器学习的商业广告数据清洗技术  被引量:3

在线阅读下载全文

作  者:余康龙 林庆新[1] 王浇健 商旭豪 王涛 郑林海 

机构地区:[1]福州大学至诚学院,福建福州350002

出  处:《通讯世界》2020年第6期211-211,213,共2页Telecom World

基  金:省级大学生创新创业训练计划“基于机器学习的海量商业广告清洗技术”(ZJ1945)。

摘  要:对于目前存在的大量的广告数据,可以对其进行筛选过滤,保留同一分类但在商品描述方面却不大相同的广告,在进行广告文案策划时,这些保留下来的数据就具有了参考价值。利用文本向量求向量之间的相似度,可以对广告的相似度进行研究,根据设定具体的阈值,将文本相似度较高的文本去除,清洗出具有参考价值的数据。对清洗过后的数据进行聚类,就能根据类号对同一类型的广告进行查阅了。本文根据对英文广告数据的研究对其技术原理进行阐述。

关 键 词:文本相似度 文本向量 聚类 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象