基于文本挖掘与语义识别的用户消费行为分析  被引量:2

The Analysis of Consumer Behavior Based on Text Mining and Semantic Recognition

在线阅读下载全文

作  者:周化[1] 张沁蕙 袁志[1] 

机构地区:[1]广州大学华软软件学院网络技术系,广东广州510900

出  处:《企业技术开发》2016年第7期7-10,共4页Technological Development of Enterprise

基  金:2016广东省攀登计划项目基金"基于WEB文本挖掘的电商网站个性化推荐技术研究"(pdjh2016a0991);2016广东省教育质量工程项目"信管专业数据分析人才协同育人机制研究"

摘  要:如何更好地利用来源错综复杂的数据,给企业带来相应效益是各企业亟待解决的问题。文章以京东商城空调类家电产品的用户评论数据为主要分析源,对用户行为数据进行文本挖掘找出用户的真实需求。对抓取的用户评论数据进行语义识别和词频统计,完成原始数据的去噪、降维等数据清理;建立商品目标集的特征属性表和概率模型,对待研数据进行聚类分析;最后,对聚类的结果进行时间序列分析,从而获得较有价值的结论,形成基于用户评论数据的建议、推断和决策。Facing the complicated source of data,so how to make better use of these data,and bring corresponding benefits is the top priority problem to be solved.In this paper,using user reviews data from Jingdong mall air-conditioning appliance products as the main source of mining,to find the real demand from behavior data.First,doing semantic recognition and word frequency statistics on user reviews data,dimension data cleaning;then establishing feature attribute table and probability model of commodity,to research data clustering; using time series analysis and exponential smoothing on the results of clustering to obtain valuable conclusions,finally gaining recommendations,inference and decision making.

关 键 词:数据挖掘 语义识别 词频统计 概率模型 时间序列分析 

分 类 号:TP313[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象