检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]广州大学华软软件学院网络技术系,广东广州510900
出 处:《企业技术开发》2016年第7期7-10,共4页Technological Development of Enterprise
基 金:2016广东省攀登计划项目基金"基于WEB文本挖掘的电商网站个性化推荐技术研究"(pdjh2016a0991);2016广东省教育质量工程项目"信管专业数据分析人才协同育人机制研究"
摘 要:如何更好地利用来源错综复杂的数据,给企业带来相应效益是各企业亟待解决的问题。文章以京东商城空调类家电产品的用户评论数据为主要分析源,对用户行为数据进行文本挖掘找出用户的真实需求。对抓取的用户评论数据进行语义识别和词频统计,完成原始数据的去噪、降维等数据清理;建立商品目标集的特征属性表和概率模型,对待研数据进行聚类分析;最后,对聚类的结果进行时间序列分析,从而获得较有价值的结论,形成基于用户评论数据的建议、推断和决策。Facing the complicated source of data,so how to make better use of these data,and bring corresponding benefits is the top priority problem to be solved.In this paper,using user reviews data from Jingdong mall air-conditioning appliance products as the main source of mining,to find the real demand from behavior data.First,doing semantic recognition and word frequency statistics on user reviews data,dimension data cleaning;then establishing feature attribute table and probability model of commodity,to research data clustering; using time series analysis and exponential smoothing on the results of clustering to obtain valuable conclusions,finally gaining recommendations,inference and decision making.
关 键 词:数据挖掘 语义识别 词频统计 概率模型 时间序列分析
分 类 号:TP313[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.116.60.81