检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]桂林电子科技大学商学院,桂林541004 [2]西北工业大学管理学院,西安710129
出 处:《计算机与数字工程》2014年第1期112-116,共5页Computer & Digital Engineering
基 金:广西高等学校人文社会科学研究项目(编号:SK13YB036);桂林电子科技大学博士启动基金(编号:US12010Y)资助
摘 要:在基于Web的电子商务数据挖掘过程中,如何从大量的商品交易记录中发掘出有用的信息是目前研究的主要课题,通过对目前网络交易的商品名称信息的特征进行分析,使用自定义的网页抓取工具获取在线商品交易的信息,分词处理后使用潜在语义分析方法对数据集的类别进行分析,实现了一个商品类别分类算法。从划分结果来看,该算法能较好地清除冗余信息,有效地区分不同类别的商品。In web-based e-commerce data mining process,how to discover the useful information from a large number of commodity trading records is the main subject of current research.Through analyzing the characteristics of online trade product name information,a custom web page crawler is used to gather online commodity trading information,then word segmentation is used to process the product names data,at last latent semantic analysis is made to analyze the type of data set and achieve a product category classification algorithm.From the division results,the algorithm can remove redundant information,effectively distinguish different categories of goods.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28