检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华中科技大学管理学院,武汉430074 [2]湖北移动通信有限责任公司,武汉430023 [3]河南信阳供电公司,信阳464000
出 处:《图书情报工作》2012年第12期124-129,共6页Library and Information Service
基 金:国家自然科学基金项目"基于文本挖掘的在线零售商信誉评价模型研究"(项目编号:70871048)研究成果之一
摘 要:以携程网上消费者对酒店的文本评论为研究对象,通过对文本评论中的词语进行聚类,得到其中隐含的消费者最关注的酒店评价维度。为保证词语聚类的效果,引入语料库作为对比文档,通过分词、特征项表示、特征词编码标注、词义相似度计算以及基于DBSCAN的文本聚类过程,得到最后的评价维度,并以实例详细说明每个过程中所采用的方法及步骤。This paper aims to explore the most important issues considered by consumers on the basis of corpus and consumers' online feedback, which are implied in the consumers' text comments. After the process of grabbing text comments data, words segmentation, the generation of characteristics collection, code marking, semantic similarity calculation and machine clustering, the dimensions of online hotel reputation are generated. And then an example is used to elaborate the detailed procedures and methods. The paper provides a new perspective to explore online feedback system. From a practical perspective, it also provides decision support to the manager of hotels and online hotel booking websites.
关 键 词:信誉维度 词语聚类 文本评论 词义相似度 语料库
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249