基于客户评论和语料库的在线酒店信誉维度挖掘  被引量:7

Exploration of Dimensions of the Online Hotel Reputation Based on Customers' Text Comments and Corpus

在线阅读下载全文

作  者:赵学锋[1] 汤庆[1] 张睿 李岳[3] 

机构地区:[1]华中科技大学管理学院,武汉430074 [2]湖北移动通信有限责任公司,武汉430023 [3]河南信阳供电公司,信阳464000

出  处:《图书情报工作》2012年第12期124-129,共6页Library and Information Service

基  金:国家自然科学基金项目"基于文本挖掘的在线零售商信誉评价模型研究"(项目编号:70871048)研究成果之一

摘  要:以携程网上消费者对酒店的文本评论为研究对象,通过对文本评论中的词语进行聚类,得到其中隐含的消费者最关注的酒店评价维度。为保证词语聚类的效果,引入语料库作为对比文档,通过分词、特征项表示、特征词编码标注、词义相似度计算以及基于DBSCAN的文本聚类过程,得到最后的评价维度,并以实例详细说明每个过程中所采用的方法及步骤。This paper aims to explore the most important issues considered by consumers on the basis of corpus and consumers' online feedback, which are implied in the consumers' text comments. After the process of grabbing text comments data, words segmentation, the generation of characteristics collection, code marking, semantic similarity calculation and machine clustering, the dimensions of online hotel reputation are generated. And then an example is used to elaborate the detailed procedures and methods. The paper provides a new perspective to explore online feedback system. From a practical perspective, it also provides decision support to the manager of hotels and online hotel booking websites.

关 键 词:信誉维度 词语聚类 文本评论 词义相似度 语料库 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象