检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:綦方中[1] 田宇阳 Qi Fangzhong;Tian Yuyang(School of Management,Zhejiang University of Technology,Hangzhou 310023,Zhejiang,China)
出 处:《计算机应用与软件》2023年第7期71-76,90,共7页Computer Applications and Software
基 金:国家社科基金项目(18BJY148)。
摘 要:通过主题模型对酒店评论文本进行文本挖掘,有利于引导酒店管理者和客户对评论信息做出合适的鉴别和判断。提出一种基于预训练的BERT语言模型与LDA主题聚类相结合的方法;利用中文维基百科语料库训练BERT模型并从中获取文本向量,基于深度学习算法对评论文本进行情感分类;通过LDA模型对分类后的文本进行主题聚类,分别获取不同情感极性文本的特征主题词,进而挖掘出酒店客户最为关注的问题,并对酒店管理者提出具有参考价值的建议。实验结果表明,通过BERT模型获取的文本向量在情感分类任务中表现较好,且BERT-LDA文本挖掘方法能使酒店评论文本的主题更具表达性。Text mining of hotel review texts through topic models helps guide hotel managers and customers to make appropriate identification and judgments on review information.This paper proposes a method based on the combination of pre-trained BERT language model and LDA topic clustering.We used Chinese Wikipedia corpus to train the BERT model,obtained the text vectors from the BERT structure,and made a sentiment classification of review text by using deep learning algorithms.We established a LDA model to cluster the classified texts to obtain the feature topic words of the texts with different sentiment polarity,digged out the most concerned issues of hotel customers,and put forward suggestions with reference value for hotel managers.The experimental results show that the vectors obtained by the BERT model performs better in sentiment classification task and the proposed BERT-LDA text mining method makes the topic of hotel review texts more expressive.
关 键 词:BERT LDA主题模型 情感分类 文本挖掘 酒店评论
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222