检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:纪波林 JI Bolin(State Administration of Taxation,Jiangsu Provincial Taxation Bureau,Nanjing 210036,China)
机构地区:[1]国家税务总局江苏省税务局,江苏南京210036
出 处:《数字通信世界》2024年第9期139-141,共3页Digital Communication World
摘 要:该文就基于文本挖掘技术的网络舆情采集与分析应用展开研究,从网络舆情生命周期理论、网络舆情采集与分析相关技术、中文分词算法、文本挖掘技术、以及具体的文本预处理、词频分析和LDA主题建模等方面展开讨论。在网络舆情数据预处理中,通过去噪、自定义词典及分词、停用词过滤等手段,可提升数据质量,文本词频分析利用TF-IDF算法,准确挖掘关键词,深入理解舆情事件的重要性,而LDA主题建模技术则通过发现主题结构,为舆情事件提供更为深刻的分析视角。研究表明,通过建立起舆情监测管理机制,可以更好地构建网络舆情环境。This article explores the application of text mining technology in the collection and analysis of online public opinion.It discusses the lifecycle theory of online public opinion,related technologies for online public opinion collection and analysis,Chinese word segmentation algorithms,text mining techniques,as well as specific text preprocessing,word frequency analysis,and LDA topic modeling.In the preprocessing of online public opinion data,data quality can be improved through methods such as denoising,custom dictionaries and word segmentation,stop word filtering,etc.Text word frequency analysis utilizes the TF-IDF algorithm to accurately mine keywords and gain a deeper understanding of the importance of public opinion events.LDA topic modeling technology,on the other hand,provides a more profound analysis perspective for public opinion events by discovering topic structures,indicating that establishing a public opinion monitoring and management mechanism can better construct the online public opinion environment.
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] TP391.1[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.129.209.87