基于fastText的地震信息文本分类方法  被引量:1

Earthquake Information Text Classification Method Based on fastText

在线阅读下载全文

作  者:王钟浩 崔珂玮 张鑫 杨振中 刘帅[1] WANG Zhonghao;CUI Kewei;ZHANG Xin;YANG Zhenzhong;LIU Shuai(Institute of Disaster Prevention,Sanhe 065201,China)

机构地区:[1]防灾科技学院,河北三河065201

出  处:《现代信息科技》2021年第3期5-8,共4页Modern Information Technology

基  金:防灾科技学院2020大学生创新创业项目(202011775092)。

摘  要:针对地震发生后新闻种类繁多,无法准确获取地震相关新闻的问题,该文提出了一种通过互联网获取地震信息并对地震信息进行文本信息识别的方法,可以识别文本信息是否为地震信息。采用Python爬虫技术对结构不同的新闻网站进行数据采集,并基于fastText的文本分类模型对数据进行分类训练,实验结果表明:该方法能够有效地对新闻进行分类,获取所需地震新闻。In response to the problem that there are many kinds of news after an earthquake and it is impossible to obtain earthquake related news accurately,this paper proposes a method to obtain earthquake information through the internet and perform text information recognition on earthquake information,which can identify whether the text information is earthquake information or not.Python crawler technology is used to collect data from news websites with different structures,and carry out classification training on data based on fastText’text classification model.The experimental results show that the method can effectively classify the news and obtain the required earthquake news.

关 键 词:深度学习 文本分类 数据采集 自然语言处理 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象