检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王钟浩 崔珂玮 张鑫 杨振中 刘帅[1] WANG Zhonghao;CUI Kewei;ZHANG Xin;YANG Zhenzhong;LIU Shuai(Institute of Disaster Prevention,Sanhe 065201,China)
机构地区:[1]防灾科技学院,河北三河065201
出 处:《现代信息科技》2021年第3期5-8,共4页Modern Information Technology
基 金:防灾科技学院2020大学生创新创业项目(202011775092)。
摘 要:针对地震发生后新闻种类繁多,无法准确获取地震相关新闻的问题,该文提出了一种通过互联网获取地震信息并对地震信息进行文本信息识别的方法,可以识别文本信息是否为地震信息。采用Python爬虫技术对结构不同的新闻网站进行数据采集,并基于fastText的文本分类模型对数据进行分类训练,实验结果表明:该方法能够有效地对新闻进行分类,获取所需地震新闻。In response to the problem that there are many kinds of news after an earthquake and it is impossible to obtain earthquake related news accurately,this paper proposes a method to obtain earthquake information through the internet and perform text information recognition on earthquake information,which can identify whether the text information is earthquake information or not.Python crawler technology is used to collect data from news websites with different structures,and carry out classification training on data based on fastText’text classification model.The experimental results show that the method can effectively classify the news and obtain the required earthquake news.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.173