基于BERT模型的涉警舆情语料库系统  被引量:1

在线阅读下载全文

作  者:严豫 YAN Yu

机构地区:[1]中国人民公安大学信息技术与网络安全学院,北京102600

出  处:《信息技术与信息化》2022年第7期132-135,共4页Information Technology and Informatization

摘  要:针对现有舆情监测系统对于未登录词的钝化问题,构建了一个基于BERT模型(bidirectional encoder representation from transformers,双向transformer的encoder)的半监督自更新的涉警敏感词语料库系统。首先借助训练出的BERT文本分类器进行敏感性评估,再借助NER方法、新词发现方法和必要的人工检验,获取用于训练的敏感语料以其的特征词。最后,语料库基于朴素贝叶斯分类方法,设置了必要的精度检验和版本控制机制,形成了一个能够半自动更新的语料库系统。通过朴素贝叶斯再分类的校验表明,语料的区分度大,效果较好,分类结果具有应用价值。

关 键 词:舆情分析 BERT NER 新词发现 半自动 语料库 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] D631[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象