检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:严豫 YAN Yu
机构地区:[1]中国人民公安大学信息技术与网络安全学院,北京102600
出 处:《信息技术与信息化》2022年第7期132-135,共4页Information Technology and Informatization
摘 要:针对现有舆情监测系统对于未登录词的钝化问题,构建了一个基于BERT模型(bidirectional encoder representation from transformers,双向transformer的encoder)的半监督自更新的涉警敏感词语料库系统。首先借助训练出的BERT文本分类器进行敏感性评估,再借助NER方法、新词发现方法和必要的人工检验,获取用于训练的敏感语料以其的特征词。最后,语料库基于朴素贝叶斯分类方法,设置了必要的精度检验和版本控制机制,形成了一个能够半自动更新的语料库系统。通过朴素贝叶斯再分类的校验表明,语料的区分度大,效果较好,分类结果具有应用价值。
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171