分层文本分类在警情数据中的应用  被引量:4

Application of Hierarchical Text Classification in Alarm Data

在线阅读下载全文

作  者:殷小科[1] 王威[1] 王婕 张沛然 乐汉 林基伟 张海婷 Yin Xiaoke;Wang Wei;Wang Jie;Zhang Peiran;Le Han;Lin Jiwei;Zhang Haiting(Science and Technology Department for Shanghai Public Security Bureau,Shanghai 200042;DATATOM,Shanghai 200030)

机构地区:[1]上海市公安局科技处,上海200042 [2]上海德拓信息技术股份有限公司,上海200030

出  处:《现代计算机》2021年第23期86-90,共5页Modern Computer

基  金:上海市科学技术委员会科研计划项目“:城市大脑”一期“/平安大脑”关键技术及应用研究(18DZ1200900)。

摘  要:分层文本分类在现实中应用比较广泛,在数据不理想的情况下,充分利用分层结构信息对提高分类效果有很大的帮助。针对警情数据,为了充分利用其现有的分层结构信息,缓解数据严重不均衡的问题,提出了一种基于BERT的迁移分层文本分类模型,利用BERT预训练模型充分提取警情领域相关信息,用于分层文本分类。实验结果表明,利用结构信息和迁移学习对结果都有不同程度的提高,尤其是对数据少的类别。Hierarchical text classification is widely used in many real-world applications.When the data is scarce,it is helpful to make full use of hierarchical structure information to improve the classification performance.In order to make full use of the existing hierar⁃chical structure information and alleviate the problem of data imbalance,in this paper we propose a hierarchical text classification mod⁃el based on BERT.This model utilizes the pre-trained BERT model to fully extract the related alarm information for hierarchical text classification.The experimental results show that both structural information and transfer learning can improve the results to different degrees,especially for the categories with less data.

关 键 词:分层文本分类 BERT 迁移学习 

分 类 号:D631.1[政治法律—政治学] TP391.1[政治法律—中外政治制度]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象