检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:殷小科[1] 王威[1] 王婕 张沛然 乐汉 林基伟 张海婷 Yin Xiaoke;Wang Wei;Wang Jie;Zhang Peiran;Le Han;Lin Jiwei;Zhang Haiting(Science and Technology Department for Shanghai Public Security Bureau,Shanghai 200042;DATATOM,Shanghai 200030)
机构地区:[1]上海市公安局科技处,上海200042 [2]上海德拓信息技术股份有限公司,上海200030
出 处:《现代计算机》2021年第23期86-90,共5页Modern Computer
基 金:上海市科学技术委员会科研计划项目“:城市大脑”一期“/平安大脑”关键技术及应用研究(18DZ1200900)。
摘 要:分层文本分类在现实中应用比较广泛,在数据不理想的情况下,充分利用分层结构信息对提高分类效果有很大的帮助。针对警情数据,为了充分利用其现有的分层结构信息,缓解数据严重不均衡的问题,提出了一种基于BERT的迁移分层文本分类模型,利用BERT预训练模型充分提取警情领域相关信息,用于分层文本分类。实验结果表明,利用结构信息和迁移学习对结果都有不同程度的提高,尤其是对数据少的类别。Hierarchical text classification is widely used in many real-world applications.When the data is scarce,it is helpful to make full use of hierarchical structure information to improve the classification performance.In order to make full use of the existing hierar⁃chical structure information and alleviate the problem of data imbalance,in this paper we propose a hierarchical text classification mod⁃el based on BERT.This model utilizes the pre-trained BERT model to fully extract the related alarm information for hierarchical text classification.The experimental results show that both structural information and transfer learning can improve the results to different degrees,especially for the categories with less data.
分 类 号:D631.1[政治法律—政治学] TP391.1[政治法律—中外政治制度]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.129.58.166