检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王雨燕 赵佳鹏 时金桥 申立艳 刘洪梦 杨燕燕[2] WANG Yuyan;ZHAO Jiapeng;SHI Jinqiao;SHEN Liyan;LIU Hongmeng;YANG Yanyan(School of Cyberspace Security,Beijing University of Posts and Telecommunications,Beijing 100876,China;School of Information Network Security,People's Public Security University of China,Beijing 100038,China)
机构地区:[1]北京邮电大学网络空间安全学院,北京100876 [2]中国人民公安大学信息网络安全学院,北京100038
出 处:《计算机工程》2023年第11期187-194,210,共9页Computer Engineering
基 金:广东省重点研发计划(2019B010137003)。
摘 要:暗网网页中用户身份标识信息的分布呈现出稀疏、不规律的特点,当前主流的信息聚合技术无法直接应用于该场景。提出一种基于共指关系抽取的用户身份信息聚合模型,该模型输入一对用户身份信息及其上下文语境,返回该信息对是否包含共指关系,并且构建相应的用户身份信息数据集用于聚合实验。为进一步提升模型的识别能力,在基线模型的基础上引入实体类别信息,提出实体类别敏感的共指关系抽取模型。针对暗网中通过某些身份类别信息无法获取足够多训练样本的问题,引入少样本学习任务,构建基于多任务的低资源条件下用户身份信息聚合模型。实验结果表明,在低资源条件下,经过优化的聚合模型F1值达到87.03%,较基线模型提升11.98个百分点。The distribution of user identity information dispersed across darknet Web pages exhibits sparse and irregular characteristics,and current mainstream information aggregation techniques cannot be directly applied to this context.This study proposes a user identity information aggregation model based on coreference relation extraction.The model inputs a pair of user identity information and its contextual background,determines whether the information pair contains a coreference relation,and constructs a corresponding user identity information dataset for aggregation experiments.To further enhance the recognition ability of the model,the baseline model is enriched with entity category information,leading to the proposal of an entity category-sensitive coreference relation extraction model.To address the inability to obtain sufficient training samples through certain identity category information in darknet,a few-shot learning task is introduced to construct a multitask-based user identity information aggregation model under low-resource conditions.The experimental results show that,under low-resource conditions,the F1 value of the optimized aggregation model reaches 87.03%,which is 11.98 percentage points higher than that of the baseline model.
关 键 词:暗网 用户身份信息 信息聚合 关系抽取 少样本学习 多任务学习
分 类 号:TP309[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.147.79.7