检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:江文彬 刘兆霖 谢仕康 傅一馨 李琪 JIANG Wenbin;LIU Zhaolin;XIE Shikang;FU Yixin;LI Qi(School of Cyber Science and Engineering,Beijing Jiaotong University,Beijing 100044,China;Institute of Computing Technologies,China Academy of Railways Sciences Corporation Limited,Beijing 100081,China;Beijing Jingwei Information Technologies Co.Ltd.,Beijing 100081,China)
机构地区:[1]北京交通大学网络安全学院,北京100044 [2]中国铁道科学研究院集团有限公司电子计算技术研究所,北京100081 [3]北京经纬信息技术有限公司,北京100081
出 处:《铁路计算机应用》2024年第10期7-12,共6页Railway Computer Application
基 金:中国国家铁路集团有限公司科技研究开发计划(P2023W001)。
摘 要:为了对铁路不同敏感等级数据实施差异化保护,文章提出了一种基于层次化主题分析的铁路敏感数据智能识别与分类分级方法,旨在为铁路网络数据分级保护提供依据。该方法利用数据语义和分类分级规则建立主题词库,通过主题分析初步判断数据敏感级别。考虑到铁路网络数据的敏感级别分布不平衡,设计分级概率向量加权聚合机制,利用凝聚层次聚类算法实现准确定级。经实验验证,与基于语义和K-means聚类的传统主题分析方法相比,该方法可有效缓解分布不平衡问题,实现细粒度、动态可调整的铁路敏感数据智能识别与准确定级,从而为落实铁路网络数据分级管理要求、确保铁路网络数据安全可控提供技术支撑。In order to implement differentiated protection for railway data with different sensitivity levels,this paper proposed an intelligent recognition and classification and grading method for railway sensitive data based on hierarchical topic analysis,aimed to provide a basis for the grading protection of railway network data.This method utilized data semantics and classification and grading rules to establish a topic lexicon,and preliminarily determined the sensitivity level of data through topic analysis.Considering the uneven distribution of sensitivity levels in railway network data,the paper designed a graded probability vector weighted aggregation mechanism and used the cohesive hierarchical clustering algorithm to implement accurate grading.Through experimental verification,compared with traditional topic analysis methods based on semantics and K-means clustering,this method can effectively alleviate the problem of imbalanced distribution,implement fine-grained,dynamically adjustable intelligent recognition and accurate grading of railway sensitive data,and provide technical support for implementing the requirements of railway network data grading management and ensuring the security and controllability of railway network data.
关 键 词:自然语言处理 凝聚层次聚类 主题分析 铁路网络数据 敏感属性识别 数据分类分级
分 类 号:U29[交通运输工程—交通运输规划与管理] TP39[交通运输工程—道路与铁道工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7