检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华泰证券股份有限公司,江苏南京210019 [2]北京灵云数科信息技术有限公司,北京100037
出 处:《工业控制计算机》2025年第1期113-115,共3页Industrial Control Computer
摘 要:随着人工智能的迅速发展,越来越多的研究将BERT(Bidirectional Encoder Representations from Transformers)等大语言模型应用到了网络安全的检测技术中,邮件检测技术是最热门的应用场景之一。然而考虑到部署大模型所需要的资源和技术能力,越来越多的客户转向主流的MaaS(Models-as-a-Service,MaaS)服务商。MaaS服务商凭借丰富的预训练模型和强大的训练服务,为用户提供了便捷的模型精调途径。然而,在金融领域,邮件数据往往涉及到公司内部的个人身份、商业机密等信息,直接披露给服务商会导致严重的隐私泄露风险。在模型更新可持续性发展上面临数据隐私泄露、计算资源有限等问题。为了解决这些问题,提出了一种基于拆分学习的邮件检测模型共享方法。该方法将BERT模型拆分为可在客户端上本地执行的部分和在服务器端上训练的部分,通过客户端对训练数据进行编码处理,保证了数据隐私的同时减少了传输到服务器端的数据量。服务器端收到客户端的编码信息后,结合BERT的后半部分进行效率高且安全的模型训练。最终,训练生成的模型更新回客户端,实现了模型的迭代优化和即时更新。In the financial field,email data often involves personal identity information,trade secrets,and other information within the company,and direct disclosure to service providers can lead to serious privacy leakage risks.Facing issues such as data privacy leakage and limited computing resources in the sustainable development of model updates.To address these challenges,this paper proposes a mail detection model sharing method based on split learning.This method splits the BERT model into parts that can be executed locally on the client side and parts that can be trained on the server side.The training data is encoded and processed on the client side,ensuring data privacy while reducing the amount of data transmitted to the server side.After receiving the encoding information from the client,the server combines the latter half of BERT to conduct efficient and secure model training.Finally,the trained model is updated back to the client,achieving iterative optimization and real-time updates of the model.
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.19.255.50