检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘晓慧 陶成煦 张钰洋 吴江[1] LIU Xiaohui;TAO Chengxu;ZHANG Yuyang;WU Jiang
机构地区:[1]武汉大学信息管理学院 [2]武汉大学国家网络安全学院
出 处:《图书馆论坛》2025年第4期119-128,共10页Library Tribune
基 金:国家自然科学基金专项项目“数据交易场所的功能定位、运营机制与治理机制研究”(项目编号:72442030);国家自然科学基金重点项目“网络视角下乡村产业互联网的数智赋能研究”(项目编号:72232006)研究成果。
摘 要:如何评估数据价值成为数据要素流通的关键问题,基于模型的数据价值评估是新型且有效的智能化方式。文章针对目前无训练数据价值评估方法无法有效利用数据内容与模型特征之外整体化场景信息的缺陷,提出一种结合大模型指令工程的无训练数据价值评估方法,将指令工程与现有的无训练方法结合,使用大模型理解和利用任务类型、数据属性等整体化信息;通过仿真实验对比分析不同方法在主流数据集下的有效性、鲁棒性和泛化性。研究发现:将大模型指令工程与无训练方法结合能提高无训练数据价值评估方法的有效性,且不会增加过多的计算成本。How to evaluate the value of data has become the key issue for the circulation of data elements.Model-based data value evaluation is a new and effective intelligent way.Aiming at the shortcomings of the current value evaluation methods based on untrained data,which cannot effectively utilize the holistic scene information beyond the data content and model features,this paper proposes a training-free value assessment method with a mix of command engineering and the existing untrained methods,which uses the large models to understand and utilize the holistic information such as task type and data attributes.Through a simulation experiment,it conducts a comparative analysis of the effectiveness,robustness and generalization of different methods under the mainstream datasets.The study suggests that the untrained evaluation approach of data value can be effectively improved without adding excessive computational cost in combination with instruction engineering of large model and the no-training methods.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.33