面向AI模型的数据价值评估——基于大模型指令工程与无训练方法的融合  

AI Model-driven Data Value Assessment:An Integration of Large Model-based Prompt Engineering and Training-free Methods

在线阅读下载全文

作  者:刘晓慧 陶成煦 张钰洋 吴江[1] LIU Xiaohui;TAO Chengxu;ZHANG Yuyang;WU Jiang

机构地区:[1]武汉大学信息管理学院 [2]武汉大学国家网络安全学院

出  处:《图书馆论坛》2025年第4期119-128,共10页Library Tribune

基  金:国家自然科学基金专项项目“数据交易场所的功能定位、运营机制与治理机制研究”(项目编号:72442030);国家自然科学基金重点项目“网络视角下乡村产业互联网的数智赋能研究”(项目编号:72232006)研究成果。

摘  要:如何评估数据价值成为数据要素流通的关键问题,基于模型的数据价值评估是新型且有效的智能化方式。文章针对目前无训练数据价值评估方法无法有效利用数据内容与模型特征之外整体化场景信息的缺陷,提出一种结合大模型指令工程的无训练数据价值评估方法,将指令工程与现有的无训练方法结合,使用大模型理解和利用任务类型、数据属性等整体化信息;通过仿真实验对比分析不同方法在主流数据集下的有效性、鲁棒性和泛化性。研究发现:将大模型指令工程与无训练方法结合能提高无训练数据价值评估方法的有效性,且不会增加过多的计算成本。How to evaluate the value of data has become the key issue for the circulation of data elements.Model-based data value evaluation is a new and effective intelligent way.Aiming at the shortcomings of the current value evaluation methods based on untrained data,which cannot effectively utilize the holistic scene information beyond the data content and model features,this paper proposes a training-free value assessment method with a mix of command engineering and the existing untrained methods,which uses the large models to understand and utilize the holistic information such as task type and data attributes.Through a simulation experiment,it conducts a comparative analysis of the effectiveness,robustness and generalization of different methods under the mainstream datasets.The study suggests that the untrained evaluation approach of data value can be effectively improved without adding excessive computational cost in combination with instruction engineering of large model and the no-training methods.

关 键 词:数据要素 数据评价 大语言模型 指令工程 无训练方法 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] TP391[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象