检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨维铠 陈长建 朱江宁 李磊 刘鹏 刘世霞[1] Yang Weikai;Chen Changjian;Zhu Jiangning;Li Lei;Liu Peng;Liu Shixia(School of Software,Tsinghua University,Beijing 100084;The Third Research Institute of China Aerospace Science&Industry Corporation,Beijing 100083)
机构地区:[1]清华大学软件学院,北京100084 [2]中国航天科工集团第三研究院,北京100083
出 处:《计算机辅助设计与图形学学报》2023年第11期1629-1642,共14页Journal of Computer-Aided Design & Computer Graphics
基 金:国家自然科学基金(U21A20469,61936002);国家重点研发计划(2020YFB2104100)。
摘 要:在机器学习应用中,由于数据来源渠道多以及部分标注者水平不足,训练数据质量很难得到保证.通过深度结合机器学习和可视化技术,可视分析技术将人融入数据质量分析与提升回路中,帮助提升训练数据质量,从而提高模型性能.文中首先总结了训练数据质量问题的三大类型:标注错,覆盖窄,标注缺;然后基于这些问题类型,介绍分析了相关的可视分析工作,包括标注错误修正方法,数据集偏离纠正方法和无标注数据质量提升方法;最后深入分析了基于可视分析的训练数据质量提升面临的机遇与挑战,包括在复杂任务、大语言模型、多模态数据、流数据等场景下的数据质量提升.In the applications of machine learning,it is difficult to ensure the quality of training data due to the various sources of training data and the inexperience of some annotators.By tightly integrating machine learning and visualization,visual analytics techniques involve humans in the loop of data quality analysis and improvement,thereby enhancing the quality of training data and improving model performance.In this survey,we first summarize the main types of training data quality issues,including inaccurate annotations,low coverage,and insufficient annotations.Based on the identified problem types,we categorize and summarize relevant visual analytics approaches,including methods for correcting inaccurate annotations,reducing dataset biases,and enhancing the quality of unlabeled data.Finally,we delve into the opportunities and challenges faced in research on training data quality improvement using visual analytics.This includes enhancing data quality in scenarios such as complex tasks,large language models,multimodal data,and streaming data.
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222