AI向善:AI大模型价值观对齐的内容与实践  被引量:16

在线阅读下载全文

作  者:郭全中 张金熠 

机构地区:[1]中央民族大学新闻与传播学院,互联网平台企业发展与治理研究中心,北京100081 [2]江苏紫金传媒智库,南京210000 [3]中央民族大学新闻与传播学院,北京100020

出  处:《新闻爱好者》2023年第11期19-24,共6页Journalism Lover

基  金:北京市社会科学基金规划重点项目“首都互联网平台企业社会责任与协同治理体系研究”的阶段性成果,批准号(22XCA002)。

摘  要:价值观对齐关系着AI大模型是否能真正为人类服务,甚至关乎着意识形态安全乃至国家政治安全。从意义、准则、路径、困境四个维度对AI大模型价值观对齐进行全面剖析,认为安全问题与应用保障是AI大模型价值观对齐的驱动力量,原生价值观、目标价值观、普适价值观是AI大模型价值观对齐的价值选择,尤其强调国内AI大模型应以社会主义核心价值观为对齐目标。价值观对齐的主要实践路径包括非递归监督与可扩展监督两条,并对国内外常见的四种价值观对齐范式进行简要介绍,总结出对齐税、价值观以及对齐效果评估方面的对齐困境。

关 键 词:人工智能 大模型 价值观对齐 人工智能对齐技术 

分 类 号:G206[文化科学—传播学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象