大语言模型与语言研究的双向赋能与融合发展  被引量:3

Special Focus 1:Large Language Model Introduction:Large Language Models and Linguistic Research:Mutual Enhancement and Synergistic Development

在线阅读下载全文

作  者:杨尔弘[1] 胡韧奋 Yang Erhong;Hu Renfen

机构地区:[1]北京语言大学 [2]北京师范大学

出  处:《语言战略研究》2024年第5期5-6,共2页Chinese Journal of Language Policy and Planning

摘  要:大语言模型(以下简称“大模型”(1))是当前生成式人工智能最主流的技术,具有强大的生成、迁移与交互能力。简单地说,该技术通过训练模型阅读海量文本,使其在语言表达、即时对话、任务规划、逻辑推衍等许多方面具备了与人类媲美的能力。目前,学界业界主要围绕3个方面开展大模型的研究:(1)倾尽所有算力,通过提高数据质量、优化模型架构和训练策略等各种手段来研发基础、通用大模型,提升模型能力;(2)深入探索大模型的机理,拓展其性能,将最初仅能处理文本的模型,推向兼具文本、语音、图片、视频处理能力的多模态大模型;(3)开发专用或领域大模型、多智能体框架,以满足特定目标,拓展其应用场景。这些研究为大模型应用奠定了物质基础,为大模型的使用者提供了模型选择空间。

关 键 词:语言模型 人工智能 视频处理 训练模型 模型选择 模型架构 交互能力 多智能体 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] H0-05[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象