基于申威CPU的大型语言模型推理研究与应用

作　　者：陈伟

出　　处：《物联网技术》2025年第8期111-114,118,共5页Internet of things technologies

摘　　要：目前,ChatGPT、LLaMA、Gemini等大型语言模型已取得了显著突破,对自然语言处理领域产生了深远影响。然而,这些模型通常拥有数百亿甚至数千亿个参数,在部署时对计算资源和存储需求极高,导致其在计算资源有限的平台上难以应用。为此,介绍了当前主流的模型压缩方法,并结合llama.cpp项目,提出了一种在申威平台上利用纯CPU进行大型语言模型部署的方案。文章还针对不同的模型量化方式及多线程推理进行了总结与归纳,为大型语言模型在申威平台上的实际应用提供了实用指导。

关键词：申威自然语言处理大型语言模型模型压缩模型量化推理提速

分类号：TP181[自动化与计算机技术—控制理论与控制工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于申威CPU的大型语言模型推理研究与应用

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于申威CPU的大型语言模型推理研究与应用

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索