大模型开发者必备手册：这些数字值得记住_中国财经信息网

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

GPT-4的使用成本，竟然是GPT-3.5的50倍之多；

(资料图)

而让大语言模型同时处理25个请求的时间，仅是处理单个请求的2倍……

这些数据听上去可能有些出乎意料，但都是真实的。

它们出自一篇名为《大语言模型（LLM）开发者必须知道的数字》的GitHub文章。

文章发布之后仅1天，便获得了1200次星标。

文章基于真实的开发经验，介绍了提示工程、硬件资源、价格等方面的数据。

就算没有成为开发者的打算，拿来扩充一下知识储备也是极好的。

都有哪些数字值得关注

我们不妨先来看一下文章作者制作的速览图表：

接下来，我们就来详细介绍一下这些数据。

提示工程

40-90%：在提示词中加入“Be Concise”节约的成本

使用LLM是按照回复的token数量付费的，因此让LLM的回答简明扼要可以节约成本。

在提示词中加入“Be Concise”（答案简明些），可以节约40-90%的成本。

1.3：每个单词的平均token数

LLM是对token进行操作的，token可能包含完整单词或其中的一部分。

如“eating”是由“eat”和后缀“ing”两个token组成。

一篇750词的英文文章中大约含有1000个token。

而对于其他语言，每个词所含的token数量可能更多。

价格

价格数据会存在波动，本节的价格数据主要参考OpenAI，但其他公司数据也相似。

约50倍：GPT-4与GPT-3.5花费的比值

效果上，GPT-4的表现明显好于GPT-3.5，但其成本约为后者的50倍之多。

因此，对于诸如总结这类GPT-3.5也能出色完成的任务，可以考虑不使用更昂贵的GPT-4。

5倍：GPT-3.5-Turbo生成与使用OpenAI embedding的成本比

诸如“美国的首都是哪里”这类可以通过检索得到答案的问题，让LLM生成答案的成本是检索的5倍。

而如果使用GPT-4，成本差异将高达250倍。

10倍：OpenAI embedding与自建embedding的成本比

这一数字为大约数值，实际情况可能随着embedding的规模而变化。

6倍：微调版与基本版OpenAI模型的成本比值

尽管成本较为昂贵，但对基本OpenAI模型的微调是有意义的。

对基本模型进行微调的效益明显高于定制模型。

1倍：自建模型是否进行微调的成本比

由于参数量相同，是否进行微调对自建模型的成本几乎没有影响。

训练与微调

约100万美元：在1.4万亿token上训练130亿参数模型的成本

这一数字是建立在一切工作都十分顺利、没有发生崩溃的前提下计算出的。

Meta的大语言模型LLaMA的论文当中显示，用2048块80GB A100 GPU进行训练LLaMA一共花费了21天。

<0.001：微调与从头开始训练的成本比

这一数据有一些笼统，但微调的成本几乎可以忽略不计。

对一个60亿参数模型进行微调的成本大约是7美元。

即使是最贵的OpenAI模型Davinci，1000个token的微调成本也只有3美分。

相对于对一部莎士比亚全集进行微调也只需要40美元。

GPU消耗

如果你要自建模型，了解其GPU消耗十分重要。

本节所列数据仅是推理过程所消耗的资源量，训练和微调过程还需要更多资源。

V100: 16GB, A10G: 24GB, A100: 40/80GB：GPU内存大小

GPU内存大小决定了LLM的参数量上限。

24GB的A10G在亚马逊云服务中的价格为1.5-2美元每小时。

参数量的2倍：LLM的典型GPU内存需求

例如，7B参数量的LLM需要消耗14GB的GPU内存。

这是因为大多数时候，每个参数需要16bit浮点空间。

通常情况下不需要使用超过16bit的精度，8bit则会显著降低结果精准度。

约1GB：嵌入式模型的典型GPU内存需求

嵌入式模型消耗的本地GPU资源是很小的。

甚至可以在一块GPU上同时运行多个嵌入式模型。

超过10倍：批量处理LLM请求带来的吞吐量改善

在GPU上运行LLM时往往会有较大延迟。

一次请求消耗的时间可能长达5秒，相对于每秒仅能处理0.2个。

但如果同时发送两个请求，消耗的时间约为5.2秒。

而将25个请求捆绑发出的耗时约为10秒，相对于每秒可处理2.5个请求。

约1MB：130亿参数模型输出1个token所需的GPU内存

内存消耗量与生成token数成正比。

512个token（约380个英文单词）需要消耗512MB的空间。

作者简介

这篇文章的作者来自开源人工智能框架Ray的开发公司Anyscale。

主要贡献者是Google前首席工程师Waleed Kadous。

他也曾担任Uber CTO办公室工程战略负责人。

其中一位华人合作者是Google前员工Huaiwei Sun。

他来自江苏昆山，本科毕业于上海交通大学工业设计专业。

期间，他参加了耶鲁大学summer school并取得了满绩。

此后他取得了佐治亚理工学院硕士学位，研究方向为人机交互。

此外还有其他作者也参与了这篇文章的工作，未来也可能有更多人加入。

参考链接：[1]https://github.com/ray-project/llm-numbers[2]https://www.linkedin.com/in/scottsun94/

推荐内容

大模型开发者必备手册：这些数字值得记住

2023-05-19
实践中对收养人能否收养成年子女有几种意见？收养人能否收养成年子女？

2023-05-19
股票期权如何开通？股票期权开通要具备什么条件？

2023-05-19
办理收养登记的事实收养情况有几种？关于收养孩子入户条件有哪些规定？

2023-05-19
女子举重是从什么时候开始的？举重减肥的优势是什么？

2023-05-19
化妆棉怎么清洗才干净？常用的化妆工具怎么清洗？

2023-05-19
收养孩子有哪些要求？如何收养孩子？

2023-05-19
打新基金四步骤是什么?基金暂停赎回风险大吗？

2023-05-19
劳动合同到期辞职了可以领失业金吗？领取失业金要满足什么条件？

2023-05-19
蘑菇发霉了还能不能吃？蘑菇放的时间长了长白毛能吃吗？

2023-05-19
夏季如何调养脾胃？调理脾胃的养生粥有哪些？

2023-05-19
中国旅游日，跟着李白、杜甫、徐霞客去旅行

2023-05-19
当前快报:作家莫言为书法“抛砖引玉” 愿更多年轻人“重拾”毛笔

2023-05-19
聚焦高分剧《漫长的季节》专家：走出类型局限环球动态

2023-05-19
【盘中播报】45只个股跨越牛熊分界线

2023-05-19
指挥家邵恩执棒40载：指挥的成功紧紧地拴在乐队身上

2023-05-19
焦点消息！88只股中线走稳站上半年线

2023-05-19
今日盘中突破五日均线个股一览

2023-05-19
福建上杭首次发现恐龙蛋已进行抢救性保护

2023-05-19
【热闻】【盘中播报】沪指跌0.36% 石油石化行业跌幅最大

2023-05-19
基金5月18日参与7家公司的调研活动

2023-05-19
超过60岁还能协商网贷延期吗？网贷延期怎么协商效果好？

2023-05-19
2023年中秋国庆假期如何放假调休？中秋国庆假期高速免费吗?

2023-05-19
乳液和面霜的区别是什么？补水乳液的主要功效是什么？

2023-05-19
金线莲的功效与作用是什么？金线莲怎么栽培？

2023-05-19
iqoo产品经理宋紫薇个人资料宋紫薇高清写真

2023-05-19
房贷延期办理有年龄限制吗？房贷延期哪些人可以申请？

2023-05-19
一侧脸疼是三叉神经痛吗？半边脸刺痛是怎么回事？

2023-05-19
西安银行信用卡额度一般多少？西安信用卡还款日宽限期

2023-05-19
没学位证能考公务员考试吗？国家承认的五种学历提升方式

2023-05-19
削骨瘦脸有哪些手术后遗症？注射瘦脸好不好？

2023-05-19
巨蟹座人一直都是十二星座当中出了名的家居男愿意陪伴爱人？

2023-05-19
天蝎男：我想让你成为最幸福的公主用自己的全部捍卫爱情？

2023-05-19
大跌的股票能抄底吗？股票抄底是什么意思？

2023-05-19
营业执照如何年检？营业执照年检是什么意思？

2023-05-19
行政合同纠纷应通过什么途径解决？哪些合同属于行政合同？

2023-05-19
会计初级职称好考吗？会计初级职称报名条件和要求？

2023-05-19
营业执照年审怎么办理？工商营业执照怎么在网上年审？

2023-05-19
上海热线二手房买卖走什么流程？上海二手房交易需要多长时间？

2023-05-19
什么是保理合同纠纷？保理合同纠纷如何解决？

2023-05-19
孔雀开屏寓意是什么?孔雀开屏原因是什么?

2023-05-19
过继和收养区别是什么？收养协议的内容有哪些？

2023-05-19
北京股权转让合同纠纷律师多少钱？律师代理分为哪几种？

2023-05-19
个体营业执照年检流程？个体营业执照如何年检？

2023-05-19
我国民法典的规定关于收养有哪些法律规定？被收养人的范围是什么？

2023-05-19
土耳其签证价格表土耳其签证费要多少钱？

2023-05-19
可支配收入什么意思？可支配收入和工资收入有什么区别？

2023-05-19
个人征信空白是不是好贷款?个人征信空白是什么意思?

2023-05-19
二八定律是什么意思？股市中的二八现象是什么？

2023-05-19
房产合同纠纷律师咨询费怎么收？房产纠纷的诉讼时效是多少年？

2023-05-19
世界热点评！提供81个岗位！海南医学院2023年考核招聘高层次人才

2023-05-19
工伤赔偿计算方法是什么？工伤索赔的赔偿项目包括哪些？

2023-05-19
对于狮子座她们还有什么隐私么？她们还需要什么隐私么？

2023-05-19
拇外翻有哪些危害？拇外翻手术多少钱？

2023-05-19
射手座一贯喜欢和自己的闺蜜分享自己在商海打拼的故事？

2023-05-19
什么是黄金k线图？现货黄金k线图怎么看？

2023-05-19
摩羯座的人是很保守的星座性格却不小心被闺蜜泄露了隐私？

2023-05-19
花椒植物介绍花椒产地生境是哪里?

2023-05-19
iPhone电池老化怎么办？iphone电池掉的太快怎么办？

2023-05-19
纸黄金是什么？普通人如何购买投资黄金？

2023-05-19
双鱼的心底有个小本子会把闺蜜的隐私在合适的时候散播出去？

2023-05-19
小红书怎么移除粉丝？小红书怎么查看粉丝活跃度？

2023-05-19
到祖国最需要的地方去！2023上海大学生志愿服务西部计划启动招募

2023-05-19
如何理解最有利于被收养人的原则？收养法律制度的基本原则是什么？

2023-05-19
业绩预增多少需要公告？业绩哪些情况下不需要公告？

2023-05-19
哪种蔬菜含盐量高？天然含盐的蔬菜有什么？

2023-05-19
1周岁宝宝身高体重标准宝宝一岁74cm是不是太矮了？

2023-05-19
关于收养的法律特征有哪些？收养的概念是什么？

2023-05-19
ap隔离是什么意思？ap隔离的应用场所有哪些？

2023-05-19
乌鲁木齐甘泉堡经开区成立企业联合会搭建“以企引企”平台|世界聚焦

2023-05-19
收养登记有哪些办理流程？收养登记办理流程有什么法律依据？

2023-05-19
购买基金的平台有哪些?在哪里买基金最安全可靠?

2023-05-19
平安保险如何退保？商业保险重疾险该不该买？

2023-05-19
炒股时到底如何控制仓位？炒股控制仓位是什么意思？

2023-05-19
win10搜索框怎么关闭？win10任务栏的搜索怎么去掉？

2023-05-19
住房公积金属于夫妻共同财产吗？双方离婚住房公积金怎么分割？

2023-05-19
硬盘是什么？硬盘接口都有哪些？

2023-05-19
南国四大果品是哪些？南国四大果品的介绍

2023-05-19
金刚狼3为什么会变老？金刚狼3为什么不能自愈？

2023-05-19
光阴荏苒的荏是什么植物？光阴荏苒是什么意思？

2023-05-19
发明专利保护范围是怎样的？发明专利保护期限为多少年？发明专利的类型有哪些？

2023-05-19
科创板股票开户有什么条件？科创板上市流程？

2023-05-19
日久见人心的前半句是什么？路遥知马力日久见人心什么意思？

2023-05-19
电脑exe文件怎么打开？如何根除文件夹exe病毒？

2023-05-19
抄底是什么意思？抄底的技巧是什么？

2023-05-19
釜山图书馆是什么梗？釜山图书馆是什么意思

2023-05-19
离职后公积金可以随时提取吗？封存满六个月了还是不能提取?

2023-05-19
花刺代理验证怎么导入ip？花刺代理验证使用教程

2023-05-19
进口货物运输保险业务有哪些？国际贸易货物运输保险程序有哪些？

2023-05-19
腾讯qq空间家族怎么关闭？qq空间怎样退出家族？

2023-05-19
腾讯qq空间家族怎么关闭？qq空间关闭多久会清空？

2023-05-19
射手座是个非常优秀的星座让你管钱可以帮他们下决心做决断？

2023-05-19
如何提高下载速度？如何加快电脑下载速度？

2023-05-19
股权转让纠纷是否有时效？股权转让合同派生诉讼管辖法院怎么确定？

2023-05-19
职工医保缴费多少年可以终身享受？职工退休后医保由谁交?

2023-05-19
手机贴膜收888元合理吗？为什么手机贴膜容易碎屏？

2023-05-19
同一个证券公司可以开几个户？证券公司开户流程是什么？

2023-05-19
1万元股票进出要多少手续费?买500股和100股手续费一样吗?

2023-05-19
君龙人寿怎么样？君龙人寿偿付能力

2023-05-19
汇正财经为什么拉人?汇正老学员来聊聊自身所学

2023-05-19
贵州茅台2022年度股东大会将启，13项议案背后还将有哪些亮点？

2023-05-19
二次探底什么意思？股票为什么做二次探底？

2023-05-19
windows安全中心无法打开怎么办？QQ安全中心失效了是怎么回事？

2023-05-19
安娜贝尔的照片什么样子（安娜贝尔的身世是什么）

2023-05-19
股票市场的结构是怎样的?股票市场含义是什么?

2023-05-19
日本强征高价口罩是怎么回事？日本怡森还产口罩吗？

2023-05-19
怎么设置电脑开机自动宽带连接？设置电脑开机自动连接宽带的方法

2023-05-19
腰围84厘米是几尺几？腰围84厘米是多少码的裤子？

2023-05-19
代位追偿的概念是什么？代位追偿原则产生的根源是什么？

2023-05-19
奈奈米是什么意思？什么是奈奈米

2023-05-19
自持物业，为何选择投资城市便捷酒店？

2023-05-19
底部无量上涨意味着什么？底部无量上涨是诱多吗？

2023-05-19
晨星评级对于买基金有参考意义吗？为什么指数基金没有评级？

2023-05-19
1万怎么理财收益高？常见的短期理财都有哪些？

2023-05-19
别人用自己的信用卡还不上怎么办?信用卡借给他人使用违法吗?

2023-05-19
股民亏的钱到哪里去了？主力炒股会亏钱吗？

2023-05-19
刈族真的存在吗？刈族来历

2023-05-19
申请生育保险报销需要哪些材料?生育保险能自己去社保局报吗

2023-05-19
不定值保险合同是指什么？车辆损失险赔偿细则了解吗？

2023-05-19
高层住宅得房率是什么意思？买高层楼房要注意什么？

2023-05-19
山水诗派主要特点是什么？山水诗派的鼻祖是谁？

2023-05-19
国有土地上房屋征收与补偿方式都有什么？农村宅基地的补偿标准是什么？

2023-05-19
斛珠夫人帝旭喜欢海市吗小说斛珠夫人帝旭喜欢谁？

2023-05-19
底部无量上涨意味着什么？底部无量上涨是诱多吗？

2023-05-19
按最低还款额还款算逾期吗？信用卡如果实在无力偿还怎么办？

2023-05-19
邮箱如何自动发送邮件？邮箱怎么设置自动转发邮件？

2023-05-19
欠信用卡款还不上的怎么办？欠信用卡几千块钱不还会怎么样？

2023-05-19
老年人不明原因出冷汗是为什么？七十岁的老人一动就出汗什么原因？

2023-05-19
水瓶座的妹纸可是真正的管家式的妻子把家打理的井井有条？

2023-05-19
中国副省级城市有哪些？全国有几个副省级城市？

2023-05-19
逾期90天以上还清还能使用吗？信用卡无力偿还被起诉怎么办？

2023-05-19
基金智能定投怎么样？普通定投和智能定投有什么区别？

2023-05-19
底部双十字星是什么意思？股票双十字星后市怎么走？

2023-05-19
虚胖人群怎么控制饮食？饮食减肥要戒酒吗？

2023-05-19
iPhone手机桌面怎么截图？iphone手机桌面怎么整理好看？

2023-05-19
夫妻在婚姻关系存续期间所得的哪些财产，为夫妻的共同财产，归夫妻共同所有？

2023-05-19
信用卡无力偿还有什么后果？信用卡逾期90天以上还能贷款吗？

2023-05-19
DNF100狂战如何加点地下城剑影加点？

2023-05-19
京东老总刘强东有多少钱？京东现在和刘强东还有关系吗？

2023-05-19
房贷延期最多能延几期？房贷延期自己办理流程介绍

2023-05-19
欠多个银行信用卡还不起怎么办?信用卡不还银行会怎么样?

2023-05-19
房东直售对我们买房有何影响？二手房过户后刷信用卡影响放款吗？

2023-05-19
具备哪些条件的民事法律行为有效？劳动合同必须约定的条款有哪几点？

2023-05-19
日本新生人口预计再创新低真的吗？中国人口出生率低于日本吗？

2023-05-19
股权投资都有哪些内容？中华人民共和国公司法第一百二十六条规定是什么？

2023-05-19
龙虎榜机构和游资的区别是什么？游资和机构的区别是什么？

2023-05-19
炸鱼块怎么炸又酥又黄不粘锅？炸鱼块什么鱼好吃刺少？

2023-05-19
洋槐花的特征是什么？洋槐花的分布范围有哪些？

2023-05-19
guest账户怎么开启？guest账户有什么用？

2023-05-19
国有土地上房屋征收与补偿条例第十七条内容作出房屋征收决定的市、县级人民政府对被征收人给予的补偿包括什么？

2023-05-19
通缩和通胀哪个危害大？通缩和通胀的区别

2023-05-19
劳动合同可以约定终止条件吗？约定终止条件不得违反法律强制性的规定和公序良俗吗？

2023-05-19
什么是excel 2000？word2000是什么软件？

2023-05-19
从鹤岗到鹤壁，这些低房价城市为何频频走红网络？| 新京智库焦点讯息

2023-05-19
小高层建筑有啥特点？小高层各楼层的特点是什么？

2023-05-19
业余时间如何赚钱？适合上班族的10种副业是什么？

2023-05-19
有了你们的情史天蝎女才更容易抹黑你们就是这么简单？

2023-05-19
均线的具体的含义是什么？均线怎么看？

2023-05-19
bios电池在哪？主板bios电池在哪里怎么更换？

2023-05-19
小学一年级语文教案整理小学一年级语文教案范文

2023-05-19
iGameRTX4060Ti豪华版发布了吗？你知道具体参数吗？

2023-05-19
射手座是个非常优秀的星座天性阳光热情又与闺蜜相处非常和谐？

2023-05-19
偷税漏税怎么处罚？偷税漏税的处罚是根据哪些法律规定进行判定的？

2023-05-19
exo组合几个人张艺兴离开exo了吗？

2023-05-19
观色辨金高效提纯（工匠绝活）_头条焦点

2023-05-19
iPhone12面容解锁怎么用？iphone面容解锁最多几个人？

2023-05-19
戴隐形眼镜感觉特别干怎么办？戴隐形眼镜感觉可以看电脑吗？

2023-05-19
android是什么系统？android系统的优点？

2023-05-19
商品房二楼平台归谁？二楼平台可以装围栏吗？

2023-05-19
诉讼财产保全的条件是什么？申请诉讼财产保全应递交的材料有哪些？

2023-05-19
诉讼财产保全的担保方式有哪些？申请保全时业已存在的保全线索及证明材料应一次性提供完毕吗？

2023-05-19
属鸡的跟属牛的结婚如何？属鸡和属牛好结婚好吗？

2023-05-19
双鱼女：善良本性下的自我老公自然是最重要的私有财产？

2023-05-19
严鉴铂深入沃克齿轮调研指导工作天天看点

2023-05-19
柏玄为什么变成清穆白玦换了一个身份是什么？

2023-05-19
125亿韩元等于多少人民币？80万能在韩国买房子吗？

2023-05-19
鼻咽癌扩散到脖子还可以治吗？鼻咽癌快离世前症状是什么？

2023-05-19
空调漏水是什么原因怎么解决？空调漏水还能继续用吗？

2023-05-19
建国70周年纪念钞怎么预约？建国70周年纪念钞预约时间？

2023-05-19
为什么独立购房如此重要呢?“零首付”购房为什么被明令禁止？

2023-05-19
苹果iPhone12如何重启？iphone12开机密码忘记了怎么办？

2023-05-19
个人养老金资金账户的特点包括哪些？开通养老金账户有什么影响？

2023-05-19
停息挂账会影响个人征信吗？停息挂账后会变成黑户吗？

2023-05-19
订立劳动合同应当遵守哪些原则？劳动合同章盖公章还是人事章?

2023-05-19
黄茶会影响睡眠吗？黄茶要泡多久？

2023-05-19
二进制负数的补码怎么求？负数的补码和原码的关系是什么？

2023-05-19
信用卡欠款怎么处理？信用卡过还款日3天还款怎么补救？

2023-05-19
劳动合同未到期解除怎样赔偿？劳动合同什么时候正式有效?

2023-05-19
白玦娶景昭咋回事白玦为什么要让上古恨他？

2023-05-19
地牢猎手4怎么退出？地牢猎手4是单机吗？

2023-05-19
区域内找不到无线网络怎么办电脑无线开关在哪？

2023-05-19
中国参加过世界杯吗？中国举办过世界杯吗？

2023-05-19
股价异动公告是利好吗？股票出现异动预示什么？

2023-05-19
民法典第一百四十三条的规定具备哪些条件的民事行为才有效？

2023-05-19
解除劳动合同赔偿金什么时候给？所得经济赔偿金需要交个税吗？

2023-05-19
厨房台面尺寸是什么厨房台面材质有哪些？

2023-05-19
铅酸电池会爆炸起火吗？铅酸电池寿命一般是几年？

2023-05-19
破解优酷付费电影违法吗？优酷会员可以几个人用？

2023-05-19
房贷还不起会有哪些影响？房贷逾期半年房子会被法拍吗？

2023-05-19
劳动仲裁不予受理6个条件是什么?劳动仲裁委员受理的情况是什么?

2023-05-19