“随着2017年AlphaGoZero的面世,人工智能技术发展开启了第四次浪潮。这个阶段,人工的基本特点发生了改变。”在2023年5月18日召开的中国家用电器技术大会上,中国科学技术大学教授陈小平在介绍人工智能新发展时如是说。
此次大会上,陈小平不仅对人工智能的大模型进行了详细介绍,还分享了从大模型到柔性机器人的新发展,以及这些变化带来的新机遇和挑战。
陈小平在演讲中指出,现阶段,人工智能呈现出四大特点,即大任务、大训练、大模型、大系统。
(资料图)
其中,大任务,指的是大规模的真实场景任务,如下棋、聊天、语言翻译、命题、作文、命题绘画等。陈小平以围棋为例,大模型抓取了超过1亿全球用户的真实场景,这在以往是非常少见的。
大训练,则是指人工智能训练法已经从过去的大数据驱动,在2017年以后转变为大训练驱动。相比大数据驱动,大训练驱动的具体表现为四项新要求。陈小平详细介绍说:“第一,训练数据的质。在大数据驱动的时候,人工智能对数据的质没有要求,而现在强调的是原始数据。第二,训练数据的量。现在对人工智能原始数据的量给出了新的标准,就是人类规模。比如ChatGPT,有人分析它抓取了互联网1/3到2/3的文本数据训练。第三,数据获取方式。因为原始数据为人类规模的量,这就必须要用自动或者半自动的方式抓取数据。第四,训练结果发生了变化。现在的训练结果,是一种实例性的模型。”
大模型,就是经过大训练生成的大型实例性模型,例如,大型语言模型,也简称为大模型。大系统则是针对大任务、围绕大模型、集成大量技术的集成智能系统。现在的人工智能,是集成智能,它里面集成了非常多的、不同种类的智能技术。陈小平表示,中国想要抓住这一阶段的发展机遇,非常关键的是要在概念上跟上时代,甚至是提前定义。
人工智能现阶段的应用是生成式的,且已不再是狭义的生成语言、图像等内容,而是从人到AI、从AI到人的交互。“我认为,自然语言人机交互的重点是,会说话,能听懂人话,能回答问题,但不能保证回答一定正确。对机器语言表达的基本要求,是说话要符合人的语言习惯。”陈小平表示,语言习惯是什么,现在没有科学标准,但是有经验标准。所以关键是要掌握并利用这个经验标准,这就要从人类规模语料中自动提取语言痕迹,并用于人机自然语言交互。
语言痕迹来源于原始语料。陈小平用两个句子组成的语料进行简单举例:用于训练的语料分别为“我要上网,请打开浏览器。”“我要听歌,请打开音响。”这两句话反复说,且概率分别为0.6和0.4。如果基于相邻语元之间关联度的预测,也就是给定一个语元,预测下一个出现的语元,不确定情况下预测错误率过高。比如从“要”预测“上网”的错误率达到40%。如果基于语言痕迹远程关联度时(远距离语元之间的关联强度),“上网”与“浏览器”语元虽然不相邻,但具有高关联度,若已出现“打开”和“上网”,预测出“浏览器”的错误率为0。
对此,陈小平表示,基于语言痕迹远程关联时,预测错误率可以大大降低。这也是为什么大家觉得大模型好用。“虽然举例的两个句子只有六个语元,但在实际应用中,是从人类规模语料中提取语元关联度,用于自然语言人机交互,数据的量很大。人工智能可以回看的语元至少超过4000个,甚至已经有可以回看10万个语元的大模型发布。”陈小平指出,如果将互联网三分之一到三分之二的语言痕迹都抓取做成模型,大模型将非常强大。
上述所说的抓取语言痕迹,训练语言痕迹,对语言痕迹做关联,被称为预训练模型。这是大模型技术体系中的一部分。陈小平表示,实际上,预训练以后的实际效果可能不够理想,不够精细,此时就可以引入一种方法——细调。“细调类似于收音机的调台旋钮,一般收音机不清晰时,就需要细调旋钮,直至内容变得清晰。”陈小平表示,细调是专门训练出的专用模型,通俗来说,不是大范围的调整,而是有一个目标后,针对当前矛盾去细调。经过细调后的大模型应用效果会大幅提升。但是细调不是凭空实现的,需要大量的语言数据进行支撑,且用不同的数据进行不同的细调。例如聊天用聊天的细调,编程用编程的细调。
然而,细调后的大模型效果可能还是不够,还可以运用“提示”。“这是小规模的训练,为用户引导模型的回答。也就是在提问题时,不仅要提问,还要给出一些提示。如果提示说得好,回答的质量也会大幅提升。”
值得一提的是,大模型是实例性模型,是从训练预料中提取的语元和语言关联度的全体组成的模型,它没有概括性规则,无法进行数学-逻辑推理。“大模型是一种颠覆,我们需要用新的观念、新的理念去看待。”陈小平说。
一些科幻电影刻画出的机器人具有自己的情绪、情感,会有自己的思想。陈小平直言,拟人化想象对大模型以及所有通过了大规模验证的人工智能都不成立。“即使在和人工智能交互的工作中,会从语言中感受到情感、情绪,这也是因为语言的投射效应,即脑补。”陈小平表示,人说话都带涵义,所以习惯性地将自己理解的涵义投射到大模型上,认为大模型说话也带涵义。“对大模型人工智能做拟人化想象,是不科学的。”
大模型的应用,也将为人类带来重大的机遇和挑战。在机遇方面,陈小平表示,大模型可以应用于很多场景,例如聊天、智能家居的人机交互、文案撰写、智能客服等。人工智能的加持下,能解决很多以往大家无法解决的问题。
同时,大模型还会带来新的挑战。首先是公共安全,其次是就业问题。“2017年开启人工智能第四次浪潮的标志性实践,就是AlphaGoZero围棋程序面世,且该程序的围棋水平已经超过职业选手。现在,人类积累了千年的围棋知识很少再是人工教授或者看书,大家都开始通过这个程序进行训练和学习,人与人的对练已经很少。”他表示,虽然围棋是很小的领域,但未来大模型的应用可能会延伸到各领域,也有可能发生类似围棋领域的情况,从而影响就业。
人工智能如何在物理世界中应用,也是很大的挑战。比如现实世界中的家庭、医院、工业、农业场景,现在的大模型是无法胜任的。陈小平表示,现在在工业上普遍应用的机械臂,基本上都是刚性的,这类机器人重复精度高,但灵巧性、安全性低,适合用于结构化环境。对于更复杂的非结构化环境,需要精确测量、建模和计算,这就需要软体机器臂(柔性机器人手臂),也就是软体机器人。这类产品采用蜂巢气动网络结构,为材料-机构-算法的一体化设计。据陈小平介绍,与传统机械手臂相比,软体机器人在制作成本、负载能力、后期维护等方面都具有较高的优势。陈小平在现场通过几个视频,分享了软体机器人在喂饭、开门、拧瓶盖、拉抽屉等多个场景的应用。
对于人工智能在中国的应用,陈小平表示:“我认为,对于中国,大模型在智能制造、智慧农业、惠普养老三方面能得到很好的应用后,将迎来巨大的机遇。”
严正声明:“电器微刊”所有原创文章,转载均需获授权。