中国工业大模型正面临哪些挑战?

深度|中国工业大模型正面临哪些挑战?

2023年大语言模型的发展迅速,上半年百模大战,下半年很多科技巨头都在逐鹿科技大模型相关竞争,但是很多应用场景是在消费互联网侧,对于赋能新型工业化的渗透程度如何,业界也有不同的看法。

有的认为是人工智能技术在消费侧的应用渗透比较多,但在工业侧的应用是比较有限的,大模型在赋能新型工业化方面到底如何能够渗透到制造业中,也行业关注的一个重要的话题。

在制造业方面,大模型究竟是不是在工业领域转型升级最终的必选项?现阶段制造业难以快速使用大模型的难点在哪里?AI大模型能给制造业带来哪些机会?AI时代如何将专家经验和工业机理转化为自己制造业的优势和数字竞争力?

为此,中国工业互联网研究院智能所副所长顾维玺、北京信息化和工业化融合服务联盟理事长闫同柱、中工互联(北京)科技集团有限公司董事长智振和腾讯云智能制造首席专家邴金友,围绕“大模型是否是制造业数字化转型方向的必选项”展开深度探讨。

深度|中国工业大模型正面临哪些挑战?

左起分别为主持人顾维玺、闫同柱、智振、邴金友

以下为论坛实录精华版:

顾维玺:第一个话题,讨论生成式人工智能技术与制造业的一些不合以及矛盾点。面对生成式人工智能技术,就是大模型技术,行业是否有两种不同的声音?哪些企业对生成式AI技术更为积极?哪些可能观望态度更加明显?分别的原因是什么?

闫同柱:很高兴参加腾讯科技主办的活动,我在工业互联网方面做的事情比较多,我认为工业互联网的时候跟大模型有非常密切的关系。

实际上企业目前对大模型的认知包括两个方面:积极拥抱的企业属于高端制造业,就是因为高端制造业本身对知识的要求比较密集,本身也拥有数据和工业软件,不管是生产流程、管理流程,大模型起到的是优化,或者是在自动化领域对高端制造业有比较大的价值。腾讯、百度、阿里、京东,实际上都在做这些大模型。

自己拥有大量的数据,也有大量的算力,同时又有技术队伍,还有就是他们创新的精神,再加上也有资金的实力,都是云原生的企业,所以做大模型对他们来说非常重要,也是他们的立身之本,这类企业都在用大模型重构整个产品体系。

另一类企业属于内容创作,跟大模型也有很大的关系,包括广告业、游戏、电影,因为需要很多创意。

广告业可以通过大模型自动生成广告文案、广告场景、广告人物,这样的话会对整个工作效率的提升和质量有一个比较大的提升,所以这是积极拥抱大模型的一个方面。

有些企业对大模型起着观望的作用,传统制造业的数据量不是太大,觉得大模型的门槛相对比较高,大模型到底能够解决什么问题,能够带来什么效果,投入产出比怎么样,他们还看不太清楚,所以这个事情就会起到观望的作用。

金融也会存在这种问题,因为金融涉及到数据隐私的问题、数据安全的问题,还有医疗等等企业都和数据安全性关联度相对比较大,疗效到底怎么样,这些都是人命关天的,要是不达到相当高的精度,他们是不太敢用的。

顾维玺:确实是一个很重要的观点,大模型的不确定性依然是制造业最难以使用,难以快速接受大模型的重点。中工互联一直致力于开发工业大模型,您认为数据、流程、行业相关的知识以及Knowhow,哪些是最难的?特别是与生成式人工智能结合方面,哪些是壁垒?

智振:今年我们全年一直在做深入的思考,大模型里面有很多不确定性,为什么?同一个参数下放的是全世界的知识,知识密度是相对稀疏的,基于这个原因做了一个模型,大量放入工业知识,感觉现在效果是能够提升的。

大模型技术具体应用在哪个场景下,应用在哪个行业下,要把应用的这个点的知识大量地放进去,我们就会把一些大模型的不确定性,包括大模型幻觉问题的解决。

现在我们所做的专家系统是100%无害化,90%以上的准确度,这些是现在能够做到的。现在我们做的知识问答能够达到90%以上,包括电力标准的问答能够达到90%以上,这些是已经验证过的。

至于通用模型和专业模型的问题,我们自己是从预训练开始做了一个小一点的大模型,12月22日就会发布相关的产品,并且是开源的。

我们发现预训练阶段的数据集也是非常重要的,训练完了再用微调调出来,我们也会做一些基础性的准备工作。

今年上半年开始到现在几乎非常快,一开始大家做的是NLP,上半年大家觉得GPT3.5已经是很厉害了,但现在国内做的大部分对话模型基本上都能够达到3.5的水平。

现在大家提出的这个东西是多模态技术,我们也已经研究两个多月,接下来也会发布多模态的模型,相当于多个模型混到一起提供这种能力。

我认为大模型技术今年基本上全是按照大模型技术本身不断迭代,应用端不断探索,哪些工业领域可以应用,已经落地将近10个项目。

我认为明年可能会是大模型在各行各业应用的爆发年,今年年初突然震撼出现的技术到现在逐步学习,自己训练和进步,已经把大模型应用端的技术掌握了,但大模型更进一步的大规模应用,我认为是基于大模型理论理解的突破。

目前不光是中国,国外大模型理论也没有怎么搞明白,所以不知道里面的工作机理怎么样,才会出现所谓的幻觉问题。

顾维玺:邴金友老师也是腾讯的专家,您如何看待生成式AI大模型在工业方面的结合难点?

邴金友:我来自腾讯的行业部门,负责智能制造,跑的企业比较多,所以从企业的角度来看,怎么看AI大模型在企业的应用?AI大模型在企业的应用场景是很多的,困难也是很多的。

第一个困难是成本的困难,企业里面应用大模型需要成本,就是看投入产出,制造业都是低毛利的行业,大模型本身如果是商业化的模型可能还有费用,模型算力也需要费用,能不能带来很好的投入产出?有没有规模化?降本还是增效?大家知道现在大模型非常热,创业公司也非常多,真正的人才要么在大厂要么在创业公司,企业招人很难,学习好的可能过几天就跳槽了。

企业肯定是有很多数据,但这些数据也比较散,如果真正应用起来还要进行整理和规范,真正让大模型能够吸收这些数据,要么训练进去,要么就做知识库,要么就做微调,这个过程花的时间比较长,但是成本还好,关键是靠人。

技术难点就是大模型本身,至少目前我们看到的还是概率产出,工业里面要么是经济产出,需要100%正确,要么需要干预,所以这是一个差距,大模型能不能跟原来传统的数字技术结合起来。

人有左脑右脑,左脑负责计算,右脑负责艺术,传统的系统可能就是经济计算,要是真正用于操作就是100%无害,机器人万一看不准,操作错了,要是把人伤到了问题就比较大,可能这是企业比较关注的内容。

顾维玺:刚才三位专家也都是通过各自的经验谈了人工智能、AI大模型在工业领域应用的困难,下面我们具体分析AI大模型能够给制造业带来哪些机会,研发设计、生产制造、售后运维,哪些环节能够最先看到AI大模型带来的效果?

邴金友:目前AI在制造业应用已经有很多落地的场景,包括腾讯在制造业领域做的很多尝试和案例。

第一个落地的其实是大模型客服,不是完全做客服,就像在汽车厂做的把汽车手册全部做成大模型化,代替一部分销售的工作,当然也有一些是做客服的,别人过来咨询一些问题。

还有一些场景,飞机制造厂是企业内部的管理流程、管理办法训练大模型,然后去办出国、办签证,申请报销的话就会把这个事情办完。

除了这个场景之外,还有一些场景会用得更多一点,就是人力资源、营销、内容产出,或者是在设计方面,大模型可不可以跟原来的设计库结合起来产生一些设计的图纸。

我们有一家客户把二十年的方案库做成大模型,识别需求以后匹配方案库里面的方案,所以这种也是具体场景。

当然还有就是做业务的分析,原来做传统的BI需要做报表做分析,其实把企业内部的ERP数据和表格结构给模型训练以后,要是出报表的话就会帮助计算,怎样去理解场景还是非常多的。

顾维玺:售后运维、智能问答和研发设计讲了潜在的人工智能在制造业方面的应用点,下面请智总分享一下,能不能在生产制造环节或者其它环节讲一讲?

智振:刚才讲的这些场景也有我们的尝试,但大模型本身的核心能力是什么?首先是人机交互能力,工业领域但凡涉及到人有的,最后都会立马有场景体现出来,然后是知识能力,可以替代一部分重复的工作。

我们现在思考工业场景或者其它场景怎么应用大模型,基本上就是从这几个能力开始考虑。交互能力就是智能客服,最前端的营销,包括后面的管理、智控、设计,其实我们都要探索。

我们要看工业互联网和大模型结合,就是智能大脑的问题,我们认为智能工厂大模型就是最核心的大脑,二维怎么转化为三维,我们用大模型做得非常难。

咱们拿一个图片自动转化成为3D游戏是很容易的,精度不需要那么高,但在工业精度是非常高的,一旦实现的话是巨大的变革。

现在我们也在做代码生成的工作,经过简单的训练,写成的代码至少相当于一到两年程序员的水平,能够替代至少20%-30%的编程量,可以生成20-30行代码,大幅度降低人的工作量,包括整个工厂的知识库,我们认为都可以用大模型提高。

现在我们实验效果非常好,未来就会引起一个新的应用,就是增强现实穿戴设备,相当于增强人的能力,可以通过识别和知识库不断地跟人交互,提高个人能力,接下来也是一个热点方向。

顾维玺:闫理事长看过很多公司,这些信息化的公司目前有没有做出什么应用大模型非常典型的,可以推广的试点示范或者案例?

闫同柱:生成式AI可以做岗位手册、操作手册、营销手册,就是各种各样的文本,可以做设计、可以编程、可以做交互,这些都是大模型的应用特征。

大模型本身需要的是什么?需要大量的数据,一个智能制造平台本身就是人机料法环测,不是原来的仅有系统数据,光是智能制造平台就有大量的数据,何况工业互联网平台是一套平台体系,工业互联网平台底下是工业软件,中间有操作系统,其实没有脑袋。

我认为大模型有一个很大的能力是分析能力,这是其它工具不是特别具备的,大模型能够理解制度,能够理解流程,能够理解数据,能够理解模型,能够理解代码,能够理解软件,大模型拥有很强理解能力、学习能力、推演能力,可以去做预测、预警、决策和优化,可以解决很多多维复杂问题。

目前工业互联网平台缺少一个大脑,而这就需要大模型来担当这个大脑的角色。用大模型做平台大脑这个问题上我们并不要求做得非常精确,不要光靠大模型就能够解决工业界的各种问题,发挥大模型的长处运用大模型找出方向、找出目标、找出决策点、找出举措,并进行分工协同并交给工业操作系统,再交给工业软件,他们可以做得很精确,因为与那些小模型衔接,大模型跟工业互联网平台衔接,大模型和工业操作系统衔接。

因为每个技术都有优势,也都有缺点,明明是弱点,却要花很大成本和代价,最后发现还是消除不掉,即便消除掉也是投入产出比严重不足。

可能一个小的投入就解决了,我们却要在大模型上花费极大的代价,最后解决一个生产场景的小问题的精确度问题,不要用大炮打蚊子。

顾维玺:我知道腾讯一直是在大模型上研究了很多年,包括2022年OpenAI发布ChatGPT之前就在大模型上已经投入了比较大的精力,能否介绍一下腾讯在赋能制造业的一些成绩?

邴金友:腾讯在AI落地方面做得比较深,现在已经做到全国前三,整个规模做到过亿。腾讯做大模型本身还是相对比较低调,我们工业大模型是9月才发布,之前有些内测。

大模型本身分为几个部分,先是行业大模型,然后是企业大模型,之前我们也有做过相应的案例,然后再做通用大模型。

目前企业能够见到成效的大模型应用还是跟小模型的结合,就像原来做OCR,OCR绝对是小模型,原来OCR就是字,也是一行一行文字,现在就把OCR模型和大模型结合起来,结构化以后变成可复用的东西。

就像刚才说的,怎样把大模型和操作系统结合起来,解决刚才所说的问题,可复制性很大。

顾维玺:现在很多工业企业在发展信息化的时候都面临一个问题,自己本身已经具备一定的信息化基础或者工业互联网平台,或者有些AI能力,怎么应对AI大模型发展的趋势?就是把AI大模型的能力充分地与之前的系统更好地结合起来,更加发挥倍增效应,也是现在企业关注的重点,智总有没有什么见解?

智振:一项新的技术在工业中的应用是循序渐进的,因为工业中的所有东西都要投资,投资一个软件需要五到十年的回报期。

To C为什么快?因为普通消费者买来东西就是快速消费,直接用掉了。我们认为大模型在工业领域的应用必然是循序渐进,未来很有可能是颠覆的。

我们每天都会大量跟企业交流,我会告诉企业尽快拥抱GPT,但一定要投入特别大的精力和金钱,立马自己训练一个模型。

因为工业领域有大量自己的数据,随着大模型技术的逐步通用化,自己的微调或者利用自己的应用进行应用的成本会逐步降低下来,往后走的时候会更好地把大模型的能力和现有软件的能力,以及现有数据的能力结合起来

我们讲到算力、算法和数据,如果是从应用端来讲还有知识,知识其实就是场景,场景最终必须是客户给我们提供的。

我们虽然是理解工业,能够亲自到现场做过项目,所以我能够跟他们对上话。真正想要创造一个对你特别合身、特别有用的,你要自己挖掘出来需求,我们只能告诉你能不能实现这种需求,性价比值不值,这是最有经验的。

我们也可以把其它行业的先进经验带过来引导一下,最终场景知识的挖掘还是依赖客户。我们能够做的是数据端、算法端通用技术的提升,以及通用技术提升以后成本的下降,成本下降以后就会更好地赋能企业。

顾维玺:要在制造业端更好地跟IT的AI大模型供应商结合,不用重新建立自己的行业大模型。

智振:制造业企业不用自己建。可以选择和我们进行合作、结合。我们可以参照以往的经历,以前有些大的工厂,包括央企都有自建的工业互联网平台,多数也是跟外面的合作。

顾维玺:腾讯作为大模型供应商,怎么和制造业结合?制造业是要自己重新建立面向自己行业的大模型还是也要跟大模型的基础企业供应商结合,然后利用自己的能力发展行业大模型?

邴金友:我认为大模型是一个基础能力,也是核心算法或者核心能力。就像刚才讲的,我们拿操作系统举例,大模型相当于操作系统。所有企业都用电脑,但没有一家企业制作操作系统,基本上所有系统都是买的或者自带的。大模型也是一样,核心算法不一定完全由制造业自己弄。

因为大模型有三个部分:算力、算法和数据,数据的部分就会涉及到通用数据、行业数据和专用数据。通用数据大家可以在外面拿到,训练出来的大模型包括文心一言、通义千问,其实不用自己去弄,但行业数据和专业数据其实是外面找不到的,要么是企业自己的,要么是行业特定的。

要是企业想用大模型,自己的这一部分数据肯定是自己提供,怎么结合到原来的通用大模型里面?

其实确实是需要考虑,要是能够付得起费用也不是不行,但算法本身是通用的算法,大部分的制造业还是需要依赖于专业的应用公司、专业的模型公司,包括OpenAI、腾讯和阿里等等,还有一些公司专门做法律、医学和工业方面,有了行业大模型再把企业数据结合进去做好服务,然后再做相应的场景。

大模型本身的应用有五种技术:Prompt Engineering、知识库外挂、思维链就是分析、规划,还要做Agent,然后还有Multi Agent,需要协同合作来出广告策划,就是类似于展会策划,几个Agent一起去做。这些技术都应用起来,不可能企业全部都自己做,因为术业有专攻。

顾维玺:现在很多制造业在信息化方面应用程度并不高,更不要提数字化,很多都是在专家经验进行使用和操作,AI时代如何将专家经验和工业机理转化为自己制造业的优势和数字竞争力?

闫同柱:中国工业本身场景很多,数据量也很大,大量的工业知识和工业数据,工业知识和工业数据很多地方都被遗失掉了,就是这些东西很多都存在于我们企业,尤其是那些老的工程师、老的专家的头脑里面和电脑里面,并没有转化为企业的知识资产。

就像我国的石油勘探技术全球都认可,但这些老专家最后有的离职了,有的退休了,有的离世了,这些知识就断掉了,最后导致很多新的员工进来的时候又得从头开始进行摸索。我们的很多创新都是在重复造轮子,就是很多东西没有被沉淀下来。

能不能被沉淀下来,很大程度上跟数字化有很大关系。以前中餐的厨师用多少油、用多少盐,都是师傅的经验,凭借自己的手感。

要是我们用数控设备以后,用多少油可以直接数字化,然后把师傅操作的工艺流程模型化,自动炒菜机就形成了。

目前大量的企业主要工作就是没有进行数字化和量化,没有模型化。工业企业下一步需要建立工业的知识库、工业数据库,还有知识图谱,既有大模型也有小模型,深度学习和机器学习,包括在工业互联网平台,平台是未来大模型运用的重心。

因为企业内部的工业互联网平台、智能制造平台、研发设计平台、供应链平台、营销平台、客户交互平台,产业链平台,每个平台里面都存在大量的数据,又存在大量的小模型,未来要让大模型学习和理解,再加上外部的数据。

刚才讲到企业内部的数据,现在大模型难以从外部获得工业数据,企业内部数据和企业内部模型都是拿不到的,能够拿到的都是公开的东西。

我对模型的划分,第一类像腾讯、百度、阿里这些都是做基础性的通用大模型,肯定就是几个巨头在干这个事情。

第二类就是工业通用基础大模型,向思谋和中工互联做的就是工业通用基础大模型。

第三类就是行业通用中模型,要求行业知识密度更大,围绕一个垂直行业,所以模型参数就没有那么大。

第四类就是围绕产品的价值链体系协同起来,这个也可能是中模型;第五类就是围绕产品的某个环节,这个就是一个小模型。

有大模型、有中模型、有小模型,这些东西都是术业有专攻,各自做各自的专长,然后相互协同协作。因为工业场景的专业程度,有宽度的,有深度的,不同层级紧密协作和协同,这些可能是未来大模型创业的方向和趋势。

顾维玺:闫理事长非常强调行业经验和行业Knowhow,下面我也想请教智总,你们训练工业大模型的时候怎样保护或者解除制造业自身的数据贡献出来的安全隐私顾虑?如何更好地利用行业Knowhow,采用什么方式让制造业把自己的数据贡献出来?

智振:一个工业模型未来的数据包括几个方面:通用的、行业的、客户隐私的,客户隐私的数据是很难往出拿的。

现在国家有一项政策就是逐步把数据资产化,可能是比较长远的规划。我们尽可能想找一些发行集团去做,下面有几百个、上千个厂,从集团的角度可以把数据拿到。

我们定位万企赋能计划,只要提供数据,训练完就免费使用,我们要尝试一下明年有没有企业愿意把数据拿出来加进去做,还要尽可能把模型的通用性和专有性功能分开,基于自己特定的数据,外挂知识库和知识检索等等能力,不需要送到模型里面,安全性要求特别高的数据就不要往出拿了。我们需要把模型尽可能训练得小一点,就是做局部的模型,成本也比较低,我们可以提供独立的训练服务。

顾维玺:面向未来制造业,刚才专家也在强调如何让AI真正帮助制造业降本增效是一个关键的变量,什么时候大模型才能真正成为企业的刚需?现在应该怎样布局?持续观望还是等待?或者应该积极入场?

邴金友:刚才提到企业应用大模型无非就是两个问题:降本增效,降本其实是有天花板的,企业里面不可能没有成本,增效是没有天花板的,其实降本和增效都有成本。

如果从降本的角度来讲,因为大模型本质上还是提高人的效率,替代一部分人,如果大模型运行成本是一个人成本的1/10,肯定是降本。

增效就是另外一个角度,要看增多少效,只要能够Cover成本的话都是刚需。大模型在企业里面更多的是一个渐进的计划,所以我认为现在企业如果有条件的话都应该开始布局大模型,哪怕开始测试,哪怕开始和企业接触,寻找一些方向,大家去看一看到底是做什么东西,企业和行业中能够做什么场景,哪些场景能够产生效果都是好的。

我们很愿意和大家一起共创,因为大模型本身也是未来的计划,希望能够对制造业有一个很大的贡献。我们非常愿意和大家一起合作,无论是生态还是企业。

顾维玺:智总刚才提到不仅在研究大语言模型,也在研究多模态模型,现在Google刚刚发布双子星,一举颠覆GPT4在各个排行榜的表现,您认为将来制造业更会用大语言模型的场景还是用多模态大模型场景更多?

智振:我觉得大模型技术分为训练大模型,基本上就是从预训练到SFT、强化学习,所有模型都是这三步训练,多模态大语言模型取决于知识是什么形式,未来必然是多模态的形式。

未来不光是多模态,可能会把其它的形式输入进去,我们现在最终出来的就是大语言模型和多模态混到一起的。

一旦具备从零开始训练大模型,并且能够训练多模态大模型,多个模型合到一起的话,能力会大幅度提升,现在觉得很难的事情,到时候可能就都解决了。

我们觉得多模态接下来应用场景完全打开。我们之前提到过一个概念,就是大模型产品要做到“平急两用”。

举个例子,战时应急状况下,一个单兵也可以借助人工智能来增强自己的单兵作战能力。

山里面的一个人可以通过视觉分辨哪些草能吃、哪些水能喝,或者是头盔戴着朝上的识别,可以识别无人机是不是在脑袋上。一旦把多模态做了,并且轻量化以后,场景就太多了。我特别看好边缘侧智能的发展,可能体量会远远超过现在的想象。

顾维玺:闫理事长,您期待大模型给制造业带来哪些改变?未来会被AI重新优化和重塑的制造业将会成为什么样的形态?

闫同柱:大模型对制造业未来最大的价值点在于创新,支撑创新的是知识、经验和能力,大模型在学习知识、总结经验和提升能力方面是强项,而不是生产线上围绕一个场景解决一个点的问题,因为那些点的问题有太多低成本的手段。

大模型最大的特点是什么?理解力特别强,包括理解文字、理解文本、理解模型、理解算法、理解流程、理解软件,同时学习力很强,推演能力很强,制造业最短的那个板是创新,创新是建立在知识、经验和能力的基础上。

国家为什么重视?因为它能促进制造业创新,而不是用大模型去解决生产场景的降本增效问题,这本身也不是产业的核心痛点,是要通过大模型构建企业的知识体系,构建企业的核心竞争能力。

美国为什么重视?围绕制造业最核心的东西在于创新,不是简简单单的降本增效,更重要的是创新。大模型是具备这样的素质和条件,可以成为一个资深专家,一个博士才能掌握多少知识?

大模型可能等于一万个博士,而且可以灵活运用,构建产品的知识体系、构建企业的知识体系,产生很多的创意,产生很多的创新,而这些东西对工业来讲非常重要、非常关键,可以是我们创新的大脑,也是工业互联网平台的大脑,能够把我们企业核心能力的建设做好。

我们每个岗位背后都有员工,每个员工背后如果都有一个岗位虚拟资深专家,这样每个岗位都变成专家的时候,企业的整体竞争力就会很强。

我们应该把大模型的应用更多地放在能力建设,通过大模型解决企业的核心能力,解决企业的创新,解决企业整个资源优化配置,这才是大模型最应该发挥的地方。

| 文章来源:腾讯科技

欢迎加入东西智库微信群,专注制造业资料分享及交流(微信扫码添加东西智库小助手)。