地面以下近千米的山东能源李楼煤业矿井工作面,只有零星几个矿工的身影,每隔一段距离就有几台摄像仪和无线基站,采煤机等设备也安上了传感器等信息控制单元。靠着这些装置,地面调度指挥中心能清晰观察和动态监管施工过程。防冲卸压施工孔深监管流程,从原本的3天缩短到现在的600秒,人工审核的工作量降低了82%。这背后,AI大模型功不可没。
近段时间以来,大模型已经从写诗、作画、编论文,开始向能源、汽车、钢铁等工业领域挺进,在设计、研发、管理等环节崭露头角。由于工业领域本身门类多,企业间的数据壁垒明显,尤其在核心制造环节,大模型并非“万能”。而对于用户而言,大模型的实际效果如何,以及是否能够支持快速迭代最为重要。有专家告诉《中国电子报》记者,未来十年,工业领域或将呈现大模型和小模型共存的局面。
工业大模型是怎样炼成的
在采煤过程中,在卸压钻孔施工时,如果人员操作不当,比如深度不够、角度有误等,就会导致出现安全隐患甚至发生事故。
最近,山东能源集团、华为、云鼎科技联合发布的全球首个商用于能源行业的AI大模型——盘古矿山大模型,解决了这一难题——原先卸压工程规范性验证需要工人下井逐个检查,在引入大模型后,工人坐在办公室里就能完成这项工作。
工业大模型是工业企业数字化、智能化“进化”到一定阶段的产物。山东能源集团启动数字转型之初,日均处理数据已达到2亿条。2022年年初,其在智能化煤矿基础上,逐渐实现经营管理与智能生产分离、数据不出园区、支持规模复制、学习分析小样本等能力,并搭建起中心训练、边缘推理、边用边学的人工智能运行体系和管理体系。
从今年开始,山东能源集团瞄准效率提升和安全生产,让一线生产工人深度参与大模型的应用工作,将分散在数十座煤矿的一线经验和能力集中到平台,并沉淀在大模型上,半年之内训练出了覆盖煤矿生产皮带运输、立井提升、辅助运输等数十种场景的模型算法,助力企业提高安全生产效率。
在能源行业的油气勘探环节,“给地球做一次三维CT”需要处理PB级的地质数据。如何更好地理解、分析、利用海量数据,实现全链路的提质增效,成为行业的挑战。
今年4月,阿里云宣布与中国石油集团数字化转型专业化公司昆仑数智共建油气大模型。昆仑数智相关负责人表示,公司正在结合油气专业数据、油气专业知识和业务智能化需求,基于阿里基础大模型开展深入预训练、调优等工作,打造油气大模型。油气大模型打造完成后,将在勘探开发、炼油化工、油气销售等业务领域广泛开展油气地质工程模型化协同研究、油气田开发方案智能决策和优化、油气生产设备预测性维护等系列智能应用合作研究。
由于工业大模型还处于应用早期,如何落地,会产生哪些颠覆性应用仍有待明确。大模型企业也正与行业客户摸索合作的场景和切入点。
据百度智能云智慧工业事业部解决方案总经理吴学义介绍,在化工行业,目前找来的客户主要分两类:一类希望与百度合作做大模型的研发,把行业里安全生产、管理等各类标准,通过大模型知识固化,形成共性的服务平台;另一类则希望提升工艺设计。例如,在生产过程中需要多轮质检来保障产品质量的某头部化工企业就希望结合此前的数据积累,和大模型厂商共同打造一个质检降频的大模型,以此降低成本,提升生产效率。
在设计研发管理环节
率先落地
记者曾接触过一位在用大模型来设计散热叶片的工业企业负责人。“当时,我们的研发人员都认为,弧形叶片的散热效果最好,但大模型最终给出的设计方案不是弧形,而是不规则形。试验效果显示,这种不规则叶片散热效果更好,打破了所有研发人员的固化认知。”该负责人说道。
“大模型因具有强大的表征、泛化和自适应能力,在处理复杂的自然语言、图像、时间序列等任务上表现优异。其在经过充分训练后,无须针对特定问题进行定制化,能够自动学习新的模式和规律,具备一定认知和推理能力,且能适应不断变化的数据和环境。”用友智能制造事业部高级技术架构师叶琳告诉《中国电子报》记者。
用友通过对海量废钢图片训练,构建了用友BIP智能制造废钢判级大模型,在鞍钢等20余家钢铁企业上线应用,废钢判级准确率达95%以上。值得一提的是,由于该大模型具有很好的泛化能力和自适应能力,面对企业的不同需求,技术人员几乎不用对原本模型做过多调整,而其他小模型却不具备这些特点。
叶琳提及的这类大模型属于视觉类大模型。依托视觉识别能力,可以广泛用于图像识别或缺陷检测。
另一类工业大模型便是自然语言处理类大模型,能够基于内容生成和自然语言交互能力,带来产品研发工具和研发手段创新,成为一些企业级应用的AI助手,提高工作效率。
随着发展,工业领域也逐步涌现出了多模态大模型。日前,华为推出了盘古大模型3.0,与OpenAI聚焦于GPT一个大模型不同,盘古大模型3.0包含了基础大模型、行业大模型、场景大模型三层架构、多个模型,采用了“完全的分层解耦设计”。华为常务董事、华为云CEO张平安解释称:“为了更好地适配行业不同场景,必须要做到完全解耦。有些企业只需要图像分析不需要文案生成,基础大模型和能力集解耦后,他们就可以按需调用,甚至在数据解耦,模型升级时,数据就可以复用。这个解耦架构,也实现了模型的并行迭代。”
从上述已经落地或正在开发中的大模型趋势来看,工业大模型率先落地的场景基本集中在企业的设计、研发、管理等环节,以此提升人机交互性能及业务系统之间的互通效率。
比如,在企业跨系统数据分析方面,过去可能需要在多个系统中查询数据,再动用一些工具才能进行数据分析,而生成式AI则可以通过一句话自动完成以上动作并给出分析结果;在设计草图生成方面,设计师只需要输入一些关键参数,AI便可自动生成相应的产品设计草图,供设计师进一步修改或确认;在故障预测与维护方面,通过对大量传感器时序数据的分析,大模型可以预测机器设备的故障风险,从而实现智能化的设备维护,减少停机时间和维修成本。
大模型
并非“万能”
ChatGPT类生成式AI在实际使用过程中经常会出现一些胡编乱造的“惊喜”。但是工业生产不仅不需要“惊喜”,反而最害怕“意外”,一个小小的故障或停机就可能带来成百上千万元的损失。
要想让大模型生成可靠、可信的结果,需要一系列严苛的前提。
数据是大模型的营养,大模型靠不断地“吃数据”“消化数据”维持良好的性能。相比之下,蛋白质序列大模型发展较为迅速,已经能够解决蛋白类新药在研发过程中普遍存在的耗时长、耗费高等难题。之江实验室智能计算软件研究中心主任潘爱民告诉《中国电子报》记者,这是因为蛋白质基因序列的数据非常丰富,往往有上亿规模的数据量,为大模型的训练、使用和迭代带来极大的帮助。
数据还要足够标准化和规范化。以开发矿山大模型为例,山东能源集团在启动数字转型之初,日均处理数据已达2亿条,随着智能化建设的深入,企业开始以标准的信息架构和数据规范全面打通OT、IT、CT三大系统数据,逐渐形成海量多源数据的统一接入、汇聚和处理,为推动大模型持续优化升级带来便利。
要想不断提升大模型的专业水平,GPU/TPU加速器、基础软件、外挂插件、搜索引擎、相关数据库等一系列IT软硬件设施都要足够完备和先进,这也将造成巨大的使用成本。同时,训练和微调行业模型所需的高质量行业数据的获取和整理,也需要消耗大量人力和时间。
大模型并不是“万金油”。
“适合的场景可以基于大模型来提升竞争力,但目前在工业场景中没有哪个场景和应用是‘非大模型不可’的,特别是大模型对生产排程等核心制造环节的用处还不是很大。”潘爱民告诉记者。
潘爱民解释道,工业领域本身门类多,各个企业间的数据壁垒非常明显,尤其在某些核心制造环节,难以收集到足够的标注数据来训练这些模型,这类环节往往不适用大模型。
“工业大模型并不能替代工业系统,短时间内也无法成为企业智能化的‘底座’。”业内专家告诉记者,从其底层技术看,大模型对各种AI模型的综合应用更加接近人类大脑的工作机理,尤其擅长自然语言和文本处理等领域的融合,但它依旧与工业系统的智能具有不同的机理构成。
大小模型
要互补发展
目前来看,足够智能、能够覆盖所有场景的大模型时代还远远没有到来。业内专家一致认为,在包括工业行业在内的产业智能化发展过程中,未来十年将是大模型和小模型共存的局面。
“一场景一模型”的小模型方案有定制化能力,场景贴合度好,解决某一具体问题,尤其是特异性问题的效果较好。比如,在精准科学计算和符号推理方面,大模型并不比小模型可靠。在之江实验室,小模型已经帮助天文、新材料、生物医药等诸多领域攻克了不少“卡脖子”难题。
然而,小模型在应用于新任务或新领域时,可能需要进行重新设计和训练,不如大模型那般具备较强的泛化性。叶琳告诉记者,用友原本有30多个废钢智能判级小模型,虽然每个小模型准确率比较高,但当新的客户带着新的需求过来,不少小模型都需要重新训练、标注、迭代,否则准确率会降低。
实际上,在工业制造智能化应用中,大模型和小模型两者并非相互对立,而是可以协作的。例如,厂商可以根据任务的复杂程度、数据量、实时性需求和计算资源等因素来选择合适的大模型或小模型。
在某些情况下,大模型和小模型还可以相互转换。“大模型基于对通用知识的理解变得更广泛,能够补足小模型的学习能力、交互能力和生成能力,可以通过压缩或者知识蒸馏部署到小模型环境中,去替代一部分能力。也可以采用模型压缩技术,将大模型压缩成小模型,以平衡性能和资源消耗。”九章云极DataCanvas副总裁于建岗表示。
“大和小是相对的。”于建岗表示,当前,大模型的参数标准并不统一,相对于参数级,模型的效果如何,且是否能够支持快速迭代等对于用户实际应用来说更为重要。用户只有能够在一个白盒大模型基础上快速且低成本地微调和迭代出客制化的小模型,才能高效实现丰富场景的大模型应用。
目前,很多场景应用已经拥有初步效果,但是否能够形成投入产出比清晰的可持续的商业模式,从而实现规模化的复制和推广,则还有待观察。基于这层考虑,有观点认为,大模型更适合专业供应商和部分头部企业,而更多企业更适合优先从特定场景角度,开展“领域大模型+专用小模型”的应用试点。