自2020年4月数据作为数字化社会的关键生产要素被列入政府文件后,如何利用算法模型通过机器算力从数据中提炼出智慧,从而通过人机协作提升认知与改造世界的能力已经成为数据智能的研究方向。
本文将结合数据智能的传统研究方向,从应用价值实现的视角出发,重点讨论如何通过数据与知识双轮驱动为数字化系统在感知、分析、认知、决策和行动等环节提炼出相应的数据智能,并基于人类认知的“快慢双通道”机制将不同环节下割裂的局部智能拉通形成持续型智能,从而为体系化提升企业智慧生产运营的能力提供参考框架。
一、数据智能的体系化研究方向
对于数据智能的研究,计算机科学家吉姆·格雷(JimGray)从方法论视角提出了数据驱动科学发现的第四范式,他认为除了之前的物理实验、模型推演和计算仿真三大范式之外,人们可以先获取大量的数据后再通过计算得出之前未知的理论模型。这种数据智能“方法论”的基本思想是把数据看成现实世界的事物、现象和行为在数字空间的映射,认为数据自然蕴含了现实世界的运行规律。进而以数据作为媒介,利用数据驱动及数据分析方法揭示物理世界现象所蕴含的科学规律。
另外一种值得探讨的是数据智能的“本体论”视角,认为数据是反映自然世界的符号化表示。既然自然世界是客观存在并具备共性科学规律的,那么反映自然世界的数据空间也可能具有独立于各个领域的一般性规律。当前业界所公认的“本体论”是关于数据、信息、知识及智慧的DIKW金字塔体系:原始观察及量度获得了数据、分析数据间的关系获得了信息,通过总结信息并应用于指导行动产生了知识,而进一步通过悟出来的智慧则更多关心对未来的预测和影响。
现阶段,以深度学习为主的人工智能还是一个通过大数据训练所得到的知其然而不知其所以然的算法模型。为了获取更好的可解释性及自我进化能力,人工智能领域的三大流派:符号主义、连接主义和行为主义开始走向了融合,基于数据与知识双轮驱动的认知智能成为“本体论”重点的研究方向。此外,近年来科研人员正在将第三范式的数值仿真与第四范式中的深度学习相结合,在“方法论”上逐渐探索出了一个兼顾科学发现的速度与准确性的新范式,即将来自科学基本方程的数值解用于训练深度学习神经网络的数据,而非经验观察人工标注的数据。可以看到,虽然数据智能在不断地发展,但其多样性和非确定性也使得其在面临复杂问题和复杂系统时难以给出满意的答案,因此从工程化角度而言,人们更需要从应用价值上考虑可实现的数据智能,及相关系统设计的合理性与演进方向。
二、面向应用价值的数据智能分类
数据智能的核心价值可以归结为帮助知识工作者基于数据要素构建一种认识、适应和改造自然的新能力,并将此能力用于增强机器智能和智能决策。数据智能带来的工具革命和决策革命,将能使人们在数字世界描述企业运营状态、实时分析、科学决策和精准执行,其本质的变化是实现了生产全流程、全产业链、全生命周期管理数据的可获取、可分析、可执行。但目前业界尚未从价值实现的角度明确企业需要哪些智能,以及当下能够支撑这些智能相应的“数据、算法和算力”技术组合。
基于人类通过感知、描述、诊断、预测、处方和行动等不同的环节与物理世界进行交互的方式,我们总结了相应环节下数据智能所需解决的问题,从应用价值角度给出了相应的数据智能内涵能力及外延技术,具体定义如下:
感知智能:主要研究机器能否观测物理世界是什么(whatisit)的问题;
分析智能:主要研究机器能否呈现物理世界发生了什么(whatishappening)的问题;
认知智能:主要研究机器能否理解物理世界为什么发生(whyithappened)和预测还可能发生什么(whatwilllikelyhappen)的问题;
决策智能:主要研究机器能否帮助解决应该做什么(whattodo)的问题;
行动智能:主要研究机器能否解决如何做(howtodo)的问题;
基于当前数据智能技术在不同环节所具有的增强智能工具和智能决策的能力,这五大智能的分类能够帮助企业根据其现状及发展需要,确定相关数据智能技术的部署。但我们也需要注意,随着通用人工智能技术的不断发展,不同环节下的数据智能界限将逐渐模糊,并有机融合,最终形成一个具有全功能的数智大脑。
三、基于认知心理学的数据智能双通道架构
丹尼尔·卡尼曼(DanielKahneman)在其2011年出版的《思考,快与慢》书中,从认知心理学的角度说明了大脑中存在两套系统,分别是:
系统1:直觉的启发式系统(heuristicsystem),也是“快通道”。这个系统处理问题依赖于直觉,处理问题速度快,自动化地给出解决方案,信息加工时提取部分信息,容易产生各种决策偏差。
系统2:理性的分析加工系统(analyticsystem),也是“慢通道”。这个系统处理问题是有意识的努力的结果,依赖于系统性信息加工,启用算法规则处理问题,加工速度慢,可以回避各种决策偏差的影响,但是需要耗费更多的心理资源。
基于认知双通道理论,我们针对智能化系统的设计提出了“基于数据、信息和知识模型构建记忆存储系统,有效融通侧重于归纳的数据计算与侧重于演绎的知识计算,面向特定领域实现具有感知智能与行动智能的快通道,和具有分析智能、认知智能和决策智能的慢通道,进而形成相互连通且自主演进的数据智能系统”。
在面对决策问题时,快通道首先启动对外部刺激做出反应,并形成感知信息传递给慢通道。慢通道接收了这些信息,就会通过运算式的分析加工转化成有意识的想法,给出更加复杂的决策判断,进一步转化为自主性的行为。这种快慢通道的分工代价最小、效果最好。因为快通道在熟悉情境中采取的模式是精确的,所做出的短期预测是准确的,遇到挑战时做出的第一反应也是迅速且基本恰当的。然而快通道有时候会将原本较难的问题做简单化处理,最终导致不能有效解决问题,这时慢通道激活后会有效地整合多方面的信息材料通过复杂运算来解决难题,其决策判断质量更高。
四、数据智能有序可控分级演进路径
在企业数智化转型的过程中,我们可以首先增强机器对现实世界的感知,并使其能够按照既定策略采取相应的行动,使得机器能够代替人类完成常规情况下的“快通道”服务。但另一方面,机器还需要相当长的时间才能像人一样具有“慢通道”的思考能力,因此在分析、认知和决策上我们更多是利用机器强大的计算智能与人的深度思考能力相结合,通过人在环路的智能化流程不断提升机器智能。
来源:亚信科技
‖ 图 1:亚信科技数据智能双通道技术框架
毫无疑问,我们今天看到的数据智能算法和应用都属于弱人工智能的范畴,也称应用型人工智能。指的是专注于且只能解决特定领域问题的人工智能,其方法主要是借鉴人类的智能行为,研制出更好的工具以减轻人类智力劳动。而强人工智能即通用人工智能AGI(ArtificialGeneralIntelligence)主要专注于研制像人一样思考、像人一样从事多种用途的机器。但通用人工智能的定义过于宽泛,缺乏一个量化的标准来评估,因此我们希望从人工智能赋予机器在感知、分析、认知、决策与行动上的能力成熟度来定义从应用型人工智能向通用人工智能的演进阶段。以下的分级模型说明了当前数据智能正从以感知为主的快通道向以认知为主的慢通道升级,之后快慢通道有机连通将形成具有完备自主智能的机器生命,并最终具有一定的社会性。
需要强调的是,我们认为通用人工智能只需要具备胜任人类所有工作的能力就可以了,未必需要人类的意识。事实上,当前通用人工智能研究活跃的子领域,如预训练大模型、小样本训练等,都是与制造智能“智能工具”直接相关的,而对与“智能工具”不太相关的内容,如自主心智、独立意识、机器情感之类,罕有严肃的研究。
五、亚信科技数据智能系统实践案例
机器人流程自动化RPA技术在短短
几年发展迅速,但传统的RPA只擅长处理基于规则、机械性的任务,缺乏竞争力。亚信科技通过引入数据智能技术,推动其向智能流程自动化IPA演进。如果将RPA比作一个人的四肢,可以做机械性的动作,那么数据智能则可以赋予它听觉、视觉和表达等能力,直至认知与自适应环境的能力。基于上述数据智能双通道技术框架,IPA系统的设计可以将智能文档处理等感知识别能力作为RPA开箱即用的“快通道”智能服务,而将任务挖掘和流程挖掘等技术作为“慢通道”支撑业务流程的认知与优化。
来源:亚信科技
‖ 图 2:亚信科技数据智能分级模型
同理,商业智能BI、智能运维AIOps以及诸如智慧安防智慧园区等智能业务系统都可以参照双通道技术框架进行数智化升级的设计。
六、结束语
企业在数据智能的建设中,单纯构建既定模式下的快通道容易造成人工“智障”现象,而需要通过慢通道以人机结合的方式不断优化数据、知识、算法甚至算力。只有将感知、分析、认知、决策和行动所需要的智能服务以双通道有机贯通,才能实现内生一体协同促进的智能大脑。亚信科技在数据智能体系化建设的过程中,一贯秉持有序可控的理念增强机器智能,逐步代替人类重复性劳动,提升人机融合的整体智慧,面向未来创新。(文︱朱军亚信科技数据智能首席架构师、高级产品总监廉霄兴亚信科技数据智能技术专家)