在IT系统中,数据库是核心软件之一。这里的“核心”有两层含义,其一是在绝大多数IT系统中数据库必不可少,是核心支撑软件;另一个是企业的核心数据一般都会保持在数据库中。因此,数据库一直都是IT运维管理的重点,并因此有了一个专门的职业分类——DBA(数据库管理员)。DBA的主要工作就是负责数据库的日常维护,包括打补丁、备份、调优等,这些工作非常重要也非常繁琐,技术含量很高,在IT人才市场非常紧缺。不过,随着自治数据库的诞生,DBA的从业者可能不得不考虑自己的职业前景了。实际上,不只是DBA,自治数据库的出现很可能会对整个IT系统的构建和部署方式都带来全新的冲击。
“自治数据库”是甲骨文在2017年的OOW(Oracle Open World)大会上第一次正式对外发布,是甲骨文当时正在研发的新一代数据库。一年后的今天,这一产品已经正式上市:先是在2018年3月推出了主要针对分析而优化的数据仓库版本(ADW),后来又在2018年8月份推出了面向事务处理的数据库版本(ATP)。
自治数据库主打“自治”,对应的英文是“Autonomous”,意思是“自治的、有自主权的”,这也正是甲骨文新一代数据库的最大特点:不用人工干预,自动完成包括打补丁、备份、调优、修复和扩展等这些以前由DBA完成的工作,从而把人从繁琐的数据库日常运维工作中解脱出来,去从事更有价值的工作,比如数据模型、架构的规划和优化等。
根据甲骨文提供的数据,通过自动运行、自动完成打补丁、自动完成数据的备份、自动修复等,甲骨文自治数据库能降低70%的数据库运维工作量,将数据库平均宕机时间减少到每月2.5分钟。
在接受记者采访时,甲骨文中国高级技术咨询总监李珈用3个词来概括甲骨文自治数据库的特点:简单、快速、弹性。所谓“简单”就是无需人工参与,实现自动化管理;“快速”就是与Exadata集成实现比同类数据仓库产品超过14倍以上的性能优势,而且由于它提供了更多通用功能,从而能把长达几个月乃至1年以上的数据仓库系统建设过程缩短为以“天”计;“弹性”是指充分利用了云模式的特点,实现了按需缩放和空闲时关闭,而且只为使用的资源付费,从而实现成本的大幅降低。
可以说,自治数据库的推出充分展现了甲骨文多年在数据库领域的技术积淀,甲骨文正是把这些技术与人工智能、机器学习以及云计算等最新技术紧密结合,才有了最新一代数据库的面市。而通过自治数据库,我们也可以看出,在数据库领域甲骨文依然走在技术前沿、引领着数据库产业的未来发展。
以下为记者对甲骨文中国高级技术咨询总监李珈的独家专访:
邹大斌:Oracle数据库从上一个版本12C的发布到最新的自治数据库18C中间历经了五年以上。在您看来,过去这五年IT领域发生了哪些重大的技术革新,推动了数据库技术的进步,让甲骨文的新一代数据库有了这么多革命性的变化?
李珈:过去五年时间里我们确实看到了IT技术和市场的快速变化。在这个过程中,Oracle作为数据库领域的领导企业,一直走在数据库技术的前沿。总结起来,这几年来我们看到了几个关键的变化:
第一,随着技术的日趋成熟,云计算已经真正进入到企业的业务环境中。在此之前,企业更多采用的仍然是私有云技术。但现在,已经有越来越多的企业正在利用公有云实现快速开通、快速部署,并受益于公有云的高弹性按需付费,甚至还有不少企业也在考虑把自己的核心业务系统部署到公有云平台上。当然,我们发现,公有云技术本身也日趋成熟,已经具有较好的高可用性、安全性、可伸缩性和可靠性等特点。这些能力的提升,使得平台上的系统能够实时响应业务变化,在这样的背景下数据库技术也在不断变化。
第二,如今AI技术已经从前期的小规模创新逐步落地到了企业的实际应用领域中,所以,我们在数据库中也提供了自治能力,它能够自动应用到对客户的数据洞察、对数据库使用方式等场景中。
我认为以上这两项关键技术是在过去五年当中对我们的数据库影响比较大的。当然,除此之外还有内存技术、分布式数据库、分片技术等等,这些技术在Oracle 18C中对分布式能力的提升也是非常关键的 。
邹大斌:一直以来我们对数据仓库有一个基本认知:数据仓库是大企业专属,很复杂,长的三、五年,短的可能也得一年。而自治数据仓库给我们带来的一个新变化就是它能够帮助我们快速构建数据仓库,从以年、月计到以天计。Oracle的自治数据仓库为什么能帮助我们那么快速地去构建数据仓库?
李珈:关于这一点,很多企业客户在最初接触时也曾有怀疑。过去,企业构建数据仓库可能需要6个月、一年,甚至两三年,但是Oracle的自治数据仓库却可以在短短几天甚至分钟级内进行构建。
事实上,我们看到,传统的数据仓库覆盖了整个企业的方方面面,数据源相对较多,而自治数据仓库的出现则可以让企业从小处开始入手。它提倡的是创建一个敏捷数据集市的理念,可以针对于某些业务主题,让业务部门直接进来“玩”数据。换句话说,企业原来在做数据仓库的时候第一步是做业务分析,需要弄清楚所要分析的内容,而这些内容通常不是IT部门所了解的,甚至很多情况下业务部门自己也不知道该分析什么。双方之间来回碰撞,最后整个过程可能会花费几个月的时间。
现在,我们的做法是让业务部门直接参与进来,比如说通过某个市场活动产生的一系列数据,就可以让业务部门人员直接对这些数据进行应用,了解其中的模式。通过对里面这些模式的深入认识,我们不需要再重复建数据模型,就可以进一步拓展这些数据的能力,从一个基础的交易数据拓展出每周、每月甚至每年的数据。
再比如,针对一个关键的业务数据,自治数据仓库还可以通过多维度的数据分析为业务人员找出系统与系统之间、数据与数据之间的关联性,找出与最关键的业务收入相关的因素。借助平台的这一能力,业务部门即便不懂具体算法,也可以及时对相关数据做出调整。这就是Oracle自治数仓为什么能够加速企业业务数据洞察能力最关键的一个原因。
邹大斌:我理解的就是,Oracle自治数据仓库通过降低了IT门槛,给业务部门赋能,从而提高加速了数据仓库的构建。
李珈:对,你总结得非常好。其实就是把业务的复杂度和IT复杂度都降低了,让业务部门的人可以直接去对数据进行多方位的洞察。
邹大斌:新一代自治数据库的很多特性,包括灵活、弹性以及更低的拥有成本,这些特点在一定程度上是基于公有云这种部署模式。请问,对传统部署模式我们能够从新一代数据库中得到哪些好处?
李珈:是的,自治数据库的确从公有云模式中受益不少。不过,我们也知道,对于很多Oracle的客户他们需要在自己的数据中心当中运行应用。比如,出于合规或者数据安全等各方面的考量,他们希望把整个系统部署在自己的数据中心。针对这种情况我们也有相关的解决方案,就是采用Oracle Cloud@ Customer这个“把公有云搬回家”的技术,把整个机架部署在企业的数据中心里,在上面再去部署自治数据仓库。通过这样的模式,就可以让传统的基于私有云平台建设的一些客户也能用上自治数据仓库的全部能力。
邹大斌:工作人员给我递上了一些网友提出的问题,有几个非常典型,我也趁着这个机会请教一下您。其中一个人问题是,咱们自治数据库把备份、运维等很多工作都自动化了,这是真的吗?管理员真的不用操心这些管理工作了?
李珈:这个确实是真的。作为云计算供应商,必须对企业数据及其应用具备供应能力保障和交付能力保障。对于备份,我们基本都是靠后端的云平台自动实现的,同时通过多处备份保证数据不丢失。在这方面,Oracle的保障能力达到了99.995%。要达到这样的目标一方面来自于企业系统的高可用,另外一方面也依赖于对全套数据的备份和灾备。显然,如果把这部分工作的考量交给供应商,就会减轻很多IT压力。
邹大斌:还有一个问题是关于安全的。甲骨文新一代数据库安全方面有没有什么新的改进?
李珈:Oracle公有云的安全防护是全方位的。我经常举一个例子:它就像是钢铁侠的钢盔一样,端到端都是安全的。具体来说,我们在公有云具有六级的安全防护,从最外层的外呼访问到中间的网络层,再到存储和最后的数据展现,数据在整个传输过程中都会被加密。我们甚至可以根据用户不同的需求对数据展现进行不同层次的加密。
面对黑客攻击企业该如何去做自助防护?通过调查显示,业界超过90%的系统错误一个原因是由于人为错误,另一个就是没有及时打补丁。其中的补丁有可能是数据库的补丁,也有可能是操作系统的补丁,或者是其他不同软件的补丁。而通过Oracle的云服务,就能实时更新,让企业系统始终处在最健康的状态下,并且这些技术都是经过非常完善的测试的。从这一点来看,我觉得Oracle在安全性方面的配置真的做得非常好。
除此之外,它还有一些工具。比如,现在很多客户在考虑多云架构,就是除了用Oracle云服务之外还可能用AWS、微软云等等。针对这样的多云架构,我们也有一款产品,专门针对于企业的安全边界、对不同云上的部署进行集中监控。
邹大斌:还有一个问题是,我们中国用户什么时候能够用上新一代的数据库,老的数据库用户,比如原来用Oracle 12C的用户,需要重新购买吗?如果原来的License还在有效期怎么办?
李珈:对于Oracle用户,不管是哪个版本,只要在有效使用范围内都是可以直接免费升级。比如您是12C的客户,就可以直接升级到18C。如前面所说,自治数仓能力等于机器学习、人工智能以及云计算等新技术的能力组合,所以它对于过去的license是有保护政策的。如果说你想用的是在云上的自治数据仓库,也可以把原有的license直接搬到云上,从而有效降低成本。
邹大斌:现在新一代数据仓库把很多工作都交给了机器自己去做,也就是您所说的自治,这样势必对数据库原有的合作伙伴带来一些影响,因为有些工作原来可能是第三方厂商在做,现在不用了。在您看来,生态系统中哪些厂商可能会有危险、需要转型?
李珈:Oracle在自治数据库这个领域的布局大致是这样的,中间是自治数据库,前端是业务系统,右边是不同领域的合作伙伴。对于整个Oracle云生态而言,不同的合作伙伴会发挥不一样的作用。比如有的可能特别擅长基于Oracle数据库技术去搭建应用,他就可以专门给特定行业提供经营分析。因为他们比我们更了解行业,具备更多的行业知识,就像那些社保、税务、电力、制造等行业的不同合作伙伴,他们依然有非常大的用武之地。与此同时,借助于自治数据仓库,还可以让他们的知识架构更丰富,能力发挥得更加好。因为原来他们可能要跟其他Oracle的合作伙伴PK底层平台上的能力,花费大量的人力、物力基于Oracle平台进行优化、安装和部署,但通过自治数据库,他们就可以从这部分工作中解脱出来,提升自己在行业上的能力,与行业结合更加密切,进行更多的创新性应用。
但是,有一类企业会比较危险。如果只是基于Oracle基础能力帮助用户做传统运维,只是打补丁、做调优,当他们的客户部署私有云时其实问题不大,但如果客户在公有云上去做,那就要做转型,转向数据应用、应用架构,同时培养更多的数据科学家,这与我们传统DBA转型也是息息相关的。
邹大斌:今年3月份、8月份甲骨文新一代数据仓库、数据库产品已经上市了,对于中国用户来说现在也可用了。我还想请教一个问题,用户是应该马上升级呢,还是说我可以根据我自己的业务需求在需要新的功能时再去进行升级。
李珈:其实在升级这个问题上,国内的客户一般是相对保守的,这跟中国市场上的客户表现和对数据库技术的要求有关。因为中国企业的系统往往都比较大也比较复杂。比如由于人口数量大,并发用户数比较多,企业就要一个大的系统支撑。以前我们做数据仓库的时候有一个共同的认知,就是100T以上的数据库才能算为一个大的集群,但现在我们在中国很容易就能找到这样体量的客户,在其他国家反而不那么容易。
所以,对于数据仓库的用户而言,就要考虑用什么样的升级路径。Oracle对升级路径是有一定要求的,比如对于11G的用户要更新到最后一个版本大概需要到什么时间点。到 2018年底这是一个关口,明年某个时间段又是另外一个关口。我们一般建议,11G客户可以考虑更新到18C,如果是12C的客户就可以再等一等,因为明年我们又会有19的版本出来了。现在,我们已经从原来三到五年更新一个大版本,变成现在每年更新一个版本,其中最重要的原因是希望把客户急需的一些功能快速产品化,让大家能够放心快速地去使用。这与12C以前的客户升级路径不同,现在我们会建议客户尽可能跟着Oracle版本去升级,从而让企业的生命周期、数据库安全性等方面都能得到最新技术的支持。
邹大斌:这是一个很重要的信息,以后Oracle数据库版本的命名出现一些新的变化,会直接按照年来。今年这个产品叫18C,而之前一代的产品叫12C。
下面这个问题时关于Oracle数据库中的选件的,比如说高级分析、分区、集群等这些功能,上一代数据库都需要额外收费的,现在付费情况有什么变化吗?
李珈:这个问题确实是很多客户关心的。Oracle基于私有云的计费方式中数据库是有一个基础价格的,在此之上用户会根据自己的需求再对其它功能进行选择性购买。而现在,我们把数据库放到公有云上就是为了简化大家的应用,同时也让大家能够以更低的成本用上Oracle数据库所提供的统一功能。比如说,企业版中就包含了所有Oracle选件能力,这些能力都不再做单独的计费,并且还支持企业带着原来的license上云,这样就相当于进一步降低了云上的数据库成本。
另外,通过公有云的模式,企业还可以做到按需付费。举个例子,原来企业买一个48个CPU的Oracle数据库,这48个CPU可能只有到月底才用到,平时只需要24个CPU就可以满足需求。如果通过公有云,企业就完全没必要支付48个CPU的费用,只需要在平时用24个,到峰值时段再购买48个CPU的能力就行。但是在私有云环境中,企业必须为了峰值去配备最大的能力,即购买48个CPU的机器,配48个CPU的license。这样算下来,公有云的模式肯定会比在私有云中便宜得多。
邹大斌:下面还有一个问题。甲骨文新一代产品中的很多功能是基于公有云的,这是不是意味着Oracle未来数据库产品都搬到云上了。传统数据库的这些老用户就会抛弃了,未来私有云用户可能就用不了这么好的东西了?
李珈:您说这个问题也经常有人问我。九十年代Oracle刚开始推数据库的时候,版本上线的第一个平台都是SUN,后来变成了Linux,再到今天的公有云。这其实是Oracle版本的策略。虽然现在先在公有云上上线,但是很快就会有私有云版本。
Oracle也看到,在业界很多企业系统运行仍然还是以私有云为主,也有混合云模式,也有全部搬到公有云上的。在比较长的时间内,这几种用户仍然会并存,所以,我们一定会尽快把私有云的版本同步上来。
总体上,我们是云优先,但是仍然会兼顾传统模式。需要强调的是,我们每次做出的变化,通常也都是响应客户所提出的要求。
邹大斌:甲骨文新一代产品有很多好的东西、好的特性,也很经济,对用户来说能不能给我们提供一个简单的方法,让我们能够体会一下到或者帮助我们去用好这种新一代产品?
李珈:自治数据仓库对于整个业界来说还是一个新鲜事物,因此我们设计了两种方式,从而让用户有一个更好的体验。第一,就是ADW云试驾工作坊,这个工作坊我们会定期在线上线下举办。它有半天和全天两种不同选择,用户可以根据自己的时间选择其中一种模式体验Oracle ADW自治数据仓库的能力。举例来说,在企业有了一些数据之后,就可以把它灌到自治数据仓库中,体验它的极致能力。此外,在自治分析方面,企业还可以利用后端的分析型软件去实现数据洞察,拓展业务能力。比如,仅仅是从某个企业的前端业务系统中拿过来的数据可能不足以支撑一个业务结论,为此我们设计了一些功能,使得企业可以利用网上第三方数据,得出综合性的分析结论。比如,你可能发现自己的业务下滑是当天没有太多人去自己的餐厅用餐,是因为这个地区有比较严重的雾霾或者是暴雨。通过ADW工作坊的体验,我们希望能够让大家理解什么是敏捷的业务数据洞察。
第二,Oracle有非常强大的顾问咨询团队,他们不仅对于数据仓库设计、数据分析、数据展现等各方面具有非常丰富的经验,同时在不同行业中他们也有非常强的能力。因此,通过ADW工作坊,他们就可以用非常短的时间带企业去做快速的云体验,比如说用五天时间,让你进到ADW这样一个崭新的业务数据敏捷展现的环境中。这也是我们提供给客户很不错的服务,尤其是对于刚在云计算领域起步的企业来说,这会是很好的一种方式。
邹大斌:非常感谢李总的精彩分享,本次采访到此结束,再次感谢您。