“科学技术是第一生产力,而金融则是现代科技的核心。“
自改革开放以来,这一论断就屡屡被证实。
尤其近几年,随着云计算、大数据等新兴技术的不断发展,在国家政策的大力支持下,金融从IT基础架构到业务形态均上演了一场声势浩大的变革浪潮。金融与科技的关系也因此达到了前所未有的最紧密的双向推动、双向融合的关键时期。
2013年,国内金融行业某领先企业携手九州云共赴这场金融变革大潮,7年来积极持续拥抱新科技,在实现数字化转型升级的同时,公司金融业务也得以快速增长。
金融行业排头兵:国内首批云计算技术尝鲜者
该金融企业是由金融和高科技资深专家发起的一家金融科技公司。总部位于中国上海陆家嘴金融区,在美国硅谷设有分公司。
一直以来,该金融公司致力于通过大数据、云计算、区块链、机器学习等新一代的信息技术和投资理念打造全新的互联网资产管理生态系统,为资产管理人提供高效、便捷、创新的一体化金融资讯和投资研究服务,为银行、证券、基金、投资等行业客户提供优秀的金融 IT 服务。
2013年,国内云计算行业开始兴起,该金融公司便计划成为首批尝鲜者。在2013年8月,该金融公司开始进入采用云计算的筹备期,并对整个IT基础架构平台做了深入的探讨和设计。
从企业自身内部业务系统和未来客户的业务系统这两方面考虑,该金融公司希望构建一个后端IaaS平台来应对未来在金融数据分析、投资管理、量化投资等金融数据服务方面爆发式增长的需求。同时希望利用IaaS平台来统一管理整个集团的计算、存储、网络资源,从而降低未来该金融公司在IT资源管理上的成本。
在整个筹备阶段,该金融公司对国内外现有的云平台服务做了细致的测试和对比,从未来发展趋势、经济性、自主可控性等方面最终选择了采用九州云的OpenStack技术路线来构建。通过各种开放的技术架构,总体建设金融数据服务行业有特色的行业云。
基于开源技术构建金融行业云
考虑到整个云平台的建设成本,该金融公司整个云平台采用相对开放的架构构建整个云平台。从物理层、虚拟化层、管理层、业务层、运维监控层和用户层构成整个建设方案。以OpenStack核心组件为基础来管理,详细各个层次的软件如下:
整个云平台从资源上通过OpenStack管理平台整合了原有的计算、存储、网络的管理,为上层集团业务提供了标准的IaaS的API。通过企业内部的持续集成和持续发布流程的建立,可以提升该金融公司内部业务系统的迭代开发和快速上线能力。平台在构建初期考虑到整个平台的稳定性,云控制部分采用多节点高可用的方式,详细架构如下:
基础资源池方面,基于KVM技术构建虚拟化资源池,基于Ceph技术构建分布式块存储资源池。在整个分布式存储集群建设中,对于计算存储融合架构的情况下,采用全SSD存储来构建分布式存储池。对于计算存储分离的架构,采用SSD做Journal,大容量SAS/SATA做OSD的方式来构建Ceph存储集群。通过不同的Ceph集群对外提供不同性能、不同容量的块存储能力。在存储管理层,通过OpenStack Cinder对下层的Ceph存储进行统一管理。
在云平台网络方面,基于标准OVS技术构建虚拟交换机,支持VLAN/VXLAN网络协议通讯。针对今后提供的金融行业的VPC提供VNF的解决方案,可以让租户独立拥有完整的网络安全解决方案。通过虚拟安全设备和OpenStack深度集成,可以有效的对租户提供安全接入、病毒防护、应用防护等租户内部的网络安全能力。通过VNF自身的高可用解决方案,提供租户内部网元节点生产级的可用性。
针对租户的网元,可以通过OpenStack的编排能力,对租户内部的复杂网络进行独立组网,从而提供对VNF的管理能力。
数据监控方面,通过Zabbix+ELK的方式,对整个云平台从物理设备、基础OpenStack服务、存储服务等多个维度对整个平台的监控状况做一个合理的评估,并通过Grafana为运维人员提供统一的监控展现平台。
在异构平台接入和VPC方面,结合OpenStack的特点,对不同的金融客户的需求进行定制。通过Nova Host Aggregate、Cinder Multi Backend的方式把对有硬件独立需求的金融客户的VPC业务采用统一的一套OpenStack进行管理,再物理资源上根据客户做了切分,已符合客户安全性的要求。对于不同的金融客户的数据备份进行了统一管理。
整个云平台为IT运维部门提供一整套完整的IT基础设施、基础IT资源的管理、IT运维解决方案,为IT开发人员和第三方解决方案厂商提供云平台服标准接口,为内部业务人员和外部客户提供应用数据服务。整个云平台从架构上需要符合云计算未来建设标准,提供标准的对外接口,提供可扩展能力,提供安全稳定的生产运行环境,具有定期巡检,故障处理,技术支持等可靠保障体系。
通过这个项目,打造了一个具备以下特色的金融云平台:
1)全分布:基于OpenStack云计算技术,实现计算虚拟化、分布式存储资源、网络资源和数据库资源的弹性伸缩和横向扩展,为业务规模发展和快速响应提供技术保障,真正实现宠物型数据中心;
2)标准交互API:基于OpenStack云计算架构,可以对外提供业界认可的标准IaaS的Restful API,从而可以为研发、测试、运维人员提供更友好的资源交互;
3)存储管理:通过不同架构的Ceph分布式存储架构的管理能力,支持不同业务存储的要求;
4)低成本:结合开源技术构建云平台,降低厂商锁定,通过廉价X86服务器堆叠出存储、计算和网络资源,一次性投入相对于采用商业软件大大降低。在近三年的运维过程中,每年投入在2人左右就可以运维100+物理硬件设备,整体的运维成本相对传统运维大大降低。
5)低风险:基于VLAN实现多租户隔离,通过硬件网络设备和专业第三方安全软件集成,从而可以根据租户和业务范围进行安全隔离,对故障影响能够做安全隔离,降低平台风险;
6)金融托管云:基于OpenStack架构,可以根据金融客户的要求独立硬件构建单独的VPC,从而为金融行业提供一个数据安全、自主可控、符合监管要求的金融托管云。结合通联自身的金融数据服务业务,可以提供IaaS之上的SaaS服务,使金融投资机构更便捷的使用金融云服务。
7年持续投入,成就更好的金融云平台
2013年至今,伴随着公司业务的不断成长,该金融公司携手九州云将整个云平台从最初的20个节点,已经扩展成为300+台物理服务器、1300+虚拟机、20+VLAN资源、300TB存储。目前,该金融公司正在规划扩容多个数据中心,可以管理单数据中心不小于500节点物理节点规模。
俗话说三分技术七分管理,7年时间里除构建扩容云平台外,随着公司各应用迁入云平台,公司信息化运维工作显得尤为重要和紧迫,尤其是信息技术进步日新月异。如何运用新技术保障信息系统可靠、稳定运行,并满足公司不断增长的信息需求,是运行工作面临的紧迫要求。
一直以来,九州云为该金融公司提供了很好的系统运营保障。以“价值”为导向,实现安全可靠的运营环境,以推动运维工作从“面向设备”到“面向业务与数据”、从“支撑业务”到“推动业务”的两个转变为着力点,建成“管理集约、运行精益、作业智能、服务敏捷”的服务体系,确保信息通信安全运行“可视、可信、可管、可控”,实现信息通信运维对象分层、运维服务分级管理,全程质量控制,完善数据基础运维与业务运维,全面覆盖各运维对象,满足体系全业务需求,促进运维工作向自动化运维和智能化运维演进,形成快速反应,快速交付,提高满意度,体现运维价值、增强服务运营意识。
7年时间,该金融公司携手九州云持续投入,最终成就了更强大更稳定的金融云平台。随着互联网金融大潮的到来,云平台已经可以支撑未来该公司金融服务的快速增长。