中国工商银行云原生2.0建设项目
随着工行业务迅猛增长,业务逐步向互联网线上迁移,核心业务日均交易量近5亿笔,并保持20%以上的年均增速。工行金融云作为工行数字化转型的核心基础设施,服务全行生产系统及外部金融生态合作伙伴,面临着业务高速发展、架构转型迫在眉睫、云原生服务需求旺盛、运维支撑能力亟需补齐等一系列挑战。为此,工行基于主流开源技术自主研发了云原生2.0云计算平台,并具备资源池化、高可靠、云生态全面、支持业务弹性扩缩等特性。基于该平台,工行实现了银行核心业务系统的云化部署,承载应用节点规模超15.9万,容器数量超30万,支持超20万TPS的高并发场景,日均服务调用量超200亿,上云业务规模同业最大,快捷支付、聚合支付、大零售、互联网金融等业务线的核心银行系统入云比例达 100%。同时,借助云原生2.0云计算平台的技术能力,工行打造了为企业提供一站式Saas采购、运营及管理服务的金融生态云,累计推广B/G端客户16万户,C端客户2700万。工行金融云具备”一云多芯”技术架构、全分布式高可用容灾体系及自主研发的云原生技术平台等10大创新科技,得到了业界的广泛认可,曾获人行银行科技发展奖一等奖,蝉联亚洲银行家最佳云计算国际奖项。
业务模式
工行基于研发、测试、生产(细分为总行应用、分行特色和合作方生态建设)场景不同用户的业务和安全需求,规划建设了五朵云,即研发云、测试云、总行生产云、金融生态云和分行生产云。
在总行生产云方面,工行金融云部署规模超2.8万物理服务器,入云节点规模超15.9万,入云规模和占比持续同业领先,涵盖395个工行应用,全面承载工行核心系统运行。
在金融生态云方面,基于工行金融云的能力支撑,工行联合企业合作伙伴,构建了面向各行业和各领域的Saas云平台品牌,推出20余款Saas产品,覆盖教育、医疗、政务、住建、交通、金融以及企业管理等各类行业场景,累计推广B/G端客户16万户,C端客户2700万。
在分行生产云方面,面向工行的境内外分行、综合化子公司提供各类云环境和云服务,以及配套支撑,现已涵盖44家分支机构,入云分行特色应用700多个。
技术架构
工行金融云建设了覆盖laaS、PaaS、Saas的全栈式云服务体系,包括大规模的两地三中心金融级云基础架构。laaS层具备计算、存储、网络及云调度等基础设施能力;PaaS层具备容器、数据库、中间件、分布式服务等服务能力,以及日志、监控、诊断、投产验证、 Alops、DevOps流水线等配套能力;基于laaS和PaaS平台部署我行金融生态云Saas产品服务。
工行金融云的主要技术特点如下:
一是具备秒级弹性伸缩能力,分钟级基础资源供应能力,针对典型应用提供基于业务监控的自动化弹性伸缩支持,从容应对业务突发高峰场景,自动弹性伸缩超1000次/月,有效支撑双11抢购,纪念币预约等超20万TPS秒杀场景。
二是具备柔性化的资源供给能力,容器化部署应用、数据库、中间件等任何负载,构建云上资源按“实际运行情况“自动分配能力,充分利用云平台资源集约的优势,通过资源回环处理、全局资源配给优化、规模化应用弹性伸缩能力、落地函数计算场景等手段,实现整体等效节省1.4万台虚拟机资源。
三是具备全流程敏捷交付机制,通过云平台灵活、自动化的运维流程,建立工行特色的 DevOps流程,有效赁穿从开发到生产的各个环节,提供从开发到生产的快速交付能力,打造了高效的研发环境,实现分钟级部署,缩短产品上线周期,满足业务功能快速上线的需要。
四是实现多元化CPU架构的容器、云主机等多种算力的集中统一管理调度,具有体系完备、自主研发、规模化的多元化芯片适配能力,构建同业规模最大的"一云多芯“平台,支撑1万余台异构服务器运行。
五是具备全栈化的自主可控能力,以自主研发为主,全栈兼容架构开放的软硬件供应商。在laaS层基于openstack技术路线的云产品构建平台和外围生态,其中云管平台完全自主研发;在PaaS层通过引入Docker、Kubernetes、MySQL、red is、kafka自主研发企业级应用平台云及泛PaaS服务;在硬件层面支持多元化芯片生态,包括arm、x86等多种芯片架构,并具备与业务应用联动的能力。
六是打造了金融级云基础设施,定制实现了容器调度框架及多集群机制,支持超万级容器集群规模运行和调度;建成测试和灾备动态复用的灾备云资源池,解决核心系统下主机单轨运行的瓶颈问题;打造单元化的云基础设施,实现稳定高效的单元化运行底座。
七是形成总分高效协同机制,同业首家建成资源分散、管控统一的分布式分行云,按照中心站点、区域站点两级设计,为分行提供物理分散部署、技术能力统一、运维管理一体化的分布式”集团公有云”。
八是建立了全场景容器支撑,同业首家实现GoldenDB国产数据库容器化,资源利用率提升8倍;同业首家实现MySQL容器化部署,首创自研不停机纵向伸缩能力,资源利用率提升4倍;建立全场景容器支撑体系,支持国产化数据库、中间件等主流组件容器化部署, MySQL容器数据库达7.6万。
九是搭建了领先同业的云原生可观测体系,实现指标、日志、链路三大可观测支柱数据的高效利用。基于业界开源技术,结合工行特色进行二次开发,先后落地日志中心、链路监控、高精度指标监控等可观测平台,提供采集、清洗、计算和存储的一体化服务,具备支撑 10万级规模主机的能力,高峰期可支撑百万级TPS数据处理,达到同业领先水平。
十是具备自动化、可视化、智能化的云运维能力,对标1-5-10故障处理标准,构建故障识别、定位和应急全流程自动化处理机制,打造涵盖故障管理、成本管理、变更管理、服务咨询四大类能力的AIOps智能运维体系,及时发现应用投产和运行风险超过500次/月,故障自愈超1000次/周,自动化热迁移已超万次,通过平台快速定位和应急处理问题超过30万次。
转型成效
企业价值:工行金融云部署规模超2.8万物理服务器,私有云为同业规模最大;入云节点规模超15.9万,应用平台云容器规模超34万;建成同业领先的分布式云平台,面向分行提供“中心+本地”两级的资源供应及运维监控能力,实现资源集约,节省人力物力成本,实现技术组件、服务、解决方案等多层次复用;工行核心应用入云比例达100%,建成测试和灾备动态复用的灾备云资源池和单元化基础设施,支撑主机业务的体系性下移,涵盖互联网金融、零售、对公、信贷等各业务线核心应用,包括快捷支付、积存金、账户外汇等重点产品;全面支撑大数据、人工智能、物联网、区块链等ABCDMIX前沿金融科技落地;同业首家完成私有云等保2.0四级测评,金融生态云及私有云测评结果均为优秀;通过信通院”分布式云基础设施服务能力”、“IOMM一体化云平台建设和运维运营能力成熟度”、“应用多活成熟度”和“智能化运维(AIOps)能力成熟度”等七项最高级别测评,成为金融同业唯一一家拿到多项最高级别认证的银行机构。该项目获得了2019年人民银行科技发展奖一等奖、“第五届数字金融创新大赛"跨类别的最高奖项“全场荣耀奖",蝉联亚洲银行家最佳云计算国际奖项。
社会价值:基于先进的云计算技术体系和企业公信力,工行联合企业合作伙伴,构建了面向各行业和各领域的Saas云平台品牌,推出20余款Saas产品,覆盖教育、医疗、政务、住建、交通、金融以及企业管理等各类行业场景,累计推广B/G端客户16万户,C端客户2700万,2022年发生交易约8064万笔,涉及交易金额约36.29万亿元,成为中国工商银行开放生态的重要一环,极大提升了”获客、活客、黏客“能力。
本文章选自中国上市公司协会发布的《中国上市公司数字化转型典型案例》