数字化转型方略 特刊 2022/01/06

当数据成为第一生产要素,端到端的数据战略将成为现代化的企业腾飞利器!

文/任新勃
纳斯达克,不仅是金融市场的代名词。更是数据作为第一生产要素的代表!

纳斯达克,不仅是金融市场的代名词。更是数据作为第一生产要素的代表!

纳斯达克海量的数据处理,直面三大挑战:首先是规模,系统一天就要无缝处理上千亿美元的交易;其次是弹性,平时系统每秒处理300万条信息;但高峰期,12小时内有600亿条信息进入交易系统,以及超过1200亿条信息导出系统;第三是速度,每20微秒就需要进行一次订单交易处理,比人类眨眼速度还要快1万倍。

面对海量数据、海量交易,面对实时性要求极高的数据处理需求,纳斯达克选择了亚马逊云科技作为云基础设施,积极打造为资本市场提供技术和SaaS服务的供应商角色。在体会到了云技术以及降低成本等方面的优势之后,纳斯达克开始把包括数据分发、营收分析、监管报告和市场运营系统等更多系统迁到亚马逊云科技上。

纳斯达克跟亚马逊云科技的合作,意义远不止于此。如今,纳斯达克不仅通过Outposts建立了一个混合架构,推出了金融行业的第一个专用亚马逊云科技本地区域。而且通过标准化的上云路径为全球的130多个企业客户提供服务,将企业客户的数据孤岛打通,真正能够更好的为数据服务,创造新的价值。

纳斯达克与亚马逊云科技的故事,发生在此次re:Invent全球大会上,纳斯达克宣布将分阶段把全部业务迁移到亚马逊云科技。2022年,纳斯达克将先把美国一个期权交易市场上云。这意味着纳斯达克将把自己的核心业务,与云进行深度捆绑。亚马逊机器学习副总裁 Swami Sivasubramanian指出,如果把数据从采集、存储、分析到最终价值的挖掘比喻成一场数据的旅行,那么这段旅行中的每一个阶段,都需要现代化的创新工具来辅助它。

数据价值之旅,需要端到端的现代化数据工具

最近研究报告显示,从现在到2024年,全球三年产生的数据量将会超过过去30年产生的所有数据量。针对海量数据,以及数据的多样化,从数据采集、存储、分析到价值挖掘,每一个阶段都面临着不同的挑战。无论是工业设备的数据、网站的日志数据、金融的风控数据,还是基因组研究分析的数据等都需要从底层架构、存储系统、数据管理和业务创新角度进行多方位融合和创新。

为了实现数据价值之旅,亚马逊云科技能够为数据服务提供从数据存储、到计算、分析、人工智能创新的完整的、端到端的工具。并从数据架构现代化、统一数据分析以及基于数据进行业务创新三个维度实施现代化端到端数据战略。利用广泛而深入的云服务,凭借在数据领域的产品创新与前瞻眼光,助力企业实施现代化的端到端数据战略,实现数据驱动的创新。

现代化的应用催生现代化的数据架构

今天有太多的现代化应用,无论是像电商、购物还是视频、社交、出行类等不同应用的App,其产生的数据级别都是PB甚至EB级,而且这些应用要应付的并发请求要服务于全世界几亿人,同时在高峰期还要保持超低的延迟,这些现代化应用需求呼唤新的数据库技术。因此,数据架构的现代化首先从数据库开始,针对不同的场景需要使用专门构建的工具,专门的工具需要专业的现代化托管平台,亚马逊云科技拥有无与伦比的成熟度和经验。此次re:Invent,亚马逊云科技在已经很丰富的数据服务组合之上,又发布多个数据工具。包括:

Amazon DevOps Guru for RDS是一个数据库性能工具,它利用机器学习,可以在几分钟内自动检测、诊断和解决难以发现的数据库性能问题。

Amazon RDS Custom 提供了 SQL Server支持,它通过托管式服务节省时间,帮助实现自动化版本维护与补丁升级,将宝贵的资源专注于更重要的业务。

本次re:Invent,另外一个重要的发布是Amazon Dynamodb 的新功能Standard-Infrequent Access表类,它可以将不频繁访问的表数据进行分类,DynamoDB 的存储成本降低可达60%。

Amazon Database Migration Service Fleet Advisor 是一个数据库迁移工具,它允许您通过自动发现和分析迁移队列来快速构建数据库和数据分析服务迁移计划。Amazon DMS Fleet Advisor 面向希望将大量数据库和分析服务器迁移到亚马逊云科技的用户。

打破数据孤岛,实现数据统一分析

今天,包括制造、金融、互联网等行业不仅有来自数据库的结构化数据、视频图片等非结构化数据,同时也产生了大量的来自于工业设备和网站日志的半结构化数据,如何将来自于数据库、数据仓库等结构化数据,以及来自多种数据源的半结构化、非结构化的数据全部整合在一起,并利用这些数据进行分析和机器学习成为业内企业面临的挑战。

亚马逊云科技通过云上专门工具实现数据有机整合与统一,助力企业打破数据孤岛。通过在亚马逊云科技上运行的数据湖,能够收集、存储和分析来自一系列分散系统的数据,助力业务发展。亚马逊云科技为在 Amazon S3 上构建数据湖提供了无与伦比的耐用性、可用性和可扩展性,以及强大的安全性和分析工具,使用亚马逊云科技最新发布的数据湖构建工具,可以快速构建适合的数据湖,如今全球客户在亚马逊云科技上拥有数十万个数据湖,比如Amazon Lake Formation,目的就是帮助企业快速的去构建数据湖,同时可以构建统一的数据湖的管理;而Amazon Athena 能够提供了一种有用的方法来分析所有数据,获得见解;利用 Amazon QuickSight Q,客户可以快速、轻松地获得答案,所有用户无需培训即可访问 BI。

通过赋能业务创新体现数据价值

“以客户为中心”相信是根植于每个企业的业务发展过程中,因此,通过数据进行创新的内核是“从客户角度出发”,通过企业基于自身业务的创新诉求这个原动力来实施数据创新。人工智能等技术为创新提供了新的手段和方法,来让公司或者组织中的每个人都可以更容易、更加自助地做数据分析和洞察,让不懂SQL、数据分析技术的业务人员也可以更自助、更主动利用数据分析和机器分析的能力做他的业务决策和进行数据分析。

本次re:Invent,亚马逊云科技业界闻名的机器学习平台Amazon SageMaker又添六项新功能来助力企业进行业务决策和数据分析。

亚马逊云科技新推出的Amazon SageMaker Ground Truth Plus,让用户无需编写任何代码即可快速交付高质量的训练数据集。数据是机器学习的燃料。不过,准备数据的过程令人痛苦沮丧甚至令人愤怒。这项新功能,极大地解决了数据科学家准备数据的痛点问题。

在模型构建与算法编写环节,新推出的Amazon SageMaker Studio Notebook 允许用户访问广泛的数据源,在一个记事本中执行数据工程、分析和机器学习工作流。

新推出的Training Compiler 模型训练编译器,让机器学习模型培训速度提高50%。Inference Recommender 模型推理推荐程序,可将部署时间从数周减少到数小时。Serverless Inference 无服务器推理(预览版),通过按使用付费的定价降低拥有成本。

写在最后,可以看到如果想释放数据的更大价值,一方面要看到数据的流动属性,通过亚马逊云科技的创新工具可以在数据库、数据湖、分析引擎和机器学习工具之间让数据更好地自由流动,另一方面要实现数据和业务的融合创新,这样就能助力企业利用数据得到更好的洞察,更快速的采取行动,最终实现企业的核心竞争力。

本文章选自《数字化转型方略》杂志,阅读更多杂志内容,请扫描下方二维码

《数字化转型方略》杂志