“加码”数据与AI:微软Azure的两点更新与四个优势
天空因为有了云的涌动而有了雨,企业因为有了数据的流动才获得了洞察。但“骨感”的现实却告诉我们,现如今大部分的企业中仍有80%的数据都没有被用上。
微软CEO萨提亚·纳德拉认为,这不是因为认知缺乏,而是因为技术能力还未跟上。“如今,有一半的‘财富 1000 强’企业不把数据看作业务资产,不是因为他们不懂得数据的重要,而是因为缺少必需的程序和能力对其加以利用。”他在全球Ignite 2021大会上表示。
在微软看来,企业要想充分地利用数据,数据的现代化至关重要。“现在的数据全部都是云上处理,要开发云端原生的应用,开发过程中要进行分析、调研、使用等环节,并且利用数据科学和AI最新的技术。同时,最不容忽略的,是数据的管理和治理。”微软大中华区副总裁兼市场营销及运营总经理康容在接受记者采访时强调,“所以,微软会以客户的需求为导向,在数据合理利用方面推动客户进步。”
微软大中华区副总裁兼市场营销及运营总经理 康容
基于这样的出发点,微软在3月18日举办的微软Ignite China 2021大会上宣布,由微软和Databricks公司共同研发的,基于Apache Spark的快速、简单、协作型分析服务Azure Databricks已经在由世纪互联运营的Microsoft Azure上正式商用;另外,全世界第一个云原生聚合数据分析平台Azure Synapse Analytics,也将在由世纪互联运营的Microsoft Azure上开放有限预览。
由小见大,这两大服务内容的更新,正是微软智能云不断完善和构建现代化数据平台的重要之举。
Azure Databricks:搞定数据规模化问题
全球数据量的指数级增长已经成为共识,而要对如此庞大的数据进行治理和分析,仅靠人力并不现实,结合人工智能和机器学习技术,是高效、充分挖掘数据价值的必备手段。但是,在这个过程中,新的问题也在出现。
微软大中华区云计算和人工智能事业部总经理林家伟表示,问题主要来自三个方面:第一,是解决方案的复杂性,虽然针对数据治理和分析的产品、工具数不胜数,但是对企业来说能够真正满足需求、“对症下药”的却并不多,这让企业难以从中得到实际的价值;第二,是数据的质量不高,收集上来的数据往往需要经过清洗、处理才能真正赋能于业务,但这需要企业投入大量的精力和成本;第三,是数据量的规模化增长,要求企业使用更有效的工具和手段去应对。
微软大中华区云计算和人工智能事业部总经理 林家伟
“尤其是针对数据规模化的问题,Azure Databricks其实就是其中一个解决方案。我们在Azure上做了大量优化,以便客户能够在全球部署的平台中,直接使用Databricks的服务。”林家伟表示。
无论在企业内部还是外部,数据通常会有多个不同来源,包括传统数据库、海量数据湖,也包括IoT采集的数据,有结构化数据,也有非结构化数据。在使用这些数据的过程中,如何让不同的角色,比如数据工程师、科学家、机器学习工程师、数据分析工程师等,在统一的平台上实现迅速搭建、集群开启、数据共享,以及计算和分析?Azure Databricks就可以做到。并且,由于该平台基于的是Apache Spark,使用了内存方式进行计算,因此大幅提升了计算能力。
以全球知名的壳牌石油为例,该公司在全球有44,000家加油站,每一家加油站都有数个摄像机镜头,每天24小时都会产生拍摄数据,过去这些数据往往是在后续做调查和研究时才会使用。但为了增加加油站的安全性,壳牌把实时数据应用到了一个非常重要的场景——帮助加油站更好地禁烟。具体来说,利用Azure Databricks,壳牌将所有摄像头数据,用流动性的方式输入进来,再通过数据科学家在Azure Databricks已经构建好的机器学习数据模型进行预警,几乎可以实时地在侦测到有人点烟或拿起香烟时,立即通知加油站站长,以便及时关闭加油泵,制止消费者在加油站区域范围内吸烟。
值得一提的是,面向中国市场,微软还特别发布了Power BI connector for Azure Databricks,以便一般的商业用户分析师也能够直接通过Power BI connector去分析在Azure Databricks当中的数据,或者是把相关数据收录到Synapse中去做分析。“此外,Databricks还能够根据客户的身份或行为进行权限管理的控制等等,并集合在一个统一的平台上,拥有和Azure完全一样的安全性、可控性、鲁棒性。”林家伟强调。
总的来说,Azure Databricks的核心价值可以总结为四点:第一,让数据不再混乱、孤立和缓慢;第二,让机器学习真正服务于业务运营;第三,为BI提供更高质量的服务;第四,提供的是企业级的就绪服务。
Azure Synapse Analytics:搞定数据聚合与分析难题
数据经过清洗、处理,下一步,就要对筛选出的高质量数据进行分析。Azure Synapse Analytics的价值就在这个环节体现。
Azure Synapse是微软智能云SQL 数据仓库的升级版,近期将在中国落地。据介绍,它从成本上可以帮企业节省出每比特计算近94%的成本。而Azure Synapse Analytics是一项将数据集成、企业级数据存储、大数据分析融为一体的云原生服务,并且,它的特色之处在于,能无限制地实现跨数据仓库和分析系统提取所有数据中的业务洞察,并将其通过Power BI及时呈现,或者用于机器学习和人工智能应用。除此之外,由于底层基于的都是Azure,Azure Synapse还可以帮助企业及时对接自己的Power BI或其它分析平台,从而维持全平台的安全可控。
换句话说,Azure Synapse Analytics服务能帮助企业更有效地从各种纷繁复杂的业务系统、应用、渠道中快速获取有效数据,对海量数据进行实时分析处理,以最快速度获取可用于指导决策或者机器学习的业务洞察。据了解,这项服务在全球Azure推出预览一年来,推动Azure上处理PB级数据的客户数量增加了五倍。
“微软智能云Azure在针对数据处理、人工智能服务当中,一直加速创新和部署,不仅仅在全球区域,也在中国区域同步为客户提供这些功能,以便客户在选择上、使用方便上进行判断和选择。由于我们提供了这些服务,客户可以针对自己需要的场景,选择去使用最优化、最适合的服务。在业界既然有这么多不同的数据、不同的场景,作为云计算公司有必要提供给客户最习惯或者最想使用,也最优化过的一些产品。”林家伟指出。
可以见得,针对数据治理与人工智能服务,微软的最大优势就在于能够提供一站式的服务,无论是数据库、数据分析还是AI、BI等等,微软的触角无处不达,而所有的触角最终都归回Azure,由Azure背后的Windows Server服务器、SQL Server资料仓库、系统中心管理工具等,提供统一的支持和服务体验。这意味着,所有其上的应用、技术都由微软进行整合,从新旧设备的融合,到混合多云环境的统一管理,都可以一站式得到处理。
与此同时,在智能方面,经过微软研究院多年来在AI领域的研究、创新和突破,在Azure的产品和服务中已经整合了大量智能化服务,企业可以根据业务需要选择和使用。另外,在数据安全保护方面,微软也做了很多的事情,无论企业在使用数据、迁移数据还是分析数据的任何一个环节,无论是在PC端、手机端还是移动装置上,无论是云端还是边缘端,微软都有相应的安全服务,能够做到无处不在的安全防护。
用康容的话总结——一站式的服务、混合多云的管理、智能化和安全可信,这既是微软智能云的特色,也是客户选择微软的重要原因。
本文章选自《数字化转型方略》杂志,阅读更多杂志内容,请扫描下方二维码