成本、数据隐私和性能问题让IT高管开始重新评估多租户公有云服务应该包含哪些内容。
过去几年,企业一直努力尽快地把尽可能多的资源转移到公有云,最大限度上减少资本支出并节省资金。然而,CIO们越来越多地审查这些投资,这真的能提高生产力并降低成本吗?
Forrester首席分析师Tracy Woo表示:“在涌向公有云的过程中,很多人并没有考虑定价问题。”对于一些组织来说,年度云支出在大幅增加。“云计算支出不断增加,而预算却在紧缩,所以他们在问到底发生了什么,我们如何才能扭转局面。”
Reinsurance Group of America (RGA)高级副总裁、首席技术官Ron Hollowell表示,2025年的计划是通过完善跨私有云和公有云的工作接收、分配标准和实施实践流程,专注于合理调整公有云的规模。他说:“费用优化和明确定义的工作负载选择标准,将决定哪些应用到公有云,哪些应用到私有云。”
作为软件公司Endava的云功能副总裁,Radu Vunvulea为很多大型企业的CIO提供咨询。他说:“今年,我们将更多地讨论混合云、多云和本地部署,”其中的原因包括成本高于预期,但也包括性能和延迟问题;安全、数据隐私和合规性问题;以及影响数据定位、传输和处理位置的区域数字主权法规。
“利用私有云而非公有云的主要驱动因素是成本,”Hollowell说。他认为,公有云对于季节性或突发性的、按需的工作负载而言最具成本效益。“对于容量需求一致性更高的工作负载来说,私有云和固定容量解决方案的经济性可能更具吸引力。”
对于其他很多CIO来说,主要动机也是成本,Vunvulea说。虽然Endava的企业级系统中有多达80%的部分或全部都是使用公有云的,但其中约60%的公司正在迁移回至少一个系统。“我们认为这更像是一种趋势,”他说。
这些工作负载去哪了?Woo说:“人们重新关注本地环境、本地私有云、或者托管私有云与公有云,尤其是当数据密集型工作负载——例如生成式AI——开始大幅推高云计算支出时。通过将应用迁移回本地,或使用本地或托管私有云服务,CIO可以避免多租户,同时确保数据隐私。”这就是为什么Forrester预测有五分之四所谓的云计算领导者今年将增加20%的私有云投资的原因之一。
线年不仅仅是关于回流。“由于生成式AI、成本、主权问题和性能要求,私有云投资正在增加,但公有云投资也在增加,因为采用率提高、生成式AI服务、基础设施占用空间减少、新增基础设施等等因素,”Woo说。
St. Jude’s Research Hospital的高级副总裁兼首席信息官Keith Perry表示,对该医院来说,公有云是一种将知识传递到目前不属于其生态系统的研究人员手中的一种好方法。该医院使用本地超级计算机来生成大量研究数据,而将这些数据移入和移出公有云可能是成本很高的。他说:“学术界希望数据在位置上接近高性能计算资源,因此他们经常为这些出口费用而苦恼。”
但数据密集型工作负载的成本可能很高,尤其是在需要持续的、高计算的情况下。“另一个驱动因素是数据移动,不仅在金钱方面,还有性能方面,因此,我们会仔细管理数据生命周期,以尽量减少云之间的传输。”
Woo补充说,对于数据密集型工作负载,公有云的成本很高,因为组织需要为存储的数据和在可用区、区域和云之间传输的数据付费。厂商还会对离开和进入给定可用区的数据收取出口费。“因此,对于可用区之间的传输,你实际上被收了两次费用,这些隐藏的传输费用可能会累积起来。”Vunvulea表示,数据传输的成本,尤其是以PB为单位的成本很高,而且数据传输和同步可能很复杂。“我们已经看到一些AI项目,其中大约45%的云成本是通过将数据从公有云移动到另一个位置而产生的,如果你把整个系统与服务所需的一切整合到一起,你得到的解决方案的成本可能会比最初估计的要高出三到四倍。”
例如,那些使用Open AI构建AI解决方案的组织,需要考虑的不仅仅是AI服务,还需要一个存储库来保护机密数据,以及定义和配置安全设备和策略,以确保只有合格的人员和服务才允许访问。安全存储以及数据转换、监控、审计和合规层都增加了系统的复杂性,围绕AI服务,你需要构建一个解决方案,其中包含另外10到12个不同的云服务,雷火竞技以满足企业系统的需求。
矿业公司Mosaic Company的首席信息官Jeff Wysocki承认很担忧这些预算超支,但他表示,CIO也许可以与他们的公有云提供商合作,控制这些成本。例如,Mosaic最近为微软Bing平台上的采矿业务创建了一个数据密集型的Mosaic GPT安全模型,而且即将在试点中推出该模型,其中包含了Mosaic多年来在模型中积累的安全信息,因此在采矿现场工作的承包商可以输入有关安全的问题,了解如何处理特定情况。
“我们对架构进行了改进,以解决成本问题,”他说。Mosaic团队如何构建模型,以及微软如何设计解决方案,有助于将项目控制在预算之内。“我们与微软一起进行了一些更改,以将成本降低到我们认为合理的范围。”
Wysocki说,Mosaic的ERP系统最初驻留在私有云中,但现在在SAP是运行在私有云中的。但他补充说,一些服务器将始终位于本地,这不太可能改变,但可能会有具有云同步功能的边缘服务器解决方案。“我认为这种情况不会比现在的情况有太大变化。”该公司80%到85%的IT运营都是在云端的,他预计这种状况将持续下去。
由于AI和机器学习是数据密集型的,这些项目可能会大大增加云成本。Gartner云、边缘和AI基础设施服务和技术副总裁Sid Nag表示,在使用ChatGPT 3.5和4.0等更大型基础模型时,企业组织别无选择,因为所需的计算能力规模太高,无法在内部复制。
然而Gartner预测,到2027年,企业使用的新一代AI大型语言模型中有50%多将是针对特定行业的,这些将是从非常大规模的通用基础模型中分离出来的小得多的模型,可以运行在其他地方。即使企业组织使用RedHat InstructLab等工具用公司特定数据增强这些行业特定模型,相比之下仍然是很小的。Nag说:“行业特定模型……需要更少的资源来训练,因此可以运行在本地、私有云或托管的私有云基础设施中。”
但是Vunvulea说,训练或优化模型所需的计算能力和基础设施并不容易在本地找到或购买到。“计算需求是最重要的因素之一,”幸运的是,云厂商还提供现成的AI平台,企业可以使用这些平台根据自己的数据进行模型训练。“因此,即使你决定在本地运行系统,也不需要配置它。”
但你应该这样做吗?Nag说:“我会谨慎选择私有云托管或本地,除非有令人信服的理由,否则决策者拒绝回到资本支出时代的想法。”
Vunvulea表示,云厂商会继续提供更多的AI和ML服务,作为他们平台即服务产品中的一个组成部分。你可以从预训练模型开始,使用自己的数据,然后就可以毫无问题地使用这项服务了。“我们即将看到,公有云厂商提供的模型已经足够成熟,可以满足大多数公司90%的标准需求。”是否使用这些服务的问题将归结为成本问题:这些数字对你的业务模式来说是否合理?
Woo表示,起初CIO们专注于降低成本,但这并不总是与性能考虑或最终目标相一致的。即使公有云是成本较低的选择,如果考虑到潜在的延迟或其他性能问题,也可能不是最合适的选择。Vunvulea表示,对于那些无法容忍延迟的行业(例如支付处理和金融服务)来说,情况尤其如此。
Perry说:“生成数据的仪器和处理数据的计算能力之间的延迟,是确定数据位置的重要变量。”在某些情况下,这种仪器需要几乎即时连接到高性能计算资源。“由于研究仪器与我们本地的高性能计算机和公有云之间存在延迟,所以使用公有云执行实时检查是没有意义的。”他说,随着越来越多的公有云超大规模企业构建了能够处理高性能计算的大规模GPU集群,你还必须考虑成本因素。
如果价格合适,基因组测序是一个将部分处理从本地超级计算机转移到公有云可能很有意义的领域。Perry表示,随着时间的推移,与基因组测序相关的一些工作流程会变得标准化。在这些情况下,根据成本优化管道进行扩展并在云中运行它们可能更有意义。他说:“我们致力于将部分基因组测序流程迁移到云端,以释放本地高性能计算的周期。”
性能当然很重要,但并不是选择是否在公有云中托管应用的决定性因素——除了一些在Mosaic采矿作业站点的边缘服务器上运行的应用,Wysocki说。“对于我们来说,始终需要边缘计算,这些计算需要在设备上或设备附近才是有效的。”
“安全、隐私和成本是我们考虑的三个主要因素,”Wysocki补充说。但到目前为止,安全和隐私并不是公有云服务的主要问题。
Hollowell表示,Reinsurance Group of America对公有云服务的安全性很满意。“我们正在通过AWS Bedrock服务利用Anthropic、Mitral和其他公司的基础模型,该服务提供了数据隔离和安全性,”这让企业能够在安全环境中提供类似ChatGPT的功能。
但Woo表示,另一个问题是数字主权。在有严格本地化规则的国家,公有云可能行不通。“你可以选择本地私有云或托管私有云,由你或他人管理,无论哪种方式,你都可以控制数据的存放位置。”
但监管环境并不是唯一因素,Hollowell表示。“在某些地区,数据本地化和隐私要求直接纳入到客户合同中。”在这种情况下,私有云可能提供更灵活的解决方案。因此,对于在多个国家/地区运营的大型组织而言,本地和云的混合方法是最佳选择,Vunvulea表示。至于区域法规,公有云提供商的选择很重要。“例如,如果你想在中东特定位置运行工作负载,Oracle云是最佳的选择之一,”他说,每个国家或地区在处理数据方面都有自己的法规。没有一家云提供商在所有这些国家都有业务,但Oracle在这些国家或地区拥有巨大的影响力,因此你可以与Oracle和其他云厂商合作运行本地工作负载。
但Hollowell表示,混合云也有缺点。他说:“在公有云和混合云环境中管理大型数据集的互操作性和性能,仍然是需要解决的关键挑战。”
展望未来,Hollowell表示,“我们的战略意图是通过不断发展的新功能业务需求,结合自然的应用生命周期管理实践来评估托管决策,而不是简单地将所有内容迁移到公有云。”具有一致容量需求且可以通过传统融合型基础设施满足的应用,将运行在私有云中,而那些不始终需要高计算的应用仍将是公有云的候选者。
对于Perry来说,为组织的应用构建正确的IT基础设施,就是要使用正确的建筑材料。“公有云只是我们构建架构解决方案所需的材料之一,你必须取得适当的平衡。”
遗憾的是,优化本地环境、私有云和公有云服务的组合,是一个不断变化的目标。Perry说:“我不能说一切都在正确的位置,因为技术是不断发展的。”他建议,云技术总是在变化,所以要做好准备,能够与时俱进。确保拥有正确的工具来做到这一点非常重要,因为你今天拥有的工具可能不是你明天需要的工具。
Vunvulea表示,随着技术进步,需要做出改变,这也是你应该避免厂商锁定的原因之一。这是一个难题,因为要以最优化的方式运行云工作负载,你可能需要使用厂商最先进的专有功能。
但他说,最终你希望避免锁定,以便能够更轻松地在本地环境、公有云和私有云之间移动。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。