云上资讯 · 电脑

快速和自动化:全球技术中断显示了云软件更新的危害

  

  网络安全公司CrowdStrike的一次有缺陷的更新导致全球范围内的技术中断,这引发了人们对自动化软件升级的质疑,以及少数占主导地位的供应商(尤其是云计算供应商)是否将风险集中到了危险的程度。

  “错误的补丁和更新一直在发生。现在不同的是,这些云服务的规模是如此之大,”雪城大学信息研究学院副教授李·麦克奈特(Lee McKnight)说。

  上周五的CrowdStrike更新旨在更新其威胁检测软件中的代码,其中包含一些漏洞,导致基于微软windows的系统无法启动。由此造成的网络中断扰乱了世界各地的企业,包括航空公司、医院、证券交易所、银行和媒体公司,以及一些美国政府机构。

  CrowdStrike表示,它正在与客户合作,并发布了修复崩溃系统的步骤。该公司在其网站上表示:“我们理解事态的严重性,并对由此带来的不便和中断深感抱歉。”CrowdStrike表示,该公司拥有2.9万名客户,其中包括近300家财富500强企业。

  一位发言人表示,微软正在协助客户进行恢复工作,CrowdStrike问题与之前Azure平台的中断无关,该问题已经得到解决。

  销售补丁管理软件的Action1公司总裁迈克?沃尔特斯(Mike Walters)说,对于那些有数百台甚至数千台电脑宕机的大型组织来说,恢复可能需要几天时间。他说,CrowdStrike建议客户采取手动步骤,每台机器需要15到30分钟。

  研究公司高德纳(Gartner)的数据显示,到2023年,按收入计算,CrowdStrike在安全软件市场的份额约为15%,仅次于微软的约40%。

  Gartner副总裁尼尔·麦克唐纳(Neil MacDonald)说:“集中风险总是存在问题。”“提供这种能力的供应商有责任提供具有弹性的服务。”

  对于安全和IT领导者来说,这意味着对软件更新进行额外的审查,即使它们来自“可信”的供应商,而不是完全关闭自动更新。

  包括CrowdStrike在内的许多主要供应商都使用一种被称为持续集成和持续交付自动化的流程,旨在缩短将代码更改集成到产品中的时间。更新,即使包含错误代码,也会通过基于云的系统同时发送给数千名客户。

  反过来,许多客户允许自动更新,因为他们既没有资源也没有时间正确地检查来自每个提供商的新补丁和版本。

  周五的停电引发了人们对这一过程的质疑。

  智库战略与国际研究中心(Center for Strategic and International Studies)高级顾问格斯特尔(Glenn Gerstell)说,全球经济依赖少数几家技术提供商在压力下测试更新内容,要求它们迅速发布更新内容。

  “我们创建了一个依靠第三方提供你自己看不到的更新的系统,”曾担任美国国家安全局(National Security Agency)总法律顾问的格斯特尔说。

  Redwood Software的首席信息安全官安迪?夏尔马表示,首席信息官和首席信息安全官“需要评估人工干预在自动更新之上的意义。”

  但星座研究公司(Constellation Research)的网络安全分析师奇拉格·梅塔(Chirag Mehta)说,关闭自动更新也可能使企业更容易受到网络攻击。相反,公司应该投资于更好的软件测试,并与他们的主要供应商更紧密地合作。

  卫生系统CommonSpirit health的首席信息官丹尼尔·巴奇(Daniel Barchi)说,他的团队在发现问题大约一个小时后,于周五早些时候暂停了超过15万台设备的更新。

  在派遣员工手动修理电脑的同时,CommonSpirit Health指导员工用纸笔下订单并做笔记。巴奇说,包括实验室、成像和电子医疗记录在内的核心系统没有受到影响,但卫生系统无法在运行CrowdStrike的计算机上使用它们。

  巴奇说,虽然取消了一些预约和一次选择性手术,但CommonSpirit Health已经恢复了足够多的设备的手术,所有的医院和诊所都是在线的。

  “在某些情况下,我们受益于供应商合作伙伴,他们积极主动地进行更新和升级,”他说。“有时候,在这种情况下,情况会有所不同。所以问题是,我们该如何权衡?”

  金·s·纳什对本文也有贡献。

  给詹姆斯·伦德尔(james.rundle@wsj.com)和贝尔·林(belle.lin@wsj.com)写信