随着人工智能计算的碳足迹不断扩大,更可持续的人工智能设计和新的最佳实践是必不可少的。

 

我们正在目睹一个由人工智能的巨大进步推动的历史性的全球范式转变。随着人工智能从预测性到生成性的发展,越来越多的企业开始关注,自2017年以来,企业对人工智能的采用已经增长了一倍以上。根据麦肯锡的数据,63% 的受访者预计在未来三年内,他们所在组织对人工智能的投资将增加。

 

与人工智能的普及程度前所未有的增长相呼应的是,计算量也以惊人的速度增加。自2012年以来,最大规模的人工智能训练消耗的计算量增长了超过30万倍。然而,随着庞大的计算需求增长,也带来了重大的环境影响。

 

更多的计算量导致更大的电力消耗,进而产生更多的碳排放。麻省大学阿默斯特分校的研究人员在2019年的一项研究中估计,在训练一种名为变压器的深度学习算法时,所消耗的电力可以产生超过62.6万磅(约合284公吨)的二氧化碳排放量,相当于纽约市至悉尼之间往返41次的飞行的排放量。而这只是训练模型的过程而已。

 

我们还面临着数据存储的激增。国际数据公司预测,到2025年,将会产生180泽字节的数据,相当于1800亿兆字节。在这个规模下进行数据存储所需的总体能量非常庞大,可持续应对这个问题将会是一个巨大挑战。根据数据存储的条件(例如所使用的硬件、设施的能源混合情况)而言,每存储一兆字节的数据,就会产生2吨二氧化碳排放。现在将这个数字乘以1800亿。

 

人工智能在不断扩大的环境足迹下的当前发展轨迹显然是不可持续的。我们需要重新思考现状,并改变我们的策略和行为。

 

通过人工智能推动可持续发展的改进 尽管人工智能的普及带来了显著的碳排放问题,但也存在巨大的机遇。实时数据收集结合人工智能实际上可以帮助企业快速识别出在各个领域减少碳排放的机会。

 

例如,人工智能模型可以识别出影响建筑物效率的因素,包括供暖、通风和空调等,在这些复杂、数据丰富、多变量的系统中,自动化优化非常适合,几个月内就可以实现节能。尽管几乎任何建筑都存在这个机会,但在数据中心特别有效。几年前,谷歌分享了他们使用人工智能改善数据中心冷却系统的经验,以此减少能源消耗高达40%。

 

人工智能也被证明是实施低碳计算的有效手段。根据可再生能源的可用性自动调整计算任务,可以降低相应活动的碳排放。

 

同样,人工智能可以帮助解决上述膨胀的数据存储问题。为了解决大规模数据存储带来的可持续性问题,在他的书《全球浪费》中,格里·麦戈文认识到高达90%的数据是未被使用的,仅仅是存储着而已。人工智能可以帮助确定哪些数据具有价值、必要性,并具备足够高质量来进行存储。无用的数据可以被简单丢弃,从而节省成本和能源。

 

如何更加可持续地设计人工智能项目 为了负责任地实施人工智能项目,我们都需要重新思考一些事情,并采取更主动的方法来设计人工智能项目。

 

首先,对你要解决的业务问题进行批判性的审查。问问自己:我是否真的需要人工智能来解决这个问题,还是传统的概率方法在计算和能源要求方面更低的情况下就能满足需求?深度学习并非解决所有问题的唯一方案,因此在做出决策时要慎重选择。

 

一旦明确了业务问题或用例,构建解决方案和模型时要仔细考虑以下几点:

 

将数据质量置于数据数量之上。较小的数据集需要较少的能量进行训练,且对计算和存储的影响更轻,从而产生较少的碳排放。研究表明,训练过的神经网络中的许多参数可以剪枝多达99%,从而得到更小、更稀疏的网络。

 

考虑实际需要的精度水平以解决你的用例。例如,如果你将模型调整为进行低精度的计算,而不是计算密集型的FP32计算,可以实现显著的节能。

 

利用领域特定的模型,避免重复造轮子。通过使用现有训练数据集中的一组模型,可以获得更好的结果。例如,如果你已经训练了一个大型模型以理解语义,可以构建一个更小、针对性更强的领域特定模型,利用大型模型的知识库,以更高效地输出相似的结果。

 

在从边缘到云端平衡硬件和软件。更异构的人工智能基础设施,结合满足特定应用需求的人工智能计算芯片组,将确保在存储、网络和计算等各个方面节省能源。边缘设备的SWaP(尺寸、重量和功耗)限制要求更小、更高效的人工智能模型,而靠近数据生成位置的人工智能计算可在具有低功耗设备和更小的网络和数据存储需求的情况下实现更加节能的计算。此外,对于专用的人工智能硬件,使用内置的加速器技术提高每瓦性能可以带来显著的节能效果。我们的测试结果显示,与相同平台上没有加速器运行的相同工作负载相比,内置加速器可以提高4倍的平均每瓦性能效率(结果可能有所不同)。

 

考虑使用开源解决方案和优化库,以确保从一开始就能获得硬件和框架的最佳性能。除了开放源代码,采用开放标准有助于提高重复性和规模化能力。例如,为了避免耗能的初始模型训练,考虑使用预训练模型以提高效率,并在长期内实现共享/联邦学习和改进。同样,开放的API可以实现更高效的跨架构解决方案,允许你构建一次工具、框架和模型,并在各处部署以实现更优异的性能。

 

与许多可持续发展的决策一样,设计人工智能项目以减少其环境影响并不容易。减少能源消耗和碳足迹需要努力、意愿和妥协,以做出最负责任的选择。但正如我们在其他可持续发展的商业决策中所看到的,即使是看似微小的调整也可以创造大规模的改进,减少碳排放并帮助减缓气候变化的影响。

推荐阅读