IBM近日宣布了一项革命性的光学技术突破,这项技术有望彻底改变AI模型的训练方式,不仅速度提升至光速级别,还能显著减少能源消耗。据该公司透露,若将此项技术应用于数据中心,其节省的能源量足以满足5000个美国家庭一年的用电需求。
传统数据中心内部主要依赖铜线连接各类设备,其中包括GPU加速器。然而,这些GPU在等待数据输入时常常处于空闲状态,不仅浪费了大量时间,还消耗了可观的能源,增加了运营成本。IBM指出,尽管数据中心通过光纤电缆与外部高效连接,但内部通信方式却未能跟上这一速度。
IBM高级副总裁兼研究总监Dario Gil表示,随着生成式AI对能源和处理能力的需求日益增加,数据中心必须迎来一场变革。他强调,共封装光学技术(CPO)正是推动这一变革的关键。通过CPO技术,未来的芯片将能够像光纤电缆一样高效地传输数据,从而实现更快、更可持续的通信,为处理复杂的AI工作负载奠定基础。
IBM在一篇技术论文中详细介绍了其CPO原型的创新之处。这项技术通过大幅提升数据中心的带宽,有效减少了GPU的闲置时间,从而加速了AI处理过程。据IBM介绍,采用CPO技术后,大型语言模型(LLM)的训练时间将从原本的三个月大幅缩短至三周。更高的能源效率还意味着更低的能源消耗和训练成本。