XM开户

为何大家都盯上了光芯片?

XM
光子学在人工智能基础设施中的应用与优势

硅谷人工智能基础设施的快速发展带来了一个物理挑战:通过铜线传输的数据量有限,超过一定限度会导致热量、距离和电力消耗问题。因此,投资者、芯片制造商和云服务巨头开始关注光子学 ,这是一种利用光而非电信号在人工智能芯片和服务器之间传输数据的技术 。

我最近参观了位于硅谷的Lightmatter总部,该公司展示了其最新的光子硬件,用于人工智能数据中心。与Lightmatter首席执行官尼克·哈里斯的交流揭示了光学技术可能成为人工智能时代不可或缺的基础设施的原因。

公司 筹集资金 投资者 Lightmatter 8.5亿美元 谷歌 、富达、T. Rowe Price

Lightmatter已成功从包括谷歌、富达和T. Rowe Price在内的大投资者那里筹集了8.5亿美元 。周二 ,Lightmatter加入了英伟达的NVLink Fusion生态系统,这有助于其技术与英伟达的主导AI硬件更好地协同工作。

光子学的优势

哈里斯指出,人工智能行业已经发展到提升性能不再仅仅是提高单个芯片的速度 ,而是有效地将大量的GPU连接在一起。当前人工智能系统严重依赖GPU之间的铜线连接,但在大规模应用中,铜线连接成为瓶颈 ,因为电信号在短距离内会衰减并产生大量热量 。

光子学使用光在光纤中传输,使得数据传输距离更远 、速度更快、能耗更低。例如,使用铜缆连接500个GPU需要四个独立的GPU服务器机架 ,而全部改用光纤可以直接连接所有500台GPU服务器 ,大幅缩短训练AI模型的时间。

连接方式 所需服务器机架数量 性能提升 铜缆 4 - 光纤 1 三倍速度提升

哈里斯还提到,光子学可以使得同样的功率获得三倍的性能,或者在同样的功率下 ,只需三分之一的时间就能用完,这对于能源供应有限的情况尤其有利 。

光子学在数据中心的应用

铜线只能传输大约一米长,因为电信号在铜缆中传输时会迅速衰减 ,导致数据丢失。这种物理限制带来了散热问题,因为GPU服务器机架需要紧密排列以接触铜缆,使得散热变得困难。

光子学改变了这一点 ,因为光信号可以传播得更远更快而不会衰减,所以GPU服务器和机架可以间隔更远的距离,数据中心运营商在设计和冷却AI集群方面就有了更大的灵活性 ,从而有可能节省更多用于冷却这些系统的电力成本 。

双向通信(BiDi)技术

Lightmatter正在研究的BiDi技术可以减少人工智能数据中心内部所需的布线量 。下一代人工智能集群需要大约300英里的电缆,而BiDi技术可以将电缆长度减少一半。

BiDi技术将两个方向的线缆合并到一根线缆中,对于超大规模数据中心而言 ,减少光纤长度至关重要 ,因为光缆会占用空间、产生热量 、增加维护难度并提高成本。

光子学的挑战与未来

哈里斯表示,光子学之所以没有更早得到应用,主要问题在于成本 。但随着制造技术改进和人工智能基础设施需求的爆炸式增长 ,这种情况正在发生变化。设计这些系统的人追求的是可靠的2倍性能提升,而铜缆的性能提升机会已经用完。

现在,率先采用和部署光子技术的公司将拥有巨大的性能优势 ,从“迫不得已才进行转换”转变为“为了获得竞争优势而进行转换” 。