Make money doing the work you believe in

Bernstein前几天推出了一个长达97页的报告。

主题是:The Battle for AI Data Center Connectivity: Is Copper Out and Fiber In? How Are Supply Chain Profit Distributions Changing in the CPO Era?

Bernstein (伯恩斯坦) 报告指出,在AI数据中心中,铜与光纤解决方案并非水火不容,而是将在Scale-up和Scale-out两大主要场景中长期共存。尽管共封装光学CPO在能效和成本上具备潜在优势,但其大规模部署受制于制造和维护挑战,预计2028年之后才可能广泛普及。在此过渡期间,线性可插拔光学LPO可能作为一种过渡方案。更重要的是,CPO正在重塑价值链,将利润重心从传统光模块制造商转移到芯片设计、先进封装和系统集成供应商。

AI数据中心内部铜与光技术之间长期的竞争正迎来一个关键转折点,但“铜退光进”的说法远非事实的全貌。

​伯恩斯坦最新白皮书强调,随着AI集群规模迅速扩大,连接能力正成为影响系统性能和成本的核心瓶颈,也是行业竞争的新焦点。在未来多年内,铜互连与光互连不会相互取代,而是在不同距离和应用场景下共存,沿着Scale-up和Scale-out两条截然不同的路径演进。

​英伟达和博通正在推动CPO从概念走向商业化。英伟达已明确表示,其CPO交换机将于2026年下半年进行小规模部署,CoreWeave和Lambda将成为首批采用的AI云服务提供商。然而,由于制造、封装和测试的高度复杂性,在2026年至2028年期间,可插拔光模块仍将是超大型云服务提供商的主流选择。同时,铜互连凭借其在成本、功耗和成熟度方面的优势,将在未来至少三年内继续主导Scale-up场景。

​CPO的真正意义在于重构供应链的价值分配。根据伯恩斯坦的估算,CPO光引擎和激光器的成本比1.6T可插拔模块的平均价格高出约10%,但利润重心将从传统光模块制造商转移至芯片制造和先进封装领域。

​这一升级也将推动高端PCB、ABF载板和T级玻璃纤维等基础材料的结构性增长。不过,随着新产能的释放,从2026年底开始,价格竞争、折旧增加以及供应扩张将逐渐压缩利润空间。投资者应关注在技术、制造和供应链控制方面具备领先能力的企业。

​铜与光各司其职,Scale-up与Scale-out路径泾渭分明

​AI基础设施的扩展主要遵循两条路径:Scale-up和Scale-out。

​Scale-up涉及在单一系统内不断增加计算资源,例如在同一机架或节点内配置更多AI加速器,以提升单个训练任务的计算效率。另一方面,Scale-out则是通过连接更多机架和服务器,将数据中心扩展为更大规模的计算集群,从而提高整体容量和吞吐量。

​大语言模型训练严重依赖张量并行和专家并行等技术,需要在紧密耦合的Scale-up Pod内进行频繁的数据交换。这使得Scale-up场景对延迟和带宽的要求远高于Scale-out。目前,铜互连以其低成本、低功耗和技术成熟等优势,依然是机架内连接的主导方案。在英伟达的GB300 NVL72架构中,超级芯片与交换芯片之间的高速通信仍主要依赖铜缆。

​相比之下,光互连在长距离、高带宽传输方面展现出更显著的优势。随着单通道速率提升至224Gbps及以上,光模块能够在10米甚至更远的距离上实现低损耗传输,支持太比特级别的扩展,从而成为Scale-out架构中跨机架连接的核心技术。

​根据LightCounting的数据,2025年全球光收发器及相关产品销售额超过230亿美元,同比增长约50%。其中,以太网光收发器市场规模约为170亿美元,同比增长60%。该机构预测,2024年至2026年间,以太网光收发器市场将保持约59%的年复合增长率。从2026年到2030年,随着市场逐渐成熟,增长率将回落至15%左右。

​这表明未来AI数据中心的连接架构不会是“光取代铜”,而是在不同层级上有明确的角色划分:铜互连将继续主导短距离、高密度的Scale-up场景,而光互连将支撑长距离、高带宽的Scale-out网络。这两种技术将在未来多年内并行发展,共同构成AI基础设施扩展的核心基石。

​CPO:从概念到落地的现实挑战

​共封装光学直接将光引擎集成到XPU或交换芯片所在的基板上,去除了传统光模块中的DSP,使数据能够通过低功耗的SerDes进行传输。这种架构大幅缩短了电信号路径,被视为下一代高速互连的关键方向。

​英伟达表示,与其传统可插拔光模块相比,其CPO交换机能够实现约3.5倍的能效提升、63倍的信号完整性改善以及10倍的网络弹性增强。博通指出,采用CPO可将每比特的光学成本降低约40%。

​然而,CPO在实现广泛采用之前仍面临诸多现实挑战。制造良率、测试复杂性、光纤耦合精度,以及云服务提供商对可维护性和供应商集中度的担忧,都是重大障碍。由于光学组件被封装在交换机内部,任何故障通常需要更换整台交换机或返厂维修,导致与传统方案相比停机时间显著增加。相比之下,可插拔光模块可以由数据中心运维人员在现场快速更换,对业务影响微乎其微。

​基于这些局限性,伯恩斯坦预计CPO在Scale-out网络中的小规模部署将于2026年下半年开始,主要用于验证实际性能和测试供应链的成熟度。早期采用者预计将包括CoreWeave和Lambda等AI云服务提供商。

​在更为关键的Scale-up场景中,CPO的引入可能会进一步推迟到2028年下半年。原因在于,业界需要在交换机端充分验证其长期可靠性,然后才会将该技术应用于价值更高、容错率更低的XPU系统。

​LightCounting预测,CPO的大规模出货要到2028年之后才会出现。在此之前,线性可插拔光学LPO可能成为一种更具现实意义的过渡方案。通过去除DSP并将信号处理交给线性组件,LPO能够在保留模块化设计带来的维护便利性的同时,将功耗降至传统可插拔模块的三分之一左右。

​伯恩斯坦认为,到2030年,LPO的出货量预计将超过CPO。这意味着在未来几年内,数据中心光互连的主流方向不会直接跨越到共封装,而是将在可插拔、LPO和CPO三种架构之间逐步演进。

​CPO重写价值分配:利润从模块制造商流向芯片与封装

​对英伟达Quantum-X800 CPO交换机成本结构的拆解清晰地指向一个结论:CPO技术正在深刻重写产业链的价值分配规则。

​据估算,该交换机配置了4颗交换ASIC,每颗周围环绕18个光引擎,整机配备18个外部光源模块。每个光源模块包含8个连续波激光器,为所有光引擎提供稳定的激光输入。基于此架构,单台Quantum-X800 CPO交换机的总成本估计约为57万美元。

​从定价结构来看,CPO中光引擎与激光器的组合平均售价比1.6T可插拔光模块高出至少10%。这一对比考虑了传统光模块制造商约40%的毛利率以及CPO系统供应商约50%的毛利率。换言之,CPO不仅没有降低整体价值,反而通过更高的集成度创造了更大的单体价值。

​更重要的是,CPO正在改变产业链内部利润的分配位置。传统可插拔光模块的价值主要集中在模块制造商手中,DSP及其他电芯片构成了重要的成本组成部分。而在CPO架构下,DSP被移除,光引擎直接与交换芯片共封装,这使得价值重心向芯片设计、先进封装和晶圆制造工艺转移。

​这意味着英伟达、博通、台积电以及各类委外半导体组装和测试OSAT供应商将成为CPO时代的核心受益者。同时,上游关键组件供应商也有望从这一增长中获益,包括Lumentum和Coherent等光器件公司,以及Chroma ATE等测试设备制造商。

​相比之下,在CPO以及未来的近封装光学NPO架构下,传统光模块制造商的角色将被结构性削弱。随着封装和系统集成成为核心竞争力,行业利润将不再集中于收发器组装环节,而是向具备芯片设计、先进制造和系统集成能力的企业转移。

May 12
at
12:58 AM
Relevant people

Log in or sign up

Join the most interesting and insightful discussions.