Google TPU 8 世代发布推动 AI 推论与光融合技术变革

Google TPU 8 世代发布推动 AI 推论与光融合技术变革

全球半导体行业正经历一场深刻的结构性变革,主战场已从“模型训练”加速向“模型推论”转移,竞争的核心逻辑也随之重构。作为这一趋势的标志性事件,Alphabet 旗下 Google Zui新发布的第 8 代 TPU(TPU v8)彻底打破了以往 GPU 主导的单一架构,将 AI 基础设施的设计思想推向了“系统效率”至上的新阶段。

Google 此次战略的核心在于彻底放弃“芯片”的旧思路,转而推出专为不同场景定制的TPU 8tTPU 8i。其中,TPU 8t 专为训练设计,性能较前代提升约 2.8 倍,大幅缩短超大规模语言模型的开发周期;而 TPU 8i 则专注于推论,效率提升近 80%,旨在应对海量并发请求。这两大芯片均与自研的 ARM 架构 CPU“Axion”及先进液冷系统深度集成,标志着 AI 芯片已全面进入专用 ASIC时代,电力与散热效率成为决定数据中心竞争力的关键物理瓶颈。

这一转变的背后,是 AI 商业模式的本质进化。随着 AI 代理(Agent)的普及,模型处理量已突破每分钟 1600 亿个 Token,单次请求背后往往伴随数十次推论运算。竞争焦点不再单纯是浮点运算能力(FLOPS),而是转向低延迟、高吞吐量与低成本的平衡。Google 同步推出的 AI 代理构建工具及 7.5 亿美元专项基金,正是为了在 TPU 8i 构建的坚实底座上,加速应用生态的爆发。

在基础设施层面,Google 通过引入光电路开关(OCS)技术,成功将芯片间的通信瓶颈转化为新的竞争优势。OCS 技术无需光电转换即可直接切换光信号,将数万个芯片以极低延迟连接成“虚拟单芯片”,并依托新一代网络架构"Virgo",实现了跨越物理距离的大规模分布式推论。这种“光融合”方案不仅解决了传统电互连的功耗与延迟难题,更成为 Google 区别于其他云厂商的核心护城河。

随着 Google 垂直整合芯片、网络与软件的战略落地,AI 供应链的受益逻辑正在发生根本性扩散。除了 Broadcom、Marvell 等 ASIC 设计与制造伙伴,以及 Arm 等架构提供商外,SK 海力士、三星电子等 HBM 存储巨头因算力需求激增而受益显著。更为关键的是,光通信、高速互连、液冷散热及电源管理等“非芯片”环节,正从辅助角色跃升为 AI 时代的新基盘,任何无法解决物理层限制的厂商都将被淘汰。

面对 Google 的攻势,英伟达并未坐以待毙,其通过 Blackwell 架构及 GB300/NVL72 系统级创新,配合 Dynamo 软件栈,正全力构建"AI 工厂”以维持推论市场的主导权。然而,Google 的策略揭示了一个更深层的趋势:AI 算力市场正从“单一霸权”走向“场景化重构”。短期内 GPU 与 TPU 将共存,但长期看,随着云厂商自研芯片的成熟,市场将形成多极化格局。对于中国科技企业而言,这不仅是技术路线的博弈,更是对供应链韧性的考验——在算力需求从“训练”向“推论”迁移的浪潮中,谁能率先掌握光互连液冷散热专用架构的底层技术,谁就能在未来的 AI 基础设施版图中占据一席之地。

供应商

查看商铺
公司
深圳昂尼电子科技有限公司
电话
0755-89328757
手机
13058082845
经理
钱海权
地址
深圳市福田区沙头街道天安社区泰然十路天安创新科技广场二期西座1003-B03室

公司新闻

更多

相关资讯

更多