9 月 6 日,谷歌在Hot Chips 2025 大会压轴环节释放重磅消息:最新一代 TPU “Ironwood” 已正式部署至谷歌云数据中心,这款今年 4 月发布的第七代 TPU 硬件,作为谷歌首款专为大规模推理负载设计的芯片,凭借多项突破性技术重新定义 AI 算力边界。

从核心参数看,Ironwood 实力顶级:集成双计算核心,FP8 精度算力 4614 TFLOPs,搭配 192GB HBM3e 显存(带宽 7.3TB/s),单芯片 I/O 带宽 1.2TB/s;系统架构上,单个系统可扩展至 9216 枚芯片,峰值性能 42.5 ExaFLOPS,还实现 1.77PB 共享内存,刷新全球纪录
可靠性设计方面,Ironwood 内置可信根、自检及静默数据损坏防护机制,靠逻辑修复提升良率,贯彻 RAS 理念;节点故障时可自动重配并借检查点恢复任务。散热采用谷歌第三代液冷 + 冷板方案,性能稳定度较风冷提升 2 倍。
能效与适配性上,Ironwood 能效比超前代 Trillium 一倍,支持动态电压与频率调节;设计阶段优化电路及布局,新增第四代稀疏核心,适配推荐引擎、全模态生成等负载。实际应用中,助力药企将基因测序周期缩至数天,银行信贷审批提速至分钟级,欺诈识别准确率 99.9%。

亿配芯城(ICgoodFind)总结:Ironwood TPU 的落地不仅展现谷歌在 AI 硬件的技术统治力,更将推动超大规模推理场景的产业化,为半导体行业树立高性能、高可靠的新标杆。