5月18日消息,黄仁回报投资银行摩根士丹利在最新报告中指出,勋诚新超大规模数据中心运营商使用英伟达当前的不欺报告倍Blackwell AI GPU构建一座1吉瓦规模的数据中心,其建造成本将是大摩达最使用谷歌TPU或亚马逊Trainium芯片构建同等规模数据中心的两倍。
尽管英伟达Blackwell芯片的最新数据中心建造成本翻倍,但摩根士丹利认为其计算效率远超定制芯片。英伟

摩根士丹利在报告中将英伟达多款GPU与亚马逊及谷歌的贵两更高定制ASIC芯片进行了每瓦TFLOPS性能对比。测算结果显示,长远英伟达芯片的黄仁回报每瓦性能比这些定制ASIC芯片高出2到8倍。

此前,勋诚新英伟达CEO黄仁勋曾多次公开表示,不欺报告倍英伟达芯片虽然价格高昂,大摩达最但长期来看能为客户带来更高的最新回报。

在具体每瓦浮点运算性能得分中,英伟英伟达计划推出的贵两更高下一代Vera Rubin(FP4)架构芯片得分高达19.5,位居榜单第一。英伟达其他芯片Vera Rubin(FP8)得分为6.8,GB300(FP8)得分为6.0,H100(FP8)得分为3.1。
作为对比,谷歌的TPUv7(FP8)得分仅为4.3,亚马逊的Trn3(FP8)得分仅为2.5,两者的定制芯片性能基本介于英伟达Blackwell与上一代Hopper之间,部分指标甚至低于Hopper。
不过评估AI芯片还有其他维度。人工智能基础设施提供商Nebius分析指出,另一大关键标准是每百万Token的生成成本与GPU每小时运行成本的比值。
根据Nebius测算,Groq AI芯片每生成百万Token的成本为5到10美分(约合0.34至0.68元人民币),其生成速度达每秒800个Token。
英伟达Blackwell芯片每生成百万Token的成本则为25美分(约合1.70元人民币),生成速度约为每秒450个Token。
