西湖娱乐 分类>>

西湖娱乐城- 西湖娱乐城官网- APP最新英伟达经济学:每美元性能是AMD的15倍买越多省越多是真的

2026-01-03 20:53:12
浏览次数:
返回列表

  西湖娱乐城,西湖娱乐城官方网站,西湖娱乐城APP,西湖娱乐城网址,西湖娱乐城注册不算不知道,一算吓一跳:在英伟达平台每花一美元,获得的性能是AMD的15倍。

  来自Signal65的一份最新详尽报告揭示了这个现实,一定条件下生成同样数量的token,英伟达的成本只有AMD的十五分之一。

  这份报告基于SemiAnalysis Inference MAX的公开基准测试数据,时间跨度从2025年10月到12月,覆盖了从密集模型到前沿MoE推理模型的全场景测试。

  AI模型正在经历一场架构革命,打开Artificial Analysis排行榜就会发现,智能度排名前十的开源模型清一色都是MoE

  另一项来自OpenRouter的数据显示,超过50%的token流量正在被路由到推理模型上。

  MoE架构的核心思路是把模型参数拆分成多个专门化的“专家”子网络,每个token只激活其中一小部分。

  以经典的DeepSeek-R1为例,它拥有6710亿总参数,但每个token只激活370亿——这让它能以更低的计算成本提供前沿级别的智能。

  问题随之而来。当专家分布在多块GPU上时,GPU之间的通信延迟会导致计算单元空闲等待数据,这些空闲时间直接转化为服务商的成本。

  报告指出,无论是英伟达B200还是AMD MI355X,所有8卡系统在超出单节点规模后都会撞上“扩展天花板”(scaling ceiling)。

  在软件层面,整个系统就像一块巨型GPU一样运作。配合英伟达Dynamo推理框架的分离式预填充-解码调度和动态KV缓存路由,这套架构能够有效突破8卡系统的通信瓶颈。

  两个平台的绝对性能相比10月都有显著提升,英伟达的峰值吞吐从约7000 tokens/sec跃升至14000以上,AMD则从约6000提升到8500左右,但相对差距反而拉大了。

  更关键的是,GB200 NVL72能够达到竞争平台根本无法企及的水平,在28卡配置下可以输出超过275 tokens/sec/user,而MI355X在相当吞吐水平下的峰值只有75 tokens/sec/user。

  而GB200 NVL72价格仅上涨1.67倍,换算下来每美元性能提升约12倍,单token成本降至H200的十二分之一。

  MoE推理让网络成为推理成本的瓶颈,而机柜级的GB200 NVL72恰好解决了这个问题。价值的衡量标准正在从单纯的算力转向“每美元能产出多少智能”。

  电影《寻秦记》首映礼,雪梨现身亲了古天乐一口,“项少龙”哭笑不得:果然是雅夫人;他俩还曾是杨过与李莫愁

  广东600分考生的尴尬:省内找不到像样的工科校,广工成香饽饽

  1976年周总理逝世,83岁宋庆龄灵堂受辱,怒摔东西撂下一句狠话,连夜飞回上海

  香港上诉法庭驳回夏海钧上诉 维持转移600亿港元资产和处置豪宅出售收益的禁令

  「疑似小偷」的顾客成了优衣库员工KPI?多少人逛个街吃火锅都在被商家悄悄标记

  驼奶粉品牌推荐,2025七款高品质驼奶粉品牌测评:避坑指南+全人群适配

搜索