全球最薄电池极片中国造

2026-05-17 08:30 子晗 19 人浏览

分享/举报

2026年的AI芯片圈，早就不是英伟达“一家独大”的剧本了——TrendForce数据显示，今年云服务提供商的定制ASIC出货量要涨44.6%，是GPU增速（16.1%）的近3倍。昨天跟做AI服务器运维的老周吃饭，他翻着采购清单叹气：“去年还只认英伟达的H200，今年得加AMD的MI350、谷歌的Ironwood TPU，连初创公司的可逆计算芯片都得试试水。”

英伟达：靠“生态护城河”稳坐第一说到老大哥英伟达，今年的动作确实“精准戳中痛点”。比如刚推出的DGX Cloud Lepton，直接把CoreWee、Lambda这些GPU云服务商连成了一个“超市”——开发者不用再绕亚马逊、阿里云，直接挑服务商的资源跑模型。老周说他们测试过Dynamo推理框架：“在GB200 NVL72上跑DeepSeek-R1 671B，速度比之前快30倍！以前跑大模型得等半夜，现在上班时间就能出结果，程序员再也不用熬通宵了。”

但小夏（刚入行的算法工程师）吐槽：“CUDA是好用，可英伟达的卡太难抢！去年订的H200，现在还没到货，项目都延期两次了。”

AMD：硬件追上了，软件还得“补作业”AMD今年算是“摸到了英伟达的衣角”。MI350系列和H200比推理性能，在70B LLM上差不多甚至更强——可软件是硬伤。做算法优化的小杨说：“上次用AMD的卡跑Llama 70B，光配置环境就花了三天！CUDA一键搞定的事，AMD得调各种参数，差点把我搞崩溃。”

不过老周说AMD在“补短板”：“收购Untether AI和Brium，就是要把编译器和内核优化搞上去。等软件跟上，说不定能抢英伟达一半市场。”

云厂商：自研芯片，把成本攥在自己手里AWS的Tranium2组成Project Rainier集群，给Anthropic的大模型当“动力源”；谷歌的Ironwood TPU更狠——每个芯片4614 TFLOPs，9216个芯片的集群能到42.5 Exaflops。“谷歌自家的翻译、搜索都用这玩意儿，比外购GPU便宜30%”，做云服务销售的小吴说。

Meta的MTIA v2性能翻3倍，微软的Maia 100用5nm工艺——“这些大厂自研芯片，就是不想让英伟达赚‘差价’。”

初创公司：用“黑科技”闯新路最惊喜的是“不走寻常路”的初创公司：英国Vaire搞可逆计算，测试芯片能回收50%能量——“以后AI服务器不用装那么多空调，电费省一半”；Extropic用热力学计算，虽然还没出芯片，但思路够野；Cerebras的晶圆级芯片WSE-3有4万亿晶体管，“跑阿斯利康的分子模拟，比GPU快10倍”——老周说，“以前模拟新冠病毒变异要半年，现在俩月就出结果。”

老周最后“今年的AI芯片市场，早就不是‘谁的GPU更强’的游戏了——是算力、软件、生态的全面比拼。英伟达靠生态稳坐C位，AMD靠硬件追进度，云厂商靠自研降成本，初创公司靠‘黑科技’闯新路。明年说不定能冒出几个黑马，把格局彻底打乱。”