
{{!completeInfo?'请完善个人信息':''}}
阿里推出新一代 AI 推理芯片,兼容主流框架(PyTorch/TensorFlow),瞄准填补 Nvidia H20 在中国留下的市场空档。
摘要
2019 年的含光 800 曾以 825 TOPS 峰值算力、INT8 接近 FP32 精度刷新 ResNet-50 记录,为新品奠定信心。
美国出口管制反复——H20 先禁后放,再陷“后门”疑云与产能不稳——反而成为国产替代的催化剂。
阿里、华为、寒武纪等集中攻坚,代工依赖中芯国际,形成设计-制造-应用的全国产化链条,但受限于 HBM 高端存储器短缺。
阿里宣布三年内向 AI 与云投入 530 亿美元,中国科技巨头正从“追赶”转向“自主创新”,重塑全球 AI 芯片格局。
在全球科技这场大戏里,中美之间的AI芯片博弈,绝对是最吸睛的篇章。剧情发展到今天,随着美国那边限制政策的反复拉扯,牌桌上的气氛是越来越紧张。而在这场风暴的中心,中国的一众科技巨头们,正悄悄地把“自主研发”这张牌,打得越来越响。
这不,阿里巴巴就带着它的新作品入场了,试图在中国市场,填补那个由Nvidia留下的巨大空白。
根据《华尔街日报》和路透社爆料,阿里已经搞出了一款新型的AI芯片。
和老款芯片相比,它更“通用”,能干的活儿更多,专门为五花八门的AI推理任务而生。
阿里的T-Heat部门,在芯片这块地里已经耕耘了好些年。2019年推出的含光800推理芯片,当时主要是为了跑像ResNet这类传统的机器学习模型。但时代变了,现在是大型语言模型和多模态的天下。所以新芯片应运而生,就是为了能处理更多样化的工作负载。
和华为的昇腾系列NPU不同,阿里这款新芯片将兼容Nvidia的软件平台。这意味着工程师们可以很方便地把现有的代码“平移”过来。虽然听起来有点像要去兼容Nvidia的底层语言CUDA,但更靠谱的猜测是,阿里瞄准的是PyTorch或TensorFlow这类更上层的框架,这些框架本身就提供了硬件无关的编程接口。这招棋,可以说是相当聪明了。
当然,别以为阿里是半路出家的新手。早在几年前,它的第一代AI推理芯片含光800,就已经秀过肌肉了。
根据Hot Chips 2020的技术演示文档,含光800用的是12nm工艺,塞进了170亿个晶体管,峰值算力达到了惊人的825 TOPS。光说数字可能没感觉,咱们直接上个对比图,看看它在当时是什么水平。
数据来源:Hot Chips 2020阿里巴巴技术演示
在当时权威的ResNet-50推理测试中,含光800跑出了每秒78,563张图的峰值性能,是当时最好成绩的四倍。而且在精度上,它用INT8跑出来的准确率,和GPU用FP32跑出来的结果相比,损失微乎其微。比如在resnet_v1_50模型上,GPU FP32的Top1/Top5准确率是75.18%/92.18%,而含光800 INT8的准确率是74.93%/92.47,几乎没差。
有了这样的技术家底,阿里这次再出手,自然是底气十足。
聊国产芯片,就绕不开美国那套组合拳。中国的科技公司之所以一头扎进自研,很大程度上就是被逼出来的。芯片巨头Nvidia在中国卖东西,一直束手束脚。
Nvidia的H20芯片,本来是专门为中国市场定制的“特供版”,是当时能卖到中国最强的AI处理器。但就在今年早些时候,特朗普政府的一纸禁令,又把它给堵在了门外。
然而,故事的戏剧性就在于反转。就在禁令生效后短短三个月,政策又悄悄变了,Nvidia又被允许恢复向中国销售H20芯片。这一来一回的折腾,背后全是地缘政治和商业利益的复杂博弈。
但这事儿还没完。H20芯片在中国市场还惹上了“后门”争议。中国政府担心芯片里可能存在安全隐患,比如被远程控制或者数据泄露。尽管Nvidia一再否认,强调产品绝对安全,但监管部门还是给国内的科技巨头们吹了风,建议大家优先考虑国产替代方案。
与此同时,Nvidia的H20生产线也跟着政策摇摆,一度面临停产,搞得市场供应非常紧张。为了稳住局面,Nvidia现在正加紧研发专门为中国市场设计的下一代芯片,试图在满足美国出口管制和中国客户需求之间,找到一个微妙的平衡点。
但即便如此,中国公司可没闲着,也没在原地等待。华为、阿里巴巴、寒武纪这些企业,都在快马加鞭地研发能替代H20的处理器。这场由禁令引发的连锁反应,反而成了国产芯片生态崛起的最佳催化剂。
美国的限制,短期看是挑战,长期看,却意外地按下了中国AI芯片自主创新的加速键。
由于半导体技术的出口管制,阿里这样的公司,芯片必须在国内生产。据报道,为阿里代工的很可能就是中芯国际(SMIC),它也是华为昇腾系列NPU的制造商。一个完整的国产化链条,正在慢慢形成。
除了阿里,牌桌上的玩家还有很多。华为、寒武纪、壁仞科技、燧原科技等等,都在摩拳擦掌,准备和Nvidia掰掰手腕。
当然,前路并非一片坦途。国产芯片面临的技术挑战是实实在在的。最头疼的就是制造工艺和高端存储器的限制。AI加速器是个“内存大户”,离不开HBM这种高速存储器。但因为贸易战,HBM2e和更新的版本都不能卖到中国,除非它已经焊死在处理器上。这意味着国产芯片要么用速度慢一些的GDDR或LPDDR,要么就指望手里现有的HBM3和HBM2e库存,或者用不受限制的老款HBM2,直到中国的存储器厂商能填上这个缺口。
竞争也日趋白热化。华为的昇腾910B已经量产,生态也更成熟;海光信息也在开发对标Nvidia的芯片。就在Nvidia准备重返中国市场的时候,很多中国的AI领军企业,比如DeepSeek,已经开始把自己的模型适配到新一代的国产芯片上运行了。
尽管挑战重重,但没人会怀疑这条路的前景。阿里巴巴CEO吴泳铭对《华尔街日报》说得非常直白:“AI和云是阿里巴巴业务的三大支柱之一,与电子商务并列。”为此,公司计划在未来三年,向这个领域投入530亿美元。
如此巨大的投资,加上政策的东风,为华为、寒武纪、阿里巴巴这些本土玩家创造了一个前所未有的市场环境。
这已经不仅仅是一场商业竞争了,它更是一个国家科技自主战略的缩影。在全球AI芯片格局重构的今天,中国公司正在努力从追赶者,向创新者转变。这场大戏,只会越来越精彩。
原文链接:点击前往 >
文章作者:算泥
版权申明:文章来源于算泥。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励