{{!completeInfo?'请完善个人信息':''}}
英伟达又赢麻了。
11月13日晚,英伟达在国际超算大会上推出新一代GPU,NVIDIA HGX H200。
对这块GPU,黄仁勋给的学术名称是“新一代AI计算平台”,专为大模型与生成式AI而设计,翻译一下:
只看算力H200和H100基本相同,但为了加速AI推理速度,我们优化了显存和带宽。
又一块史上最强芯片
先看具体的参数升级,官方新闻稿是说相比H100而言性能提升了60%-90%,具体来看则是四个方面:
1、跑70B Llama2,推理速度比H100快90%;
2、跑175B GPT-3,推理速度比H100快60%;
3、显存容量达到141GB,是H100的近1.8倍;
4、带宽达到4.8TB,是H100的1.4倍。
换句话说,虽然算力没有提升,但更高速的推理就意味着大量时间和金钱成本的节约,虽然还没有公布定价,新卡的“单美元效率”有了显著的提升。
虽然当下H200的具体架构还没有曝光,根据已有信息我们推测,最重要的三个部分中,逻辑芯片应该还是台积电的4N工艺,CoWoS封装也没有变化,但HBM存储芯片却由原先的HBM3升级到了HBM3e。
H200称不上传奇
深厚刀工下的产物:H20
原文链接:点击前往 >
文章作者:张泽一
版权申明:文章来源于新硅NewGeek。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励