基于安培架构的A100系列计算卡在过去三年被众多高性能计算集群(HPC)采用,NVIDIA去年推出了基于Hopper的新一代H100系列计算卡,以进一步提高计算能力。这些GPU被大量用于人工智能和深度学习任务。出于众所周知的原因,NVIDIA专门针对中国市场推出了A800系列和H800系列计算卡,以规避去年实施的相关出口限制。与原来的A100/H100系列相比,A800/H800系列的规格基本相同,最大的区别在于NVLink互联总线的连接速度。
随着最近新一轮更严格的管控措施,A800/H800系列计算卡无法逃脱限制,甚至消费者端的GeForceRTX也是如此。
4090游戏卡也受到影响。根据《科创板日报》的报道,从产业链人员处获悉,英伟达正在重新运用旧技能,正在为中国开发包括HGXH20和L20在内的最新改进版芯片。
PCle和L2PCle三个产品。
HGXH20、L20PCLE和L2
PCLE是基于H100计算卡的改造,NVIDIA将在本月16日发布相关信息后最快,国内厂商将在未来几天内最快拿到相应的产品。目前,《科创板日报》已经与英伟达核实了该消息的真实性,但截至发稿,英伟达暂时没有回应。
H100搭载了GH100芯片,其完整的芯片配置为8组GPC、72组TPC、144组SM,共18432个FP32
CudaCore。它使用的是第四代张量。
核心,总共576个,带有60MB的二级高速缓存。是的,但在实际产品中并不是所有的都是开放的。其中,SXM5版本开启SM132组,共计16896组Fp32。
CUDA酷睿、528个张量核和50MB二级高速缓存,而PCIe5.0版本支持114个SM、FP32
Cuda只有14592个内核。此外,前者的TDP为700W,而后者的TDP为350W。
此外,H100还支持NVIDIA的第四代NVLink接口,提供高达900GB/S的带宽。H100是第一款支持PCIe的机型。
5.0标准GPU也是第一款使用HBM3的GPU,最高支持6个HBM3,带宽为3TB/S,是A100中使用的HBM2E的1.5倍,默认内存容量为80GB。