英伟达搭建顶级计算平台 首次将AI与HPC高性能计算融合

导读NVIDIA的下一代GeForce游戏卡一直不愿露面。一方面,缺乏足够的竞争刺激;另一方面,NVIDIA的业务重心早已转移,不再专注于游戏卡,而是更

NVIDIA的下一代GeForce游戏卡一直不愿露面。一方面,缺乏足够的竞争刺激;另一方面,NVIDIA的业务重心早已转移,不再专注于游戏卡,而是更加关注计算平台。毕竟有更大的发展空间和更高的利润。

英伟达今天宣布推出新一代计算平台“HGX-2”,该平台拥有多达16张顶级计算卡特斯拉V100,也是首次将AI人工智能和HPC高性能计算集成到统一架构中。

特斯拉V100基于新一代GPU架构“Volta”,采用TSMC 12纳米FFN(16纳米增强版)工艺制造。它拥有5120个CUDA内核和640个Tensor深度学习内核,面积达815mm2,集成了210亿个晶体管。

浮点性能高达半精度30次,单精度15次,双精度7.5次,张量性能120次。同时搭配16GB HBM2高带宽内存,4096位宽,频率1.75GHz,带宽900GB/s.

英伟达此前的计算平台HGX-1集成了8个特斯拉V100,共有40,960个CUDA内核、5,120个Tensor内核和256GB视频内存,通过300GB/s双线带宽的NVLink总线连接。浮点性能为单精度125次浮点和双精度62次浮点,张量性能为1次浮点。

另一方面,全新的HGX-2采用了16特斯拉V100,轻松实现规模和性能翻倍,共有81,920个CUDA内核、10,240个Tensor内核、512GB视频内存、250次单精度浮点性能和125次双精度浮点性能,以及2次Tensor性能。

NVIDIA还在系统中部署了12个NVSwitches,用于GPU之间的直接互联,NVLink总线的双向带宽高达2.4 TB/s。

除了高性能之外,HGX-2平台最大的优势就是支持各种精度计算,能够满足不同的需求。例如,在科学计算和模拟中,FP64和FP32可以用于高精度计算,而在AI训练和推理中,可以使用FP16浮点和Int8整数精度计算。

联想、超微、QCT和维文都将在今年晚些时候发布他们的HGX-2系统。

富士康、英业达、广达和威斯顿正在设计基于HGX-2的系统,该系统将于今年晚些时候推出,可用于云计算数据中心。

原标题:16个特斯拉V100计算卡组件!英伟达打造顶级计算平台。

编辑:李晓玲。

本文就为大家讲解到这里。

免责声明:本文由用户上传,如有侵权请联系删除!