英伟达搭建顶级计算平台首次将AI与HPC高性能计算融合

2021-09-25 16:35:11闻山倩

导读NVIDIA的下一代GeForce游戏卡一直不愿露面。一方面，缺乏足够的竞争刺激；另一方面，NVIDIA的业务重心早已转移，不再专注于游戏卡，而是更

NVIDIA的下一代GeForce游戏卡一直不愿露面。一方面，缺乏足够的竞争刺激；另一方面，NVIDIA的业务重心早已转移，不再专注于游戏卡，而是更加关注计算平台。毕竟有更大的发展空间和更高的利润。

英伟达今天宣布推出新一代计算平台“HGX-2”，该平台拥有多达16张顶级计算卡特斯拉V100，也是首次将AI人工智能和HPC高性能计算集成到统一架构中。

特斯拉V100基于新一代GPU架构“Volta”，采用TSMC 12纳米FFN(16纳米增强版)工艺制造。它拥有5120个CUDA内核和640个Tensor深度学习内核，面积达815mm2，集成了210亿个晶体管。

浮点性能高达半精度30次，单精度15次，双精度7.5次，张量性能120次。同时搭配16GB HBM2高带宽内存，4096位宽，频率1.75GHz，带宽900GB/s.

英伟达此前的计算平台HGX-1集成了8个特斯拉V100，共有40，960个CUDA内核、5，120个Tensor内核和256GB视频内存，通过300GB/s双线带宽的NVLink总线连接。浮点性能为单精度125次浮点和双精度62次浮点，张量性能为1次浮点。

另一方面，全新的HGX-2采用了16特斯拉V100，轻松实现规模和性能翻倍，共有81，920个CUDA内核、10，240个Tensor内核、512GB视频内存、250次单精度浮点性能和125次双精度浮点性能，以及2次Tensor性能。

NVIDIA还在系统中部署了12个NVSwitches，用于GPU之间的直接互联，NVLink总线的双向带宽高达2.4 TB/s。

除了高性能之外，HGX-2平台最大的优势就是支持各种精度计算，能够满足不同的需求。例如，在科学计算和模拟中，FP64和FP32可以用于高精度计算，而在AI训练和推理中，可以使用FP16浮点和Int8整数精度计算。

联想、超微、QCT和维文都将在今年晚些时候发布他们的HGX-2系统。

富士康、英业达、广达和威斯顿正在设计基于HGX-2的系统，该系统将于今年晚些时候推出，可用于云计算数据中心。

原标题：16个特斯拉V100计算卡组件！英伟达打造顶级计算平台。

编辑：李晓玲。

本文就为大家讲解到这里。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

上一篇:微信官方周边店铺上线前只对腾讯内部员工开放

下一篇:iphone xs max目前价格走势高达2000元

返回顶部"