人工智能訓練
V100 擁有 640 個 Tensor 內核,是世界上第一個突破 100 萬億次 (TFLOPS) 深度學習性能障礙的 GPU。新一代 NVIDIA NVLink? 以高達 300 GB/s 的速度連接多個 V100 GPU,在全球打造出功能極其強大的計算服務器。現在,在之前的系統中需要消耗數周計算資源的人工智能模型在幾天內就可以完成訓練。隨著訓練時間的大幅縮短,人工智能現在可以解決各類新型問題。
人工智能推理
V100 就是為了在現有的超大規模服務器機架上提供更高的性能。由于將人工智能作為核心, V100 GPU 可提供比 CPU 服務器高 30 倍的推理性能。這種吞吐量和效率的大幅提升將使人工智能服務的擴展變成現實。
高性能計算
V100 的設計能夠融合人工智能和高性能計算。它為高性能計算系統提供了一個平臺,在用于科學模擬的計算機科學和用于在數據中發現見解的數據科學方面表現優異。通過在一個統一架構內搭配使用 NVIDIA CUDA? 內核和 Tensor 內核,配備 V100 GPU 的單臺服務器可以取代數百臺僅配備通用 CPU 的服務器來處理傳統的高性能計算和人工智能工作負載。現在,每位研究人員和工程師都可以負擔得起使用人工智能超級計算機處理具挑戰性工作的做法。