Pascal 架構帶來巨大的性能飛躍
NVIDIA Pascal 架構使 Tesla P100 能為 HPC 和超大規模工作負載提供卓越性能。憑借每秒超過 21 萬億次的 16 位浮點 (FP16) 運算性能,經過優化的 Pascal 為深度學習應用程序帶來了令人興奮的新可能。Pascal 還可為 HPC 工作負載提供超過 5 萬億次的雙精度浮點運算和 10 萬億次的單精度浮點運算能力。
通過采用 HBM2 的 CoWoS 技術實現更高效率
通過加入采用 HBM2 的晶圓基底芯片 (CoWoS) 技術,Tesla P100 將計算性能和數據緊密集成在同一個程序包內,提供的內存性能是 NVIDIA Maxwell? 架構的三倍以上。這大幅縮短了為數據密集型應用程序算出解決方案的時間。
NVIDIA NVLink 讓超大規模的應用成為現實
互連技術通常制約著性能。創新的 NVIDIA NVLink 高速雙向互連技術能跨越多個 GPU 擴展應用程序,其性能比當今的技術高 5 倍。
頁面遷移引擎使編程更簡單
頁面遷移引擎可使開發人員從管理數據移動的工作中騰出時間,將精力更多地放在計算性能的調整上。應用程序現在可以突破 GPU 物理顯存的容量限制,達到幾乎無限量的顯存。
適用于具備強擴展能力的 HPC 的 NVIDIA Tesla P100
利用搭載 NVIDIA NVLink 技術的 Tesla P100,快如閃電的節點可以顯著縮短為具備強擴展能力的應用程序提供解決方案的時間。采用 NVLink 技術的服務器節點可以 5 倍的 PCIe 帶寬互聯多達八個 Tesla P100。這種設計旨在幫助解決在 HPC 和深度學習領域擁有計算需求的全球重大挑戰。