GPU 架構 | NVIDIA Ampere |
CUDA 平行處理核心 | 6912 |
Tensor 核心 | 432 |
GPU 記憶體 | 40 GB HBM2 |
雙精度峰值 (FP64) 效能 | 9.7 TFLOPS |
FP64 Tensor 核心效能 | 19.5 TFLOPS |
單精度峰值 (FP32) 效能 | 19.5 TFLOPS |
Tensor Float 32 (TF32) Tensor 核心效能 | 311.8 TFLOPS |
半精度峰值 (FP16) 效能 | 78.0 TFLOPS |
BFLOAT16 Tensor 核心效能 | 623.8 TFLOPS |
整數運算峰值 (INT8) 效能 | 1247.4 TOPS |
Tensor 運算峰值效能1 | 623.8 TFLOPS |
記憶體介面 | 5120-bit |
記憶體頻寬 | 1555.2 GB/s |
最大功耗 | 240W |
散熱方式 | 主動式風扇 |
多執行個體GPU (MIG) | 最高達 7 MIGs @5GB |
繪圖匯流排 | PCIe 4.0 x16 |
顯示連接器 | 不支援 |
尺寸 | 4.4” H x 10.5” L 雙插槽 |
產品重量 | 1181.9g |
支援 vGPU 軟體2 | NVIDIA vPC/vApps, NVIDIA RTX 虛擬工作站 (vWS) |
支援 vGPU 模式 | 4GB, 5 GB, 8GB, 10GB, 20GB, 40GB |
NVLink | 兩路低結構造型 (雙插槽與三插槽橋接器)可連接 2片 A800 40GB Active |
NVLink 互連技術 | 400 GB/s (雙向) |
伺服器選項 | NVIDIA Certified Systems™ (1-8 GPUs) 認證系統 |
NVIDIA AI Enterprise | 內含3 |
外部電源連接器 | 1x PCIe CEM5 16-pin |
NVDEC | 5x 解碼 |
1FP16 矩陣乘以 FP16 或 FP32 累加
2對 A800 40GB Active 的虛擬化支援將在即將發布的 NVIDIA 虛擬 GPU (vGPU) 版本中提供,預計將於 2023 年第三季發布。
3NVIDIA AI Enterprise 授權的 3 年軟體訂閱和企業支援。 軟體授權需啟用。