NVIDIA H100
NVIDIA® H100
SKU: NVH100TCGPU-KIT
SKU: NVH100TCGPU-KIT
NVIDIA® H100 Tensor Core GPU, her veri merkezi için benzeri görülmemiş performans, ölçeklenebilirlik ve güvenlik ile büyük ölçekli yapay zeka ve HPC için büyük bir sıçrama sağlar ve yapay zeka geliştirme ve dağıtımını kolaylaştırmak için NVIDIA AI Enterprise yazılım paketini içerir. H100, trilyon parametreli dil modelleri için özel bir Transformer Engine ile exascale ölçekli iş yüklerini hızlandırır. Küçük işler için H100, doğru boyutta Çok Örnekli GPU (MIG) bölümlerine ayrılabilir. Hopper Confidential Computing ile bu ölçeklenebilir işlem gücü, paylaşılan veri merkezi altyapısında hassas uygulamaların güvenliğini sağlayabilir. NVIDIA AI Enterprise’ın H100 PCIe satın alımlarına dahil edilmesi, geliştirme süresini kısaltır ve AI iş yüklerinin dağıtımını basitleştirir ve H100’ü en güçlü uçtan uca AI ve HPC veri merkezi platformu haline getirir.
NVIDIA Hopper mimarisi, her veri merkezine benzeri görülmemiş performans, ölçeklenebilirlik ve güvenlik sunar. Hopper, Transformer Engine gibi yeni işlem çekirdeği özelliklerinden daha hızlı ağa kadar önceki nesillerin üzerine inşa edilerek veri merkezini önceki nesle göre büyüklük sırasına göre hızlandırır. NVIDIA NVLink, iki H100 kartı arasında ultra yüksek bant genişliğini ve son derece düşük gecikme süresini destekler ve bellek havuzlama ve performans ölçeklendirmeyi destekler (uygulama desteği gereklidir). İkinci nesil MIG, 7 kat daha güvenli kiracılar için QoS’yi (hizmet kalitesi) en üst düzeye çıkarmak amacıyla GPU’yu izole edilmiş doğru boyutlu örneklere güvenli bir şekilde böler. Hızlandırılmış yapay zeka iş akışlarının geliştirilmesini ve dağıtımını optimize eden bir yazılım paketi olan NVIDIA AI Enterprise’ın (H100 PCIe’ye özel) dahil edilmesi, bu yeni H100 mimari yenilikleri sayesinde performansı en üst düzeye çıkarır. Bu teknoloji atılımları, dünyanın şimdiye kadar üretilmiş en gelişmiş GPU’su olan H100 Tensor Core GPU’yu beslemektedir.
FP64 |
26 TFLOPS |
---|---|
FP64 Tensor Core |
51 TFLOPS |
FP32 |
51 TFLOPS |
TF32 Tensor Core |
51 TFLOPS | Sparsity |
BFLOAT16 Tensor Core |
1513 TFLOPS | Sparsity |
FP16 Tensor Core |
1513 TFLOPS | Sparsity |
FP8 Tensor Core |
3026 TFLOPS | Sparsity |
INT8 Tensor Core |
3026 TOPS | Sparsity |
GPU Memory |
80GB HBM2e |
GPU Memory Bandwidth |
2.0 TB/sec |
Maximum Power Consumption |
350 W |
1. L4’ün FP8’i T4’ün FP16’sına kıyasla.
2. 720p30’da 8x L4 AV1 düşük gecikmeli P1 ön ayar kodlaması.
3. 8x L4 vs 2S Intel 8362 CPU sunucu performans karşılaştırması: CV-CUDA ön ve son işleme, kod çözme, çıkarım (SegFormer), kodlama, TRT 8.6 ile uçtan uca video işlem hattı vs OpenCV kullanan sadece CPU işlem hattı.