AI, Veri Bilimi ve Süper Hesaplama İçin Üretilen PCIe 4.0 Üzerinde NVIDIA Ampere A100 250W TDP GPU, 400W Modelinin Söz Verilen Yüzde 90 Performansıyla Başlatıldı
NVIDIA, yeni nesil Ampere mimarisine dayanan PCIe 4.0 uyumlu bir GPU olan A100'ü resmi olarak piyasaya sürdü. Daha düşük bir 250W TDP profiline sahip olmasına rağmen NVIDIA, PCIe 4.0 Ampere A100 GPU'nun tam 400W A100 HGX GPU'nun performansının yüzde 90'ına kadarını sunabileceğini vaat ediyor. Büyüyen Ampere A100 GPU ailesinin üçüncü çeşidi olan A100 PCIe, Yapay Zeka (AI), Veri Bilimi ve Süper Hesaplama kümelerini çalıştıran sunucular içindir.
NVIDIA, A100 GPU'nun bir PCI-Express 4.0 varyantını ortaya çıkardı. GPU, 7nm Amper mikromimarisine dayanmaktadır. Ek olarak şirket, Asus, Dell, Cisco, Lenovo ve daha fazlası dahil olmak üzere önde gelen sunucu üreticilerinin A100 ile güçlendirilmiş birkaç sistemini de duyurdu. 250W A100 PCIe 4.0 GPU hızlandırıcı, tam 400W TDP varyantına oldukça benzer ve NVIDIA, TDP profilindeki önemli düşüşe rağmen neredeyse aynı performansı vaat ediyor.
PCIe 4.0 Form Faktöründe NVIDIA A100 Amper GPU, Aynı 400W A100 HGX GPU Yapılandırmasına Sahip Ama 250W'da:
NVIDIA, PCIe 4.0 A100 PCIe GPU hızlandırıcısını duyurdu. Ampere GPU, tek bir A100 PCIe GPU'dan aynı anda iki kart kullanan sunuculara kadar, toplam 600 GB / s ara bağlantı bant genişliği sağlayan 12 NVLINK kanalı aracılığıyla çeşitli endüstriyel kullanım durumları için kullanılabilir. 250W TDP A100 PCIe GPU hızlandırıcı, 400W A100 HGX GPU ile karşılaştırıldığında çekirdek yapılandırma açısından çok fazla değişiklik göstermez.
https://twitter.com/storagereview/status/1275132949709688833
GA100 GPU, 108 SM biriminde düzenlenmiş 6912 CUDA çekirdeği, 432 Tensor Çekirdeği ve 1,55 TB / sn'lik aynı bellek bant genişliğini (1,6 TB / sn'ye yuvarlanmış) sağlayan 40 GB HBM2 belleğe sahip 400 W A100 HGX varyantının teknik özelliklerine sahiptir. s). Ancak, GPU paketini PCIe 4.0 standardı TDP'yi önemli ölçüde düşürme gibi kendi dezavantajı vardı. Bunun, iş yüküne bağlı olarak yüzde 10 ila 50 arasında bir performans cezası anlamına geldiği bildiriliyor. Dahası, A100 GPU'nun 250W TDP varyantı, sürekli yükler yerine kısa patlamalara daha uygundur.
PCIe 4.0 Form Faktörü Performansında NVIDIA A100 Amper GPU:
TDP profilindeki önemli azalma nedeniyle, kartın daha az TDP girdisini telafi etmek için daha düşük saat hızlarına sahip olacağı varsayılabilir. Bununla birlikte, NVIDIA'nın yayınladığı performans ölçümleri, 400W TDP varyantına oldukça yaklaştıkları için gerçekten şaşırtıcı. FP64 performansı hala 9.7 / 19.5 TFLOPs olarak derecelendirilmiştir, FP32 performansı 19.5 / 156/312 TFLOPs (Seyreklik) olarak derecelendirilmiştir, FP16 performansı 312/624 TFLOPs (Sparsity) ve INT8 624/1248 TOPs olarak derecelendirilmiştir ( Kıtlık).
Basit matematik gösteriyor ve NVIDIA, Ampere tabanlı PCIe 4.0 250W A100 GPU'nun en iyi sunucu uygulamalarında A100 HGX kartının (400W) performansının yüzde 90'ını sağlayabileceğini garanti ediyor. Bu haklı bir durumdur çünkü yeni varyantın yukarıda belirtilen görevleri tamamlaması daha az zaman alır. Ancak sayılar yalnızca kısa aralıklar için geçerli olmalıdır. Sürekli GPU özellikleri gerektiren karmaşık durumlarda, 250W PCIe 4.0 GPU, 400W A100 HGX GPU'nun performansını yüzde 90'a kadar ve yüzde 50'ye varan oranlarda sağlayabilir.
Ampere mikromimarisi kesinlikle yeni A100'e fayda sağlayacaktır. NVIDIA, Volta tabanlı selefine göre en az 20X performans artışı vaat ediyor. PCIe 4.0 A100 GPU, çoklu örnek GPU teknolojisine sahiptir. Bu, tek bir A100'ün farklı bilgi işlem görevlerini yerine getirmek için yedi ayrı GPU'ya bölünebileceği anlamına gelir. Bu, segmentasyonu artırırken, birkaç GPU'nun tek bir dev GPU'da birleştirilmesini sağlayan 3. nesil NVLink var.