AMD MI1000 Instinct Accelerator 7nm GPU, HPC için Resmi Olarak Piyasaya Sürüldü 11,5 Teraflop Zirve Çift Hassas Kayan Nokta Performansı Sunuyor
AMD’nin CDNA Mimarisine dayalı ilk GPU'su olan MI100 resmidir. MI100 Instinct Accelerator GPU, 11,5 teraflop zirve çift hassasiyetli kayan nokta performansıyla "dünyanın en hızlı HPC GPU'su" olarak iddia ediliyor. GPU, aynı 300 watt güç sınırında kalırken önceki nesle göre iki kat daha fazla bilgi işlem birimi paketlediğini iddia ediyor.
AMD bugün yeni MI100 Instinct hızlandırıcı. GPU, en yeni AMD Radeon RX 6000 Serisi Grafik Kartlarına güç veren RDNA Mimarisinden biraz farklı olan CDNA motoruna dayanmaktadır. MI100 Instinct Accelerator, iki yıl önce başlatılan MI50 ve MI60 Instinct hızlandırıcılarının yerini aldı. Nesiller arasındaki nispeten kısa süreye rağmen, yeni GPU Mimarisi ve Compute Engine, AMD GPU'nun beklentileri aşmasına izin veriyor.
HPC Endüstrisi için AMD MI1000 Instinct Accelerator 7nm GPU Spesifikasyonlar ve Özellikler:
MI100 GPU, AMD’nin Compute DNA (CDNA) mimarisini bünyesinde barındıran ilk firmadır. GPU, dört dizi halinde düzenlenmiş 210 Hesaplama Birimine sahiptir. CDNA Mimarisi, GCN mimarisine kıyasla önemli bir evrimsel sıçramadır ve farklı sayısal formatlar için hesaplama verimini artıran yeni matris çekirdek motorları içerir.
AMD, yeni AMD matris çekirdek teknolojisinin MI100'e MI50'ye kıyasla 7 kat daha fazla tepe yarı hassasiyetli kayan nokta performansı sağladığını iddia ediyor. Şirket, MI100 Instinct Accelerator'ın 46,1 teraflop tepe tek duyarlıklı matris (FP32), 23,1 teraflop tepe tek duyarlıklı (FP32), 184,6 teraflop tepe yarı kesinlik (FP16) kayan nokta performansı ve 92,3 tepe teraflop bfloat16 performansı sunduğunu iddia ediyor .
MI100 ayrıca AMD’nin Infinity Fabric Teknolojisini de alıyor Kart başına 340 GB / sn'ye kadar toplam bant genişliği ile PCIe 4.0 üzerinden yaklaşık 2 kat eşler arası en yüksek G / Ç bant genişliğini sunduğu iddia edilmektedir. Gerçek hayattaki dağıtımlarda MI100 GPU'lar, her biri 552 Gbps'ye kadar eşler arası I / O bant genişliği sağlayan iki adede kadar tümleşik dörtlü GPU kovanıyla yapılandırılabilir.
Benzer şekilde, dört adet 8 GB HBM2 bellek yığını, her bir MI100 GPU'da toplam 32 GB HBM2 bellek sağlar. 1.2 GHz Saat Hızına sahip bellek, 1.23 Tbps bellek bant genişliği sunar. MI100’ün PCIe Gen 4.0 teknolojisi desteği, CPU ve GPU arasında 64 Gbps en yüksek teorik aktarım veri bant genişliğine olanak tanır.
AMD MI100 Accelerator GPU, NVIDIA A100 GPU'dan Daha İyi mi?
Kesinlikle kağıt üzerinde, AMD’nin MI100 GPU’su 9.7 teraflop en yüksek teorik performans olarak derecelendirilen NVIDIA A100 GPU’dan daha iyi görünüyor. Ancak gerçekte NIVIDIA A100, daha yüksek performanslı FP64 Linpack çalıştırmaları sunar.
AMD’nin CDNA ve RDNA Mimarisi temelde aynıdır ve en büyük fark son kullanıcı senaryolarıdır. CDNA Mimarisinin oyun veya görsel içerik oluşturma için kullanılmasına izin vermeyen birkaç temel fark vardır.
Bu arada AMD, şirketin derleyiciler, programlama API'leri ve kitaplıklardan oluşan açık kaynaklı araç seti olan ROCm'yi hazırlıyor. Bu araç seti, yüksek ölçekli bilgi işlem iş yükleri için temel oluşturacaktır. En son ROCm 4.0, derleyiciyi hem OpenMP 5.0 hem de HIP'yi destekleyecek şekilde açık kaynak ve birleşik olacak şekilde yükseltti. Basitçe ifade etmek gerekirse, HPC segmentinde AMD ve NVIDIA arasındaki rekabet, basit yeteneklerin ve ham işlem gücünün ötesine geçiyor.