Nvidia'nın Makine Öğrenimi ve Yapay Zeka için Tensör Çekirdekleri – Açıklandı

Nvidia'nın artık ünlü RTX serisi grafik kartları, RTX 20 serisi ile piyasaya sürüldüklerinden beri oldukça başarılı oldu. RTX markasının tanıtımı, şirketin ve bunun sonucunda bir bütün olarak grafik kartı pazarının yönünü değiştirdi. Nvidia, ilk RTX serisini 2020'de RTX 30 serisinin piyasaya sürülmesiyle başarılı bir şekilde takip etti, ancak lansman, dünya çapındaki stok ve bulunabilirlik sorunları nedeniyle biraz hayal kırıklığı yarattı. Yine de, RTX markası günümüzde grafik kartı pazarında baskın bir güç olmaya devam ediyor.

RTX'in piyasaya sürülmesiyle Nvidia, oyun ortamında ışığın davranış şeklini değiştiren oyunlarda gerçek zamanlı Işın İzleme desteği getirdi. Zaten iki oluşturma biçimini karşılaştırdık, Işın İzleme ve Rasterleştirilmiş İşlemeayrıntılı olarak ve hepsi bir arada Işın İzleme, oyunun geleceği söz konusu olduğunda gitmenin yolu gibi görünüyor. Nvidia ayrıca RTX kartlarına, oyunlarda Işın İzleme söz konusu olduğunda işleme iş yükünün büyük bir kısmını işleyen RTX kartlarında Işın İzlemeye adanmış özel çekirdekler de dahil etti. Yine de çoğu insanın bilmeyeceği şey, Nvidia'nın Tensor Çekirdekleri olarak bilinen Turing ve Ampere kartlarıyla başka bir çekirdek seti sunduğudur.

Tensör Çekirdekleri

Tensor Çekirdekleri, makine öğrenimi ve yapay zeka gibi görevlerde yer alan karmaşık hesaplamalara adanmış fiziksel çekirdeklerdir. Tensor Çekirdekleri, hassasiyeti korurken verimi hızlandırmak için hesaplamaları dinamik olarak uyarlayarak karışık hassasiyette hesaplama sağlar. Bu çekirdekler, bu hesaplamaları daha verimli hale getirmek ve ayrıca kartın ana CUDA çekirdeklerini ekstra yükten kurtarmak için bu karmaşık iş yüklerine yardımcı olmak için özel olarak tasarlanmıştır.

Turing veya Ampere mimarisine dayalı oyun odaklı GeForce serisi kartlar gibi tüketici kartlarında, Tensör Çekirdeklerinin özel olarak bir işleme işi yoktur. Bu çekirdekler, çerçeveleri oluşturmaz veya normal CUDA çekirdekleri veya RT Çekirdeklerinin yapabileceği gibi genel performans sayılarına yardımcı olur. Bu kartlarda Tensor Çekirdeklerinin varlığı bir amaca hizmet ediyor. Bu çekirdekler, Nvidia'nın mükemmel Derin Öğrenme Süper Örnekleme veya DLSS özelliğinin arkasındaki işlem gücünün büyük kısmını idare eder. Bir dakika içinde DLSS'yi keşfedeceğiz, ancak önce hangi kartların gerçekten Tensör Çekirdeğine sahip olduğunu belirlememiz gerekiyor.

Yazma anı itibariyle, içinde Tensor Çekirdekleri bulunan sadece bir avuç kart var. Nvidia ilk önce Tensor Çekirdeklerini Volta mimarisine dayalı bir iş istasyonu kartı olan Nvidia TITAN V'ye entegre etti. Bu mimari asla tüketici düzeyinde grafik kartlarına ölçeklenmedi ve bu nedenle Volta mimarisi bir GeForce GPU'da hiç görülmedi. Bundan sonra Nvidia, bir grup Quadro GPU'da Tensor çekirdeklerini ve daha da önemlisi oyuncular için Turing ve Ampere mimarisine dayalı RTX kartlarını tanıttı. Bu, RTX 2060'tan RTX 3090'a kadar tüm RTX markalı grafik kartlarının Tensör Çekirdeklerine sahip olduğu ve Nvidia'nın DLSS özelliğinden yararlanabileceği anlamına gelir.

Tensör Çekirdekleri Nasıl Çalışır?

Bir Tensor Core'un çalışmasının arkasındaki asıl süreç oldukça karmaşık olsa da, üç noktada özetlenebilir.

Tensör Çekirdekleri, çarpma ve toplama işlemlerini hesaplamak için gereken kullanılan döngüleri 16 kat azaltır - benim örneğimde 32 × 32 matris için 128 döngüden 8 döngüye.
Tensor Çekirdekleri, tekrarlayan paylaşılan bellek erişimine olan bağımlılığı azaltır, böylece bellek erişimi için ek döngülerden tasarruf sağlar.
Tensör Çekirdekleri o kadar hızlıdır ki hesaplama artık bir darboğaz değildir. Tek darboğaz, verileri Tensor Çekirdeklerine almaktır.

Basit bir deyişle, Tensor Çekirdekleri, CUDA çekirdekleri gibi diğer özel olmayan çekirdekler için makul olmayan bir süre alacak son derece karmaşık hesaplamalar yapmak için kullanılır. Özgün yapıları nedeniyle Tensor Çekirdekleri bu tür işleri gerçekleştirmede açıkça mükemmeldir. Aslında, Volta ilk ortaya çıktığında, Anandtech 3 Nvidia kartı kullanarak bazı matematik testleri gerçekleştirdi. Yeni Volta kartı, bir üst düzey Pascal grafik kartı ve daha eski bir Maxwell TITAN kartı, hepsi karışıma atıldı ve sonuçlar bunlardı.

Bu çizelgede, kesinlik terimi, çift olan 64, tek olan 32 vb. olan matrislerdeki kayan nokta sayıları için kullanılan bit sayısını ifade eder. Bu sonuç, Tensor Çekirdeklerinin, bunun gibi özelleşmiş tensör hesaplamaları söz konusu olduğunda standart CUDA çekirdeklerinin çok ilerisinde olduğunu açıkça göstermektedir.

Başvurular

Peki bu Tensor Çekirdeklerinin uygulamaları tam olarak nedir? Tensor Çekirdekleri, Yapay Zeka Eğitimi gibi karmaşık süreçleri 10 kata kadar hızlandırabildiğinden, Yapay Zeka ve Derin Öğrenmede Tensor Çekirdeklerinin yararlı olabileceği birkaç alan vardır. İşte Tensör Çekirdeklerinin kullanılabileceği bazı ortak alanlar.

Derin Öğrenme

Tensör Çekirdeklerinin ve bunlara sahip kartların özellikle faydalı olabileceği bir alan, Derin Öğrenme alanıdır. Bu aslında yapay sinir ağları adı verilen beynin yapısından ve işlevinden esinlenen algoritmalarla ilgilenen makine öğreniminin bir alt alanıdır. Derin Öğrenme, bir dizi ilginç konu alanını kapsayan geniş bir alandır. Derin öğrenmenin özü, artık yeterince hızlı bilgisayarlara ve büyük sinir ağlarını gerçekten eğitmek için yeterli veriye sahip olmamızdır.

Tensor Çekirdeklerinin devreye girdiği yer burasıdır. Normal grafik kartları küçük ölçekli bir işlem için veya bireysel düzeyde yeterli olabilirken, bu işlem daha büyük ölçekte uygulandığında çok sayıda özel hesaplama beygir gücü gerektirir. Nvidia gibi bir kuruluş, bir alan olarak Derin Öğrenme üzerinde çalışmak istiyorsa, Tensor Cores'un belirli hesaplama güçlerine sahip grafik kartları bir zorunluluk haline gelir. Tensor Çekirdekleri, bu iş yüklerini şu anda mevcut olan diğer tüm bilgi işlem çekirdeği türlerinden çok daha verimli ve hızlı bir şekilde ele alır. Bu özgüllük, bu çekirdekleri ve bunları içeren kartları Derin Öğrenme endüstrisi için değerli bir varlık haline getirir.

Yapay zeka

Hepimiz filmleri gördük. Yapay Zeka, bilgi işlem ve robotik alanında bir sonraki büyük şey olacak. Yapay Zeka veya AI, insanlar gibi düşünmek ve benzer eylemler gerçekleştirmek için programlanmış makinelerde insan zekasının simülasyonunu ifade eder. Öğrenme ve problem çözme gibi özellikler de yapay zeka kategorisine giriyor.

Yapay zekanın filmlerde gördüğümüz gibi sadece makinelerdeki zeka ile sınırlı olmadığı unutulmamalıdır. Bu tür bir zeka aslında günümüzde birçok uygulamada çok yaygındır. Cep telefonlarımızdaki sanal asistanlarımız da bir tür yapay zeka kullanıyor. Oyun dünyasında, bilgisayar tarafından üretilen ve kontrol edilen tüm düşmanlar ve NPC'ler de belirli bir düzeyde yapay zeka sergiliyor. Simüle edilmiş bir ortamda insan benzeri eğilimleri veya davranışsal nüansları olan her şey, yapay zekadan yararlanıyor.

Yapay zeka alanı da büyük ölçüde hesaplama özgüllüğü gerektirir ve bu, Tensor Cores tarafından desteklenen grafik kartlarının kesinlikle kullanışlı olduğu başka bir alandır. Nvidia, yapay zeka ve Derin Öğrenme söz konusu olduğunda dünyanın liderlerinden biridir ve Tensor Çekirdekleri gibi ürünleri ve Nvidia’nın ünlü Derin Öğrenme Süper Örneklemesi gibi özellikler, konumlarının bir kanıtıdır.

Derin Öğrenme Süper Örnekleme

DLSS, şu anda sektörde bulunan en iyi Tensör Çekirdek uygulamalarından biridir. DLSS veya Derin Öğrenme Süper Örnekleme Nvidia’nın daha düşük çözünürlükte oluşturulan bir görüntüyü daha yüksek çözünürlüklü ekrana yükseltebilen ve böylece yerel oluşturmadan daha fazla performans sağlayan akıllı yükseltme tekniğidir. Nvidia, bu tekniği RTX serisi grafik kartlarının ilk nesli ile tanıttı. DLSS, yalnızca sıradan yükseltme veya süper örnekleme için bir teknik değildir, bunun yerine görüntü kalitesini korumak için daha düşük bir çözünürlükte oluşturulan görüntünün kalitesini akıllıca artırmak için AI kullanır. Bu, teorik olarak, her iki dünyanın da en iyisini sağlayabilir, çünkü gösterilen görüntü hala yüksek kalitede olurken, performans da yerel görüntülemeye göre iyileştirilecektir.

DLSS, maksimum kaliteyi bozulmadan korurken görüntünün daha düşük bir çözünürlükte nasıl işleneceğini akıllıca hesaplamak için yapay zekanın gücünden yararlanır. Karmaşık hesaplamalar gerçekleştirmek için yeni RTX kartlarının gücünü kullanır ve ardından bu verileri, yerel görüntülemeye olabildiğince yakın görünmesi için son görüntüyü ayarlamak için kullanır. DLSS'nin ayırt edici özelliği, kalitenin son derece etkileyici korunmasıdır. Oyun menülerini kullanarak geleneksel yükseltmeyi kullanarak, oyuncular daha düşük bir çözünürlükte oluşturulduktan sonra oyunun keskinliğinde ve netliğinde bir eksiklik olduğunu kesinlikle fark edebilirler. DLSS kullanırken bu bir sorun değildir. Görüntüyü daha düşük bir çözünürlükte oluştursa da (genellikle orijinal çözünürlüğün% 66'sı kadar), ortaya çıkan büyütülmüş görüntü, geleneksel büyütmeden elde edeceğinizden çok daha iyidir. O kadar etkileyicidir ki, çoğu oyuncu daha yüksek çözünürlükte yerel olarak oluşturulan bir görüntü ile DLSS tarafından yükseltilen bir görüntü arasındaki farkı anlayamaz.

DLSS'nin en önemli avantajı ve muhtemelen geliştirilmesinin arkasındaki tüm teşvik, DLSS açıkken performanstaki önemli artıştır. Bu performans, DLSS'nin oyunu daha düşük bir çözünürlükte oluşturması ve ardından monitörün çıktı çözünürlüğünü eşleştirmek için AI kullanarak ölçeklendirmesi gerçeğinden kaynaklanmaktadır. DLSS, RTX serisi grafik kartlarının derin öğrenme özelliklerini kullanarak, yerel olarak oluşturulan görüntüyle eşleşen bir kalitede görüntü çıkışı sağlayabilir.

Nvidia, DLSS 2.0 teknolojisinin arkasındaki mekaniği resmi web sitesinde açıkladı. Nvidia'nın, yapay zeka hesaplamalarını öğrenmek ve daha iyi hale getirmek için NGX destekli bir süper bilgisayarın yeteneğini kullanan Neural Graphics Framework veya NGX adlı bir sistem kullandığını biliyoruz. DLSS 2.0, AI ağına iki birincil girişe sahiptir:

Oyun motoru tarafından oluşturulan düşük çözünürlüklü, diğer adlar
Düşük çözünürlük, aynı görüntülerden hareket vektörleri - ayrıca oyun motoru tarafından oluşturulmuştur

Nvidia daha sonra çerçevenin neye benzeyeceğini "tahmin etmek" için geçici geri bildirim olarak bilinen bir süreci kullanır. Ardından, özel bir AI otomatik kodlayıcı türü, daha yüksek kaliteli bir akım karesinin nasıl oluşturulacağını piksel bazında belirlemek için düşük çözünürlüklü mevcut kareyi ve yüksek çözünürlüklü önceki kareyi alır. Nvidia aynı zamanda süper bilgisayarın süreci daha iyi anlaması için adımlar atıyor:

Gelecek Uygulamalar

Derin öğrenme, yapay zeka ve özellikle Nvidia'nın şu anda sunduğu DLSS özelliği gibi uygulamalardan da görebileceğimiz gibi, bu ekran kartlarının Tensor Çekirdekleri pek çok ilginç ve önemli görevler gerçekleştiriyor. Bu alanlar için geleceğin neler getireceğini tahmin etmek zordur, ancak kesinlikle mevcut verilere ve endüstri eğilimlerine dayalı olarak eğitimli bir tahmin yapılabilir.

Şu anda, yapay zeka ve makine öğrenimi gibi alanlardaki küresel baskı tüm zamanların en yüksek seviyesinde. Yakın gelecekte Nvidia'nın Tensor Çekirdeklerini içeren grafik kartları serisini genişleteceğini ve bu kartların bu uygulamalar için kullanışlı olacağını varsaymak güvenlidir. Ayrıca, DLSS, Tensör Çekirdeklerini kullanan derin öğrenme teknolojilerinin bir başka harika uygulamasıdır ve muhtemelen yakın gelecekte büyük gelişmeler görecektir. Son yıllarda PC Oyun endüstrisini vurmak için en ilginç ve en üretken özelliklerden biridir, bu yüzden burada kalacağını varsaymak gerekir.

Tensor Çekirdeklerinin gücü ile makine öğrenimi ve yapay zeka alanlarında hızla ilerlemeler kaydediliyor. Bu süreç büyük olasılıkla devam edecek ve Nvidia gibi şirketlerin sorumluluğu üstlenmesi ve oynadığımız oyunlarda bu alanların bilgisini uygulamaya gelince PC Oyun endüstrisine liderlik etmesiyle daha da güçlenecek.