teknolojiuzmani
FD Üye

Yeni RDNA 3 mimarili Radeon RX 7900 XT ve Ada Lovelace destekli GeForce RTX 4090 ekran kartlarıyla ilgili yeni detaylar gelmeye devam ediyor. Bu GPU’ların büyük performans iyileştirmeleri getirmesi bekleniyor ve aynı zamanda şimdiye kadar üretilmiş en çok güç tüketen çipler olacak.
NVIDIA Ada Lovelace mimarisiyle monolitik bir yaklaşımı hedeflerken, AMD’nin CDNA 2 mimarisinde olduğu gibi çok yongalı bir tasarım (MCM) kullanması bekleniyor. AMD, artık tüketici ve oyun GPU’ları için aynı MCM teknolojisini kullanacak.
AMD Radeon RX 7900 XT: RDNA 3 Mimarisi ve Navi 21
Amiral gemisi RDNA 3 yongası olan AMD Navi 31 GPU, yeni nesil Radeon RX 7900 XT grafik kartına güç sağlayacak. AMD’nin yeni nesil RDNA 3 yongalarında CU (Bilgi İşlem Birimi) yerine WGP’ler (Çalışma Grubu İşlemcileri) kullanılacak. Ekran kartının TSMC’nin 5nm işlemine dayalı bir GCD (Graphics Core Die) ve TSMC 6nm işlemine dayalı bir MCD (Multi-Cache Die) olmak üzere iki temel IP’ye sahip olacağı söyleniyor.
Görünen Navi 31 GPU yapılandırmasında iki GCD (Graphics Core Die) ve tek bir MCD (Multi-Cache Die) bulunuyor. Her GCD’de 3 Shader Motoru (toplam 6) ve her Shader Motorunda 2 Shader Dizisi (SE başına 2 / GCD başına 6 / toplamda 12) yer alıyor.
Ayrıca Her Shader Dizisi 5 WGP’den (SE başına 10 / GCD başına 30 / toplamda 60) oluşuyor ve her WGP, 32 ALU’ya sahip 8 SIMD32 ünitesine (SA başına 40 SIMD32 / SE başına 80 / GCD başına 240 / toplamda 480) sahip. Bu SIMD32 birimleri, GCD başına 7.680 çekirdek ve toplamda 15.360 çekirdek oluşturmak üzere bir araya geliyor.
Navi 31 MCD, yeni nesil Infinity Fabric ara bağlantısı aracılığıyla ikili GCD’lere bağlanacak ve 256-512 MB kapasitede Infinity Cache önbellek taşıyacak. Her GPU ayrıca 4 bellek bağlantısına (32 bit) sahip olmalı. Bu da 256 bit veri yolu arabirimi için toplam 8 32 bit bellek kontrolcüsü olacağı anlamına gelmekte.
Yakın zamanda ortaya çıkan bir başka söylenti, AMD’nin RDNA 3 ailesinde 3D Infinity Cache bellek teknolojisini kullanacağını ortaya koydu. Tıpkı Milan-X yongalarının L3 önbelleğinde olduğu gibi, GPU’da bulunan mevcut önbelleğe ek olarak dikey olarak istiflenmiş ek bir önbellek birimi yer alacak.
AMD RDNA GPU Karşılaştırması
GPU Üretim Teknolojisi | 7nm | 7nm | 5nm (6nm?) |
GPU Paketlemesi | Monolitik | Monolitik | MCD (Multi-Chiplet Die) |
Shader Motorları | 2 | 4 | 6 |
GPU WGP | 20 | 40 | 30 (Per MCD) 60 (In Total) |
240 (toplam)[/td] [/tr] [tr] [td]Çekirdek (Kalıp Başına)[/td] [td]2560[/td] [td]5120[/td] [td]7680[/td] [/tr] [tr] [td]Çekirdek (Toplam)[/td] [td]2560[/td] [td]5120[/td] [td]15360 (2 x MCD)[/td] [/tr] [tr] [td]Bellek Veriyolu[/td] [td]256-bit[/td] [td]256-bit[/td] [td]256-bit[/td] [/tr] [tr] [td]Bellek Tipi[/td] [td]GDDR6[/td] [td]GDDR6[/td] [td]GDDR6[/td] [/tr] [tr] [td]Bellek Kapasitesi[/td] [td]8 GB[/td] [td]16 GB[/td] [td]32 GB[/td] [/tr] [tr] [td]Infinity Cache[/td] [td]–[/td] [td]128 MB[/td] [td]256-512 MB[/td] [/tr] [tr] [td]Amiral Gemisi SKU[/td] [td]Radeon RX 5700 XT[/td] [td]Radeon RX 6900 XTX[/td] [td]Radeon RX 7900 XT[/td] [/tr] [tr] [td]TBP[/td] [td]225W[/td] [td]330W[/td] [td]350-550W[/td] [/tr] [tr] [td]Çıkış Tarihi[/td] [td]2019 3. Çeyrek[/td] [td]2020 4. Çeyrek[/td] [td]2022 4. Çeyrek[/td] [/tr]
NVIDIA GeForce RTX 4090: Ada Lovelace Mimarisi ve AD102 GPU
Mevcut bilgilere göre NVIDIA’nın Ada Lovelace GPU’ları için TSMC’nin N5 (5nm) üretim teknolojisi kullanılacak. AMD’nin aksine, yeşil takım yeni ekran kartlarında monolitik bir tasarım benimseyecek. Amiral gemisi RTX 4090 modelinde AD102 GPU’nun yer alacağını ekleyelim.
AD102 GPU’nun 2.5 GHz (2.3 GHz ortalama artış) kadar yüksek bir saat hızına sahip olduğu söyleniyor. NVIDIA AD102, 144 SM birimi içinde yer alan (değişebilen) ön özelliklere göre 18432 CUDA Çekirdeğine sahip görünüyor. Bu da Turing mimarisine kıyasla çekirdek sayısında neredeyse iki katlık bir artış demek. 2.3-2.5 GHz saat hızı bize 85 ila 92 TFLOP’a kadar işlem performansı (FP32) veriyor. Bu 36 TFLOP FP32 hesaplama gücü içeren mevcut RTX 3090’ın FP32 performansının iki katından fazla.
%150 performans artışı çok büyük görünüyor ancak NVIDIA’nın Ampere ile bu nesil FP32 değerlerinde zaten büyük bir sıçrama yaptığını unutmamak gerekiyor. Ampere GA102 GPU (RTX 3090) 36 TFLOP sunarken Turing TU102 GPU (RTX 2080 Ti) 13 TFLOP ham güç sunacak. Yani FP değerleri açısından %150’nin üzerinde bir artış yaşandı. Ancak RTX 3090, gerçek dünya oyun performansı açısından RTX 2080 Ti’iye göre %50-60 civarında daha güçlüydü.
Bunun yanı sıra NVIDIA GeForce RTX 40 amiral gemisinin RTX 3090’a benzer bir 384-bit veri yolu arayüzüne sahip olacağı da gelen bilgiler arasında. Yenik artlar yine GDDR6X belleklerden yararlanacak, ancak mevcut modellere kıyasla daha yüksek bant genişliği göreceğiz. RTX 4090 24 GB belleğe sahip olacak, bu nedenle tek taraflı 16 GB DRAM veya çift taraflı 8 GB DRAM modülleri bekleyebiliriz.
NVIDIA GPU Kıyaslaması
GPU Mimarisi | Turing | Ampere | Ada Lovelace |
GPU Üretim Teknolojisi | TSMC 12nm NFF | Samsung 8nm | 5nm |
Grafik İşleme Kümeleri (GPC) | 6 | 7 | 12 |
Doku İşleme Kümeleri (TPC) | 36 | 42 | 72 |
Akış İşlemcileri (SM) | 72 | 84 | 144 |
CUDA Çekirdeği | 4608 | 10752 | 18432 |
Teorik TFLOP | 16.1 | 37.6 | ~90 TFLOPs? |
Bellek Tipi | GDDR6 | GDDR6X | GDDR6X |
Bellek Veriyolu | 384-bit | 384-bit | 384-bit |
Bellek Kapasitesi | 11 GB (2080 Ti) | 24 GB (3090) | 24 GB (4090?) |
Amiral Gemisi SKU | RTX 2080 Ti | RTX 3090 | RTX 4090? |
TGP | 250W | 350W | 450-650W? |
Çıkış Tarihi | Eylül 2018 | Eylül 2020 | 2022? |