Muskious
New member
AMD, işlemci alanındaki mühendislik başarını Radeon ekran kartlarına taşımayı başarmış durumda. bir süre evvel tanıtılan Radeon RX 7000 serisinin zirve modelleri RX 7900 XTX ve RX 7900 XT, firmanın en gelişmiş RDNA 3 tabanlı Navi 31 GPU’sunu kullanıyor. Dünyanın birinci chiplet dizaynlı grafik işlemcisi olan Navi 31’in ortaya çıkan diyagram şeması ise tüm bilgileri açığa çıkarıyor.
AMD, Ryzen ve EPYC işlemcileriyle birlikte chiplet ihtilalinin öncüsü olmuştu. Bu sayede daha düşük maliyet ve güç tüketiminde daha yüksek performans elde etmeyi başarmıştı. AMD’nin chiplet yani yongalardan oluşan GPU tasarımı standart monolitik dizayna karşı yıkıcı bir mimari yaklaşım sunuyor.
Navi 31 diyagramı ortaya çıktı
Bu bağlamda duyurulan kartlarda kullanılan Navi 31 GPU’sunun ortaya çıkan blok şeması bizlere tanıtımda görmediğimiz bilgileri ve ayrıntıları gösteriyor. birinci vakit içinderda yüzeysel başlayalım. AMD, Navi 31 GPU’sunda bir grafik süreç zarı (Graphics Compute Die – GCD) ve altı bellek zarına (Memory Cache Dies – MCD) yer veriyor.
Grafik zarının haricindeki kalıplar, her biri büyükçe L3 önbelleğiyle birleştirilmiş 32 bit denetleyicileri barındırıyor. Bu modüller TSMC’nin 6nm süreç sürecinde imal ediliyor. Merkezde yer alan ana grafik kalıbı ise TSMC 5nm süreciyle üretiliyor.
Ek olarak RDNA 3 mimarili Navi 31 GPU’su toplamda 58 milyar transistör içeriyor ve 61 TFLOP teorik hesaplama performansı vadediyor. Aktarılanlara bakılırsa Navi 31 GPU’su, RDNA 2 üstünde şekillenen Navi 21’e oranla mm2 başına yüzde 165 daha fazla transistör barındırıyor. AMD, watt başına performansın yüzde 54, kuşaktan jenerasyona güzelleşmenin ise yüzde 45 olduğunu belirtiyor.
Hemen üstte yer alan sızdırılan diyagram ise bizlere her biri 8 çift Hesaplama Ünitesi (CU) ile paketlenmiş 6 Shader Engine sistemini gösteriyor. ötürüsıyla sıradan bir hesapla Navi31 GPU’sunda toplamda 96 CU yahut 48 WGP (Workgroup Processor) yer aldığını öğreniyoruz. bir daha küçük bir hesaplama ile her bir CU’da 64 Shader Units yer aldığını fark ediyoruz, daha evvelde bu sayı 128 SU olarak varsayım ediliyordu.
Çekirdek sayısındaki baş karışıklığı neyden kaynaklanıyor?
Şimdi işin enteresan noktasına gelelim. Şayet AMD’nin yahut ortaklarının sitesine giderseniz RX 7900 XTX’te yani ötürüsıyla da Navi 31’de toplam 6144 SP (Stream Processor) yani Stream İşlemcisi yer aldığını görürsünüz. Ancak neredeyse tüm medya bu sayısı 12288 adet olarak belirtiyor. Peki bu dev fark neyden kaynaklanıyor?
AMD, RDNA 3 mimarisiyle diğer bir mühendislik başarısına daha imza atmış durumda. Firma, dizaynına çift çıkışlı SIMD ekleyerek işlem randımanını iki katına çıkarmış lakin çekirdek sayısını ise ikiye katlamamış durumda. Bu niçinle Navi 31’de 6144 SP yer alıyor ve temelinde pratikte 12288 SP olarak çalışıyor. İkili süreç yürütme tekniği, fizikî olarak iki kat daha fazla çekirdek kadar performans gösteremez ama sanılandan fazlaca daha düşük çekirdek sayısıyla bu kadar performans elde edilmesinin altında yatan da bu tekniktir diyebiliriz.
Olayı biraz açarsak, çift SIMD yardımıyla RDNA 3 mimarisi tıpkı anda bir yerine iki FP32 sürecini yürüyebiliyor. Bunun manası, her bir CU ünitesinin artık 64 (RDNA2) yerine 128 FP32 hesaplaması yapabilecek olması.
Ön bellek hiyerarşisi
Önbellek sistemine gelince, AMD’nin RDNA 3 Navi 31 GPU’su bizleri toplam 4 farklı bellek hiyerarşisiyle karşıladığını görüyoruz. Bunlardan birinci, 5,2 TB/s genişliğindeki Infinity Fabric bağlantısına sahip 6 MCD havuzunda yer alan 96 MB L3 Infinity Cache. Evvelki jenerasyona oranla yüzde 50 artan 6 MB L2, evvelki kuşağa oranla yüzde 300 artan 3 MB L1 ve evvelki jenerasyona oranla yüzde 240 artan 3 MB L0 önbelleklere sahibiz.
AMD’ye göre GPU için efektif aktif bant genişliği 3,5 TB/s. ötürüsıyla, Infinity Cache‘in yaklaşık 2,5 TB/sn bant genişliği sunduğu ve geri kalan 960 GB/sn bant genişliğinin GDDR6 belleklerden geldiğini görüyoruz.
Diğer detaylar
Bunlarla birlikte AMD, yeni mimaride ikinci kuşak ışın izleme teknolojisine geçiş yaparak CU başına yüzde 50 daha faza performans sunan RT hızlandırıcıları kullanıyor. Yüksek önbellek ölçüsü ve artan bant genişliği ışın izleme üzere GPU’nun süratlice erişmek istediği süreçlerde önemli performans kazanımı vadediyor.
RDNA 3 mimarisi düşünülenden daha verimli
AMD’nin yeni Navi 31 GPU’su üstte da belirttiğimiz üzere 12.288 yerine 6144 SP çekirdeğine sahip. Evvelki kuşakta yani Navi 21 tabanlı Radeon RX 6950 XT’de bu rakamın 5120 SP olduğunu biliyoruz. Sonuç olarak, jenerasyondan jenerasyona artış yalnızca yüzde 20, yani bahsedildiği üzere 2.4 kat değil.
Fakat buna karşın AMD, RX 7900 XTX’in (355W) RX 6950 XT’den (335W) 4K’da 1,7 kat, genel olarak ise yüzde 70 daha hızlı. Bunun bir işareti olan başka bir ayrıntı ise evvelki kuşakta olan 21 TFLOP düzeyindeki teorik güç bu jenerasyonda yüzde 165 artarak 61 TFLOP düzeyine çıkarılmış. Üstelik bunu sadece 20W artış ile vadediyor.
Yazımızın sonuna gelirken, AMD’nin chiplet dizaynıyla birleştirdiği yeni RDNA 3 mimarisinin ve kararında ortaya koymuş olduğu Navi 31 grafik işlemcisinin heyecan verici olduğunu belirtebiliriz. Her ne kadar AMD, performans manasında bu kuşakta de Nvidia’nın RTX 4090 kartını yakalayamamış olsa da verimlilik alanında öne geçmeyi başarmış durumda. Son olarak, RX 7900 XTX ve RX 7900 XT kartları 13 Aralık tarihinde sırasıyla 999 dolar ve 899 dolar fiyat etiketiyle satışa çıkacak.
AMD, Ryzen ve EPYC işlemcileriyle birlikte chiplet ihtilalinin öncüsü olmuştu. Bu sayede daha düşük maliyet ve güç tüketiminde daha yüksek performans elde etmeyi başarmıştı. AMD’nin chiplet yani yongalardan oluşan GPU tasarımı standart monolitik dizayna karşı yıkıcı bir mimari yaklaşım sunuyor.
Navi 31 diyagramı ortaya çıktı
Bu bağlamda duyurulan kartlarda kullanılan Navi 31 GPU’sunun ortaya çıkan blok şeması bizlere tanıtımda görmediğimiz bilgileri ve ayrıntıları gösteriyor. birinci vakit içinderda yüzeysel başlayalım. AMD, Navi 31 GPU’sunda bir grafik süreç zarı (Graphics Compute Die – GCD) ve altı bellek zarına (Memory Cache Dies – MCD) yer veriyor.
Grafik zarının haricindeki kalıplar, her biri büyükçe L3 önbelleğiyle birleştirilmiş 32 bit denetleyicileri barındırıyor. Bu modüller TSMC’nin 6nm süreç sürecinde imal ediliyor. Merkezde yer alan ana grafik kalıbı ise TSMC 5nm süreciyle üretiliyor.
Ek olarak RDNA 3 mimarili Navi 31 GPU’su toplamda 58 milyar transistör içeriyor ve 61 TFLOP teorik hesaplama performansı vadediyor. Aktarılanlara bakılırsa Navi 31 GPU’su, RDNA 2 üstünde şekillenen Navi 21’e oranla mm2 başına yüzde 165 daha fazla transistör barındırıyor. AMD, watt başına performansın yüzde 54, kuşaktan jenerasyona güzelleşmenin ise yüzde 45 olduğunu belirtiyor.
Hemen üstte yer alan sızdırılan diyagram ise bizlere her biri 8 çift Hesaplama Ünitesi (CU) ile paketlenmiş 6 Shader Engine sistemini gösteriyor. ötürüsıyla sıradan bir hesapla Navi31 GPU’sunda toplamda 96 CU yahut 48 WGP (Workgroup Processor) yer aldığını öğreniyoruz. bir daha küçük bir hesaplama ile her bir CU’da 64 Shader Units yer aldığını fark ediyoruz, daha evvelde bu sayı 128 SU olarak varsayım ediliyordu.
Çekirdek sayısındaki baş karışıklığı neyden kaynaklanıyor?
Şimdi işin enteresan noktasına gelelim. Şayet AMD’nin yahut ortaklarının sitesine giderseniz RX 7900 XTX’te yani ötürüsıyla da Navi 31’de toplam 6144 SP (Stream Processor) yani Stream İşlemcisi yer aldığını görürsünüz. Ancak neredeyse tüm medya bu sayısı 12288 adet olarak belirtiyor. Peki bu dev fark neyden kaynaklanıyor?
AMD, RDNA 3 mimarisiyle diğer bir mühendislik başarısına daha imza atmış durumda. Firma, dizaynına çift çıkışlı SIMD ekleyerek işlem randımanını iki katına çıkarmış lakin çekirdek sayısını ise ikiye katlamamış durumda. Bu niçinle Navi 31’de 6144 SP yer alıyor ve temelinde pratikte 12288 SP olarak çalışıyor. İkili süreç yürütme tekniği, fizikî olarak iki kat daha fazla çekirdek kadar performans gösteremez ama sanılandan fazlaca daha düşük çekirdek sayısıyla bu kadar performans elde edilmesinin altında yatan da bu tekniktir diyebiliriz.
Olayı biraz açarsak, çift SIMD yardımıyla RDNA 3 mimarisi tıpkı anda bir yerine iki FP32 sürecini yürüyebiliyor. Bunun manası, her bir CU ünitesinin artık 64 (RDNA2) yerine 128 FP32 hesaplaması yapabilecek olması.
Ön bellek hiyerarşisi
Önbellek sistemine gelince, AMD’nin RDNA 3 Navi 31 GPU’su bizleri toplam 4 farklı bellek hiyerarşisiyle karşıladığını görüyoruz. Bunlardan birinci, 5,2 TB/s genişliğindeki Infinity Fabric bağlantısına sahip 6 MCD havuzunda yer alan 96 MB L3 Infinity Cache. Evvelki jenerasyona oranla yüzde 50 artan 6 MB L2, evvelki kuşağa oranla yüzde 300 artan 3 MB L1 ve evvelki jenerasyona oranla yüzde 240 artan 3 MB L0 önbelleklere sahibiz.
AMD’ye göre GPU için efektif aktif bant genişliği 3,5 TB/s. ötürüsıyla, Infinity Cache‘in yaklaşık 2,5 TB/sn bant genişliği sunduğu ve geri kalan 960 GB/sn bant genişliğinin GDDR6 belleklerden geldiğini görüyoruz.
Diğer detaylar
Bunlarla birlikte AMD, yeni mimaride ikinci kuşak ışın izleme teknolojisine geçiş yaparak CU başına yüzde 50 daha faza performans sunan RT hızlandırıcıları kullanıyor. Yüksek önbellek ölçüsü ve artan bant genişliği ışın izleme üzere GPU’nun süratlice erişmek istediği süreçlerde önemli performans kazanımı vadediyor.
RDNA 3 mimarisi düşünülenden daha verimli
AMD’nin yeni Navi 31 GPU’su üstte da belirttiğimiz üzere 12.288 yerine 6144 SP çekirdeğine sahip. Evvelki kuşakta yani Navi 21 tabanlı Radeon RX 6950 XT’de bu rakamın 5120 SP olduğunu biliyoruz. Sonuç olarak, jenerasyondan jenerasyona artış yalnızca yüzde 20, yani bahsedildiği üzere 2.4 kat değil.
| RX 7900 XTX | RX 6950 XT |
Stream İşlemci | 96 CU (6144) | 80 CU (5120) |
ROP | 192 | 128 |
Oyun Frekans | 2.3 GHz | 2100 MHz |
Boost Frekans | 2.5 GHz | 2310 MHz |
FP32 | 61 TFLOPs | 21.5 TFLOPs |
Bellek Hızı | 20 Gbps GDDR6 | 18 Gbps GDDR6 |
Bellek Veriyolu | 384-bit | 256-bit |
Bellek | 24GB | 16GB |
Infinity Cache | 96MB | 128MB |
TBP | 355W | 335W |
Üretim Tekniği | GCD: TSMC 5nm MCD: TSMC 6nm | TSMC 7nm |
Transistör | 58 milyar | 26.8 milyar |
Mimari | RDNA 3 | RDNA 2 |
GPU | Navi 31 | Navi 21 |
Fiyat | 999 dolar | 1099 dolar |
Fakat buna karşın AMD, RX 7900 XTX’in (355W) RX 6950 XT’den (335W) 4K’da 1,7 kat, genel olarak ise yüzde 70 daha hızlı. Bunun bir işareti olan başka bir ayrıntı ise evvelki kuşakta olan 21 TFLOP düzeyindeki teorik güç bu jenerasyonda yüzde 165 artarak 61 TFLOP düzeyine çıkarılmış. Üstelik bunu sadece 20W artış ile vadediyor.
Yazımızın sonuna gelirken, AMD’nin chiplet dizaynıyla birleştirdiği yeni RDNA 3 mimarisinin ve kararında ortaya koymuş olduğu Navi 31 grafik işlemcisinin heyecan verici olduğunu belirtebiliriz. Her ne kadar AMD, performans manasında bu kuşakta de Nvidia’nın RTX 4090 kartını yakalayamamış olsa da verimlilik alanında öne geçmeyi başarmış durumda. Son olarak, RX 7900 XTX ve RX 7900 XT kartları 13 Aralık tarihinde sırasıyla 999 dolar ve 899 dolar fiyat etiketiyle satışa çıkacak.