Lebih Dekat dengan Arsitektur RDNA2 (AMD Radeon RX 6800 XT)

Reading time:
November 29, 2020

AMD Radeon RX 6000 series merupakan seri GPU terbaru yang diluncurkan AMD. Pada saat perilisan, ada dua model GPU RX 6000 yang hadir, yakni Radeon RX 6800 XT, dan Radeon RX 6800. Dua model GPU ini menandakan kembalinya AMD pada lini kartu grafis high-end, sejak Radeon VII yang dirilis pada 2019 Februari lalu, dan juga hadirnya arsitektur GPU baru dari AMD yakni RDNA2, yang mendukung sejumlah fitur modern seperti hardware-accelerated Ray Tracing.

Sesi pengujian yang kami jalankan beberapa waktu lalu pada Radeon RX 6800 XT menunjukkan bahwa GPU ini memiliki potensi performa yang cukup menarik, dengan performa mendekati sebuah GeForce RTX 3080 pada 4K Gaming (tanpa ray tracing). Performa 6800 XT pada beberapa game dengan DirectX Ray Tracing (DXR) di resolusi 1440p juga tidak buruk, sedikit lebih baik dari sebuah GeForce RTX 2080 Ti, GPU consumer ex-flagship NVIDIA.

Baca Juga:

Preview AMD Radeon RX 6800 XT

AMD Radeon RX 6800 XT (reference model)
Average – 4K Game (Rasterization, Non Ray-Tracing)
Average – 1440p DXR Game

 

Salah satu faktor yang mendukung performa Radeon RX 6000 adalah penggunaan arsitektur RDNA2. Pada artikel ini, kami ingin membahas arsitektur tersebut lebih dekat.

RDNA2 – Basis dari Radeon RX 6000 Series

 

GPU RDNA2: Pengembangan Dari RDNA1

‘Sejarah’ RDNA

Desain RX 6000 series didasarkan pada arsitektur RDNA2, sebuah pengembangan lebih lanjut dari RDNA lama (‘RDNA1’) yang ada di Radeon RX 5000 series (RX 5700 XT dan RX 5700 contohnya).

Baca Juga:

Arsitektur RDNA1 vs GCN

RDNA (‘Radeon DNA’) sendiri membawa perubahan desain yang cukup besar dari desain GCN(‘Graphics Core Next’) sebelumnya, terutama pada metode eksekusi instruksi-nya. Secara sederhana, pada sebuah skenario tertentu dimana GPU berbasis GCN lama membutuhkan 4x clock cycle untuk eksekusi, GPU berbasis RDNA bisa melakukan hal tersebut dengan hanya 1x clock cycle – ini salah satu faktor yang membuat IPC (instruction per cycle) pada GPU berbasis RDNA meningkat dibandingkan dari GPU AMD berbasis GCN.

RDNA2 memiliki banyak kesamaan dengan RDNA1, terutama dari sisi eksekusi instruksi ini. Yang membuat RDNA2 jauh lebih kencang dari RDNA1, adalah berbagai optimalisasi pada aspek penting, seperti:

  1. Adanya dukungan untuk sejumlah fitur grafis next-gen (hardware-accelerated Ray Tracing, Variable-rate shader, etc)
  2. Target Jumlah Compute Unit yang JAUH lebih tinggi dari RDNA1
  3. Clockspeed Tinggi TANPA mengorbankan Efisiensi Daya
  4. Optimalisasi Memory Performance dengan Caching (‘Infinity Cache’)

 

 

RDNA2 Feature : Ray-Tracing dan dukungan DX12 Ultimate

Compute Unit & Ray Accelerator

*Diagram RDNA2 Compute Unit – klik untuk memperbesar

Satu hal yang menjadi highlight pada RDNA2 tentunya adalah adanya hardware tambahan pada RX 6000 series untuk melakukan akselerasi real-time Ray Tracing. AMD menyebut unit ini sebagai ‘Ray Accelerator‘, ada 1 Ray Accelerator Per Compute Unit pada GPU berbasis RDNA2 (total 72 Unit pada sebuah 6800 XT).

 

Ray Tracing, Ray-Triangle Intersection & BVH 

Perlu diketahui, pada skenario rendering dengan real-time ray tracing, salah satu proses yang paling banyak memakan waktu adalah kalkulasi untuk identifikasi dimana sebuah ray akan melakukan ‘contact’ dengan object / triangle tertentu. Untuk itu, para developer mencari solusi pintar untuk melakukan hal ini, salah satunya dengan algoritma BVH (Bounding Volume Hierarchy).

Tanpa masuk ke detail yang lebih jauh lagi, BVH akan mempercepat perhitungan ray-triangle intersection ini dengan menciptakan sebuah struktur untuk membagi area objek ke sebuah ‘box’ tertentu, dan proses mencari ray intersection dilakukan secara sistematis dari ‘box’ yang paling besar ke ‘box’ paling kecil seperti dilihat pada ilustrasi sederhana berikut:

Karena renderer tidak perlu menguji semua triangle pada objek tertentu, proses pencarian ray-triangle intersection menjadi jauh dipersingkat dengan algoritma BVH . Yang jadi tantangan selanjutnya : perhitungan algoritma BVH (a.k.a ‘BVH Traversal’) ini masih memberi beban siginifikan pada GPU !

Proses mencari ‘ray-triangle intersection‘ dengan BVH ini sangat memakan waktu mengingat object dalam game biasanya terdiri dari ribuan triangle atau lebih, dan menurut beberapa dokumentasi, kalkulasi ini bisa memakan ribuan instruksi per ray. Mengingat GPU sudah cukup ‘sibuk’ dalam menangani proses shading sebuah scene, kalkulasi BVH pada GPU akan memberikan penalti performa yang besar, dan penurunan framerate yang berpotensi membuat game-nya tidak playable.

Adanya hardware khusus(dedicated) untuk membantu proses ray-intersection ini akan sangat memberikan peningkatan performa yang signifikan.

Sama halnya dengan NVIDIA yang memiliki ‘RT Core’ sejak arsitektur Turing, sekarang akhirnya AMD menawarkan akselerasi ini lewat ‘Ray Accelerator’ mereka. Saat artikel ini rilis, RX 6000 series akan bisa menggunakan Ray Accelerator ini untuk mempercepat Game/Aplikasi yang kompatibel dengan API DirectX Ray Tracing(DXR), walau tidak menutup kemungkinan nantinya akan ada dukungan untuk akselerasi yang menggunakan metode ray tracing lainnya (seperti Vulkan Ray Tracing).

 

Dukungan DX12 Ultimate

Satu nilai lebih dari RDNA2 yang tidak dimiliki pendahulunya (baik GCN maupun RDNA1) , adalah dukungan feature set dari API DirectX terbaru, yang disebut DirectX 12 Ultimate. GPU berbasis RDNA2 ini juga disebut-sebut nantinya akan memiliki dukungan atas DirectStorage API (Detail awal mengenai DirectStorage API dapat Anda temukan pada Microsoft berikut ini)

Seperti yang dijabarkan Microsoft secara singkat pada blog mereka, DirectX 12 Ultimate berisi serangkaian dukungan fitur grafis ‘next-gen’, yang terdiri dari:

  • DirectX Ray Tracing (DXR)
  • Variable Rate Shader (VRS)
  • Mesh Shader
  • Sampler Feedback

DirectX Ray Tracing nampak menjadi highlight dari fitur DX12 Ultimate untuk memberikan peningkatan kualitas visual. Namun fitur seperti Variable Rate Shader sudah mulai terlihat menunjukkan potensinya untuk memberikan peningkatan performa dengan shading lebih ‘pintar’.

Baca Juga:

Mengenal Variable Rate Shader

 

 

RDNA2 GPU Block Diagram

Diagram RDNA2 chip – klik untuk memperbesar

 

I/O, Display Engine & Multimedia Engine

Dari diagram di atas bisa terlihat beragam unit yang terdapat di dalam GPU berbasis RDNA2, yakni

  • Dengan die size sebesar 519 mm2, sebuah Chip Radeon RX 6000 (‘Navi 21’) memiliki hingga 80 Compute Unit (CU)
  • Pada RX 6800 XT unit yang aktif adalah 72 CU. Jumlah ini hampir 2x yang terdapat pada chip mainstream RX 5700 XT.
  • 1 CU berisi 64 Shader unit (a.k.a ‘Stream Processor’ atau ‘Radeon Cores’), sehingga 6800 XT yang memiliki 72 CU disebut memiliki 4608 Shader
  • 1 Ray Accelerator per CU, sehingga 6800XT memiliki 72 unit Ray Accelerator.
  • Total 256-bit Memory Bus, dengan tipe memory GDDR6 (16Gbps)
  • Berbeda dengan GPU sebelumnya, AMD memberikan 128MB ‘Infinity Cache’, sebuah Last-level Cache pada GPU ini untuk memberikan memory performance lebih baik.
  • Display output mendukung HDMI 2.1, dan Display Port 1.4 dengan DSC(Display Stream Compression) – untuk dukungan Display 8K
  • Multi-media engine di RX 6000 series mendukung 8K AV1 Decode, dan juga 8K HEVC Encode

 

RDNA2 – GPU dengan Desain Clockspeed Tinggi

Berikutnya, yang menjadi salah satu aspek penunjang performa tinggi pada RX 6000 series adalah kemampuan GPU berbasis RDNA2 untuk dioperasikan pada clockspeed tinggi, dengan konsumsi daya masih terjaga. AMD menjelaskan bahwa mereka bisa melakukan clockspeed tinggi ini dengan melakukan berbagai tuning di level micro-architecture, pipeline rebalancing, dan juga mekanisme clock gating yang lebih menyeluruh.

Secara umum, AMD mengklaim bahwa GPU RDNA2 bisa mendapatkan frekuensi 1.3x GPU RDNA1 pada Daya yang sama.

Base – Game – Boost Clock

Base Clock, ‘Game’ Clock, dan Boost Clock

Seperti generasi RX 5000 series sebelumnya, ada 3(tiga) buah rating clockspeed yang digunakan AMD untuk GPU Radeon mereka:

  1. Base Clock : Clock yang tercapai saat very heavy load
  2. ‘Game’ Clock : Clock saat di-load dengan game umum
  3. Boost Clock: Clock Batas Atas, umumnya tercapai pada load ringan, pada saat GPU tidak menemui power limit, dan kondisi suhu memungkinkan

Pada halaman spesifikasi resmi Radeon RX 6800 XT , AMD akan memberikan rating 2015Mhz Game Clock, dan 2250Mhz Boost Clock. AMD terlihat tidak menyebutkan Base clock di sini, namun ini wajar karena kami jarang menemui kondisi beban load realistik dimana GPU sampai turun ke level base clock.

Penggunaan berbagai penamaan clock Ini bisa saja sedikit membingungkan bagi pengguna, namun perlu diingat bahwa clockspeed GPU modern akan bervariasi bergantung pada kondisi dan load, dan kami akan membahas karakteristik GPU ini lebih mendalam pada bagian analisis.

 

 

Memory : Tidak Lagi HBM, AMD Gunakan 256-bit GDDR6 + Infinity Cache

GPU High-end AMD selalu dikenal menggunakan teknologi memori mutakhir untuk memaksimalkan memory bandwidth, ini bisa dicapai dengan penggunaan tipe memori tertentu, atau memory bus width yang lebar.

Ini terlihat sejak tahun 2015 lalu dimana AMD menggunakan tipe memory HBM (High-bandwidth Memory) pada Radeon R9 Fury X.  GPU high-end berikutnya dari AMD seperti Radeon RX Vega 64 dan juga Radeon VII terlihat menggunakan tipe memory HBM2.

Radeon RX 6800 XT adalah GPU high-end pertama dari AMD yang tidak menggunakan HBM, dan memilih strategi implementasi unik : kombinasi 256-bit GDDR6 dengan sebuah Cache yang besar (dinamai AMD Infinity Cache).

Memory di RX 6800 XT – 8 Chip GDDR6(rating 16Gbps), total 16GB
Cache hierarchy pada RX 6800 XT

 

Cache pada GPU modern bukan sebuah hal baru. GPU dari beberapa generasi lalu sudah terlihat menggunakan cache dengan berbagai implementasi dan level, cukup umum untuk melihat Level 1(L1) dan  Level 2(L2) Cache diimplementasikan, walau umumnya cache ini jumlahnya kecil (L1 biasanya dalam ratusan KB, L2 dalam satuan MB), karena pertimbangan cache ini akan beroperasi pada clockspeed GPU, dan juga desainer GPU perlu menjaga supaya die space yang dialokasikan untuk cache tidak terlalu besar.

Penggunaan cache dengan ukuran besar umumnya dihindari karena die space ini biasanya lebih baik digunakan untuk menambah berbagai processing / shader unit, namun AMD melihat bahwa alokasi die space untuk Cache berukuran besar ini berpotensi memberikan peningkatan performa yang signifikan.

Pada Radeon RX 6800 XT, AMD memberikan 128MB Infinity Cache yang terhubung dengan GPU melalui infinity fabric, dan cache ini beroperasi pada clockspeed hingga 1.94 Ghz(Bisa turun secara dinamis untuk menghemat daya, tapi clock infinity cache ini tidak bisa dikontrol user).

Perlu dicatat juga bahwa ukuran 128MB yang besar ini bisa diimplementasikan dengan die space minimal karena AMD ‘meminjam’ desain cache high-density seperti yang digunakan pada CPU server AMD EPYC.

Implementasi Infinity Cache memiliki setidaknya 3 kelebihan :

  • Effective bandwidth per watt lebih besar, 2.4x lebih besar dari penggunaan 256-bit GDDR6
  • Pemberian Infinity Cache mendukung kebutuhan bandwidth besar dari GPU dengan Frekuensi tinggi
  • Average Memory Latency lebih kecil

 

GDDR6 : 512GB/s , Infinity Cache : 1664GB/s

Perlu diketahui RX 6800 XT sudah menggunakan 256-Bit GDDR6 pada 16Gbps (2000Mhz), menghasilkan bandwidth efektif sekitar 512GB/s. Namun penambahan Infinity Cache ini memungkinkan effective bandwidth hingga 1664 GB/s. Perlu dicatat, Angka ini bisa jadi merupakan nilai rata-rata, karena cache performance akan sangat dipengaruhi oleh cache hit rate. Besarnya cache hit ratio ini akan berbeda bergantung pada skenario dan aplikasi yang digunakan, sehingga bisa saja ada game tertentu yang menunjukkan peningkatan performa luar biasa besar, sedangkan ada yang menunjukkan peningkatan performa biasa-biasa.

Penambahan Infinity Cache ini merupakan satu aspek dari arsitektur RDNA2 yang memberikan peningkatan performance per clock signifikan.

 

RDNA2 : Hadirkan Performance-per-Watt Lebih Baik

Secara keseluruhan, AMD mengklaim bahwa RDNA2 bisa memberikan:

  • Performance-per-clock lebih tinggi per Compute Unit (salah satunya karena Infinity Cache)
  • Clockspeed lebih besar
  • Penggunaan daya lebih kecil per clock cycle

Ketiga hal di atas membuat GPU RDNA2 memiliki performance-per-watt yang jauh lebih baik, sekitar 1.54x lebih tinggi dari RDNA1 generasi sebelumnya.

Salah satu faktor yang perlu dipertimbangkan saat memilih GPU high-performance adalah konsumsi daya-nya. Umumnya GPU dengan performa tinggi akan cenderung memiliki konsumsi daya besar.

Berikut data konsumsi daya dari GPU RX 6800 XT yang menggunakan RDNA2 :

Konsumsi Daya Total Sistem – 3DMark Fire Strike Ultra

 

3DMark per Watt

Dari data ini terlihat bahwa konsumsi daya GPU RX 6800 XT yang menggunakan arsitektur RDNA2 cukup terjaga, bahkan efisiensi daya-nya cukup mengagumkan – bisa melebihi NVIDIA RTX 30-series ‘Ampere’.

 

TDP Rating: masih 300W untuk RX 6800XT, Rekomendasi PSU 750W

Aspek performance-per-watt dari RDNA2 akan dipengaruhi juga oleh konfigurasi GPU, terutama konfigurasi clockspeed dan jumlah Compute Unit(CU). Tentu GPU dengan jumlah CU lebih besar akan berpotensi memiliki konsumsi daya lebih besar dari GPU dengan jumlah CU kecil.

Pada RDNA2 kelas atas yang memiliki 72 CU seperti RX 6800 XT, AMD memilih Power target (atau TDP Rating) untuk GPU ini ada di kelas 300W (‘300W’ ini didefinisikan sebagai ‘Total Board Power’ yang berarti ini menghitung semua komponen mulai dari chip GPU, chip GDDR6, dan berbagai komponen lain yang mengonsumsi daya pada card).

Sebagai perbandingan, sejumlah GPU AMD high-end generasi sebelumnya cukup juga banyak yang memilih nilai sekitar 300W sebagai power target, seperti Radeon RX Vega 64 (295W versi aircooled, 345W versi Liquid Cooled) dan juga Radeon VII (300W). Dokumentasi AMD juga sempat menyebutkan bahwa versi flagship RX 6000 series yakni RX 6900 XT yang memiliki 80 CU akan memiliki rating TDP 300W, sedangkan GPU versi cut-down seperti RX 6800 polos yang hanya 60 CU, diberi rating TDP 250W.

AMD merekomendasikan PSU dengan kapasitas:

  • 750W untuk Radeon RX 6800 XT
  • 650W untuk Radeon RX 6800

*perlu diketahui bahwa rekomendasi kapasitas PSU dari vendor ini bisa jadi dibuat dengan perhitungan headroom untuk komponen lain (misalnya prosesor), pertimbangan efisiensi PSU saat beroperasi (dimana umumnya PSU modern akan beroperasi paling efisien pada sekitar 50% load), dan kadang juga ini dibuat dengan asumsi bahwa PSU dengan kapasitas daya lebih besar akan didesain dengan kualitas komponen lebih baik dibanding PSU dengan kapasitas lebih rendah. Rekomendasi PSU umumnya BUKAN angka konsumsi daya maksimal sebuah VGA card.

 

Kesimpulan – RDNA2, Siap Untuk Masa Depan?

Arsitektur GPU RDNA2 yang digunakan oleh RX 6000 series nampak memberikan sejumlah peningkatan signifikan dari generasi sebelumnya, pada setidaknya 3(tiga) aspek :

  1. Performance : Sanggup bersaing dengan GPU Nvidia RTX 30-series ‘Ampere’ yang sekelas
  2. Efficiency : Unggul pada performance-per-watt
  3. Feature : Siap untuk DX12 Ultimate dengan hardware-accelerated Ray Tracing

Sejauh ini, arsitektur AMD RDNA2 terlihat cukup kompetitif dan memberikan alternatif menarik bagi pengguna yang menginginkan GPU beperforma tinggi, siap bersaing dengan arsitektur NVIDIA terkini yakni Ampere.

Di sisi lain, NVIDIA dengan Ampere-nya masih punya 3 ‘senjata’ utama yang bisa mereka unggulkan : Performa lebih kencang pada skenario Real-time Ray Tracing, adanya unit khusus untuk kalkulasi AI/ Deep-Learning (‘Tensor core’) pada GPU RTX-series, dan juga dukungan Compute API CUDA yang relatif memiliki lebih banyak dukungan software content-creation, dibandingkan Compute API lain (OpenCL misalnya).

Akan menarik untuk melihat persaingan arsitektur GPU dari kedua kubu ini pada masa mendatang. Sampai saat artikel ini dirilis, produk yang ditawarkan dari AMD RDNA2 dan NVIDIA Ampere juga masih berada pada kelas high-end (500-600 USD++). Kami sendiri penasaran untuk melihat sejauh mana implementasi arsitektur GPU NVIDIA Ampere dan AMD RDNA2 bisa dilakukan pada kelas menengah ke bawah, dengan jumlah shader unit rendah.

Sampai jumpa pada pembahasan arsitektur GPU berikutnya di JagatReview 😉

Load Comments

Gadget

March 25, 2021 - 0

(Video) Review Lengkap Galaxy S21 Ultra: Smartphone Premium Samsung Terbaik

Samsung Galaxy S21 Series telah di luncurkan di bulan Januari…
March 22, 2021 - 0

(VIDEO) Preview Samsung Galaxy A72, A52, dan A32

Tidak lama ini, Samsung baru saja menggelar Samsung Unpacked di…
March 20, 2021 - 0

(Video) Review Oppo Reno5 Marvel Avengers Edition

Oppo Indonesia telah resmi meluncurkan smartphone  Oppo Reno5 edisi spesial…
March 18, 2021 - 0

IDC: Penjualan Wearables Audio Meningkat Pesat Selama Pandemi

Perangkat wearables masa kini nampaknya sudah tidak bisa terpisahkan lagi…

Laptop

March 25, 2021 - 0

(Video) Review Lengkap Galaxy S21 Ultra: Smartphone Premium Samsung Terbaik

Samsung Galaxy S21 Series telah di luncurkan di bulan Januari…
March 22, 2021 - 0

(VIDEO) Preview Samsung Galaxy A72, A52, dan A32

Tidak lama ini, Samsung baru saja menggelar Samsung Unpacked di…
March 20, 2021 - 0

(Video) Review Oppo Reno5 Marvel Avengers Edition

Oppo Indonesia telah resmi meluncurkan smartphone  Oppo Reno5 edisi spesial…
March 18, 2021 - 0

IDC: Penjualan Wearables Audio Meningkat Pesat Selama Pandemi

Perangkat wearables masa kini nampaknya sudah tidak bisa terpisahkan lagi…

Gaming

March 30, 2021 - 0

10 Alasan Mengapa Yakyuken Special adalah Game “Nakal” Legendaris!

Biarkan kami menyeka bekas kopi hitam yang menetes di jenggot…
March 30, 2021 - 0

Cyberpunk 2077 Perbaiki Animasi Tidur yang Jadi Meme, Datang dengan Masalah Baru

Cyberpunk 2077 memang datang dengan banyak masalah yang berujung jadi…
March 30, 2021 - 0

Spesifikasi PC untuk BIOMUTANT

Selalu ada kekhawatiran saat melihat game dengan hype yang cukup…
March 30, 2021 - 0

Dikira Situs Bajakan, SEGA “Kejar” Situs Steam Database

Berapa banyak dari Anda yang familiar dengan situs Steam Database…