Lebih Dekat dengan LPDDR4X-4266 di AMD Ryzen Mobile
Sejak pengumuman kehadiran Ryzen 4000 Mobile ‘Renoir’ setahun lalu, ada sebuah standar memory baru yang diperkenalkan sebagai alternatif DDR4 pada platform ini, yakni LPDDR4X. Seperti yang dibahas pada beberapa dokumentasi arsitektur Renoir, platform Mobile AMD ini memiliki memory controller yang mendukung penggunaan baik DDR4 atau LPDDR4/X.
DDR4
- Umumnya berupa SODIMM module pada laptop
- 64-bit channel ke memory controller per DIMM
- Up to 2 Channel DDR4 (2x 64-bit)
- kecepatan hingga DDR4-3200
LPDDR4/LPDDR4X
- Umumnya berupa soldered IC pada laptop
- 32-bit channel ke memory controller per ‘IC’
- Memory controller Ryzen memiliki lebar 64-bit, maka per channel LPDDR4/X dioperasikan dengan 2×32-bit ‘Virtual Channel’
- Up to ‘4’ Channel LPDDR4/X (2 channel masing-masing 2×32-bit, jadi 4x 32-bit)
- Kecepatan hingga LPDDR4X-4266
Tentu, secara teori, rating kecepatan tinggi yang dimiliki LPDDR4X-4266 akan membuatnya memiliki theoritical bandwidth yang lebih besar dari DDR4-3200, dalam kasus ini dengan ‘lebar’ bus width yang sama (4×32-bit untuk LPDDR4X, dan 2×64-bit untuk DDR4), LPDDR4X-4266 bisa mencapai bandwidth maksimal 68.3 GB/s, dibandingkan dengan DDR4-3200 yang ada di 51.2 GB/s.
Namun benarkah LPDDR4X-4266 akan selalu lebih kencang? Ternyata ada hal lain di balik penggunaan LPDDR4X ini, dimana ada mode pengoperasian khusus pada LPDDR4X pada AMD Ryzen mobile, dan kami akan membahas hal tersebut sedikit lebih dalam pada artikel ini.
Mengenal Berbagai Clock dalam AMD Ryzen yang berhubungan dengan RAM
Sebelum kita masuk lebih dalam pada pengoperasian LPDDR4X pada AMD Ryzen mobile, ada baiknya kita mengenali cara kerja dan beberapa variabel yang terkait dalam pengoperasian RAM pada AMD Ryzen :
FCLK, UCLK, MCLK
Prosesor AMD Ryzen memiliki beberapa clock domain berbeda yang hubungannya erat dengan pengoperasian memori (catatan: topik ini sudah pernah dibahas tahun 2019 lalu saat peluncuran AMD Zen2 desktop, Anda bisa menyimaknya di sini).
Clock tersebut adalah:
- FCLK : Menentukan clock dimana data fabric/infinity fabric akan beroperasi, berperan dalam menentukan kecepatan komunikasi antar CCX, CCD, dan Memory controller. Kadang disebut juga ‘Fabric Clock’.
- UCLK : Clock dari Memory Controller
- MCLK / MemClk : Memory Clock (contoh: sebuah DDR4-3200 akan memiliki clock ‘real’ 1600Mhz)
Mode Umum: Semua Sinkron 1:1 (Best Latency)
Mode operasi yang umum adalah mode dimana ketiga clock ini sinkron(yang kita sebut mode 1:1:1),
Jadi misalnya ada DDR4-3200 (berarti MCLK 1600Mhz), maka FCLK akan berjalan di 1600Mhz, dan UCLK akan berjalan di 1600Mhz juga. Mode ini akan memberikan latency terbaik (terendah).
Mode 1:2 – Mengejar Memory Clock dan Bandwidth, Latency agak longgar
Sejak Zen2, AMD mengizinkan beberapa clock ini untuk berjalan asinkron. FCLK bisa diubah cukup bebas (umumnya per 33Mhz), sedangkan UCLK dan MCLK diizinkan untuk berjalan di ratio 1:2 , tidak harus 1:1.
Misalnya ada sebuah RAM DDR4-4266 (berarti MCLK 2133Mhz), sistem Zen2 bisa menjalankan ini dengan UCLK 1067Mhz (1:2, setengah dari MCLK), lalu FCLK bisa diset pada 1600 Mhz atau 1800Mhz misalnya (FCLK di mode ini tidak harus mengikuti MCLK ataupun UCLK).
Mode ini memberikan fleksibilitas bagi pengguna untuk menggunakkan RAM dengan kecepatan tinggi, namun sayangnya pada mode ini hanya bandwidth RAM yang mungkin bisa tinggi, sedangkan latency-nya agak sedikit dikorbankan. Berikut sedikit ilustrasi dari AMD seputar hubungan antara konfigurasi 1:1 vs 1:2 ini :
AMD Ryzen mobile : memiliki mode operasi RAM yang sedikit berbeda dari Ryzen Desktop
Ryzen Mobile sejak ‘Renoir’ (Ryzen 4000 Series Mobile) memiliki mode pengoperasian yang serupa, namun sedikit lebih unik ketika LPDDR4X digunakan.
Melalui sebuah diskusi kami dengan pihak AMD seputar penggunaan LPDDR4X, AMD menyampaikan hal berikut ini :
Apa maksud AMD di atas? Begini penjelasannya :
- Ryzen Mobile umumnya akan memiliki limitasi TDP/Power yang lebih ketat dibandingkan Ryzen Desktop.
- Dengan limitasi power pada perangkat mobile, mengoperasikan RAM, Fabric, dan Memory Controller pada clock fixed di mode 1:1 belum tentu menjadi yang paling efisien dari segi performance per watt.
- Untuk itu AMD memberikan fitur power management khusus pada Ryzen Mobile, untuk bisa secara dinamis mengubah berbagai clock domain yang ada seputar RAM (FCLK, UCLK, MCLK) demi memaksimalkan performance dan power efficiency
- Clock ini berubah sesuai dengan kondisi load dari CPU dan Integrated GPU.
Berikut contoh mode pengoperasiannya :
Contoh 1 – untuk parts Ryzen mobile U-series TDP 15W dengan LPDDR4X-4266
- Saat CPU Load tinggi ,maka sistem beroperasi sinkron 1:1:1 dengan FCLK 1333Mhz, UCLK 1333Mhz, dan MCLK 1333Mhz (2666 MT/s atau setara DDR4-2666, UCLK:MCLK 1:1). Ini disebabkan untuk mengejar latency yang optimal, meskipun dengan ini sistem tersebut berarti melakukan ‘underclock’ pada RAM-nya.
- Saat Integrated GPU load tinggi, maka sistem beroperasi dengan FCLK 1333Mhz, UCLK 1067Mhz, dan MCLK 2133Mhz (4266MT/s atau setara DDR4-4266, UCLK:MCLK 1:2). Ini karena load pada IGP umumnya membutuhkan bandwidth yang besar.
- Pada kondisi CPU dan IGP di-load bersamaan, operasinya sama dengan CPU load tinggi, semua clock (FCLK,UCLK,MCLK) berjalan di 1333Mhz.
Contoh 2 – untuk parts Ryzen mobile U-series TDP 35-45W dengan LPDDR4X-4266
- Saat CPU Load tinggi ,maka sistem beroperasi sinkron 1:1:1 dengan FCLK 1600Mhz, UCLK 1600Mhz, dan MCLK 1600Mhz (3200 MT/s atau setara DDR4-3200, UCLK:MCLK 1:1). Ini disebabkan untuk mengejar latency yang optimal, meskipun dengan ini sistem tersebut berarti melakukan ‘underclock’ pada RAM-nya.
- Saat Integrated GPU load tinggi, maka sistem beroperasi dengan FCLK 1600 Mhz, UCLK 1067Mhz, dan MCLK 2133Mhz (4266MT/s atau setara DDR4-4266, UCLK:MCLK 1:2). Ini karena load pada IGP umumnya membutuhkan bandwidth yang besar.
- Pada kondisi CPU dan IGP di-load bersamaan, operasinya sama dengan CPU load tinggi, semua clock (FCLK,UCLK,MCLK) berjalan di 1600 Mhz.
Jadi, kencang mana LPDDR4X-4266 dan DDR4-3200?
Perlu diketahui, agak sulit membandingkan langsung sistem berbasis LPDDR4X-4266 dan DDR4-3200, karena hampir mustahil menemukan dua buah laptop sama persis dimana yang satu dikonfigurasi dengan DDR4-3200 SODIMM, dan yang satu LPDDR4X-4266. Ini terjadi karena desain yang melakukan implementasi LPDDR4X umumnya dilakukan untuk menghemat power, atau juga menghemat space.
Namun kami akan mencoba memberikan sebuah ilustrasi singkat dengan benchmark sintetis pada sistem Ryzen mobile dengan LPDDR4X dan DDR4-3200 berikut ini :
Sistem Uji – ASUS ROG FLOW X13 : 2x 16GB LPDDR4X-4266 (2133Mhz) total 32GB
CPU-Z LPDDR4X
Cukup mudah untuk melilhat pada gambar di atas dimana timing dari LPDDR4X-nya termasuk longgar untuk ukuran kecepatan 4266 MT/s (tentu berasumsi pembacaan ini akurat).
Benchmark singkat AIDA64 Memory Benchmark, VS DDR4-3200 dual-channel
Bisa dilihat pada benchmark sintetis AIDA64 memory bandwidth di atas, dimana sistem berbasis DDR4-3200 dual-channel mengungguli LPDDR4X-4266 baik pada copy bandwidth, maupun pada latency.
Di skenario benchmark sintetis yang menguji memory ini, sangat mungkin si LPDDR4X ini beroperasi pada mode ‘CPU Load’ dan mencoba memberikan clock 1600Mhz pada FCLK, UCLK, dan MCLK (setara 3200MT/s). Dan melihat LPDDR4X umumnya memiliki timing cukup longgar, wajar jika performa-nya masih di bawah DDR4-3200.
Namun perlu diingat, ini hanya saat kondisi ‘CPU load’. Pada kondisi IGP load, LPDDR4X berpotensi menunjukkan keunggulan-nya dengan bandwidth lebih tinggi (belum diuji di pengujian singkat kali ini).
Penutup
Walaupun penggunaan LPDDR4X belum tentu memberikan raw performance lebih tinggi dari DDR4 SO-DIMM biasa, tidak bisa dipungkiri bahwa target desain LPDDR4X adalah memberikan bandwidth yang memadai dengan daya & voltage yang jauh lebih rendah, dan hemat space untuk device kecil.
Adopsi LPDDR4/LPDDR4X bisa jadi mulai banyak pada penerus Renoir, yakni Cezanne/Lucienne (Ryzen 5000-series Mobile), dimana prosesor baru tersebut tentunya akan mengejar power efficiency dan juga battery life pada notebook. Kami hanya berharap implementasi LPDDR4X ini diikuti dengan ukuran yang memadai (16GB ke atas misalnya untuk standar tahun 2021), karena LPDDR4X ini tidak upgradeable.
Sampai jumpa di pembahasan kami yang berikutnya.