NVIDIA Blackwell Jadi Standar Generative AI di Benchmark MLPerf

Author

Irham

Reading time:

News

August 29, 2024

readmode

Perusahaan kini menghadapi tantangan besar dalam memenuhi tuntutan infrastruktur pusat data akibat adopsi AI generatif yang semakin meningkat. Salah satu tantangan utamanya adalah melatih model bahasa besar (LLM) dan menyediakan layanan real-time berbasis LLM.

NVIDIA menunjukan kepemimpinannya di industri dengan menampilkan benchmark MLPerf Inference v4.1, dimana NVIDIA mendapatkan hasil terbaik di semua tes pusat data. Platform terbaru mereka yaitu NVIDIA Blackwell, yang baru diumumkan di bulan Maret lalu, menunjukkan performa 4 kali lebih baik dari H100 Tensor Core GPU pada model LLM Llama 2 70B. Platform Blackwell sendiri bisa dikombinasikan dengan semua chip dan juga software milik NVIDIA.

Sementara itu, NVIDIA H200 Tensor Core GPU juga berhasil mencetak hasil luar biasa, terutama dalam benchmark model Mixtral 8x7B MoE yang memiliki 46,7 miliar parameter, memperkuat efisiensi dan kecepatan model MoE dalam menangani berbagai tugas LLM.

Perkenalkan NVLink dan NVSwitch

Pertumbuhan LLM meningkatkan kebutuhan komputasi untuk memproses permintaan inferensi. Untuk mendukung kebutuhan real-time, NVIDIA memperkenalkan NVLink dan NVSwitch, yang memungkinkan komunikasi bandwidth tinggi antar GPU. Dengan teknologi ini, platform Blackwell bisa meningkatkan perfoma dengan memperluas dukungan hingga 72 GPU.

Baca Juga: NVIDIA Bakal Pamer Sejumlah Inovasi AI Terbaru di Hot Chips 2024 • Jagat Review

NVIDIA juga fokus pada pengembangan perangkat lunak. H200 GPU menawarkan peningkatan performa inferensi AI generatif hingga 27% dibandingkan sebelumnya. Triton Inference Server dari NVIDIA membantu menggabungkan server inferensi menjadi satu platform terpadu untuk mempercepat penerapan model.

Model AI generatif di edge juga mendapat perhatian. Dengan platform NVIDIA Jetson AGX Orin, pengembang dapat menjalankan model AI secara lokal. Dalam benchmark MLPerf terbaru, Jetson AGX Orin meningkatkan throughput 6,2 kali lipat dan mengurangi latensi 2,4 kali lipat pada workload GPT-J LLM.

Secara keseluruhan, performa NVIDIA dalam benchmark MLPerf Inference kali ini menunjukkan keunggulan mereka dalam menyediakan infrastruktur AI yang kuat, baik di pusat data maupun di edge. Sistem bertenaga H200 GPU kini tersedia melalui penyedia layanan cloud dan produsen server, siap mendukung inovasi aplikasi dan layanan berbasis AI.

Load Comments

NVIDIA Blackwell Jadi Standar Generative AI di Benchmark MLPerf

Perkenalkan NVLink dan NVSwitch

Comments

More Articles

Latest Articles

Honkai: Nexus Anima Siapkan Closed Beta Baru, Hadirkan Karakter dan Sistem Baru

Amazfit Balance 3 Series Dirilis, Kenalkan Varian “Ultra”!

NVIDIA RTX Remix 1.5 Bikin Mod Game Lawas Jadi Lebih Ringan

Agar AI On-Device di HP Makin Kencang, Teknologi Memori LLW Dikembangkan!

SSD 16 Tahun Dipaksa Menulis Data 1000 Terabyte, Ternyata Belum Menyerah

Gambar Render HMD Luma2 Muncul di Internet, Spesifikasi Utama Bocor

TrendForce: RAM Makin Langka, Harga RAM DDR2 Bakal Makin Melambung Tinggi

SteamOS 3.8 Resmi Meluncur, Beri Dukungan Awal untuk Steam Machine

Gadget

Review Infinix GT 30: Smartphone Gaming Padahal Aslinya All-Rounder!

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Laptop

Review ASUS ROG Zephyrus Duo (2026): Kencang “Pol” Buat Multitasking & Gaming AAA

Review Polytron Luxia with AMD Ryzen 5: Rp 7 Jutaan, Kencang, Upgradeable, 5X USB, ADP+

Review Acer TravelMate X4 14 AI: Laptop Bisnis AI Cepat, Ringan & Produktif

Review ASUS Zenbook DUO 2026 (UX8407AA): Desain Baru, Makin Kokoh, Makin Kenceng!

Gaming

Honkai: Nexus Anima Siapkan Closed Beta Baru, Hadirkan Karakter dan Sistem Baru

SteamOS 3.8 Resmi Meluncur, Beri Dukungan Awal untuk Steam Machine

PS6 Diprediksi Bisa Mundur ke 2028 atau 2029 Oleh Embracer Group

Bocoran Retailer Portugal Indikasikan GTA 6 Bisa Dibanderol Sekitar $105

Jagat Review

NVIDIA Blackwell Jadi Standar Generative AI di Benchmark MLPerf

Perkenalkan NVLink dan NVSwitch

Comments

More Articles

Panduit Technology Day Indonesia Soroti Tantangan Infrastruktur di Era AI

Bocoran Vivo X500 Pro Max Ungkap Bakal Pakai Sensor Baru Sony

Huawei Watch Buds 2 Rilis, Smarwatch Unik dengan Earbuds!

Monitor BenQ MA Series Meluncur di Indonesia, Teman Pas Buat Pengguna MacBook!

Latest Articles

Honkai: Nexus Anima Siapkan Closed Beta Baru, Hadirkan Karakter dan Sistem Baru

Amazfit Balance 3 Series Dirilis, Kenalkan Varian “Ultra”!

NVIDIA RTX Remix 1.5 Bikin Mod Game Lawas Jadi Lebih Ringan

Agar AI On-Device di HP Makin Kencang, Teknologi Memori LLW Dikembangkan!

SSD 16 Tahun Dipaksa Menulis Data 1000 Terabyte, Ternyata Belum Menyerah

Gambar Render HMD Luma2 Muncul di Internet, Spesifikasi Utama Bocor

TrendForce: RAM Makin Langka, Harga RAM DDR2 Bakal Makin Melambung Tinggi

SteamOS 3.8 Resmi Meluncur, Beri Dukungan Awal untuk Steam Machine

Gadget

Review Infinix GT 30: Smartphone Gaming Padahal Aslinya All-Rounder!

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Laptop

Review ASUS ROG Zephyrus Duo (2026): Kencang “Pol” Buat Multitasking & Gaming AAA

Review Polytron Luxia with AMD Ryzen 5: Rp 7 Jutaan, Kencang, Upgradeable, 5X USB, ADP+

Review Acer TravelMate X4 14 AI: Laptop Bisnis AI Cepat, Ringan & Produktif

Review ASUS Zenbook DUO 2026 (UX8407AA): Desain Baru, Makin Kokoh, Makin Kenceng!

Gaming

Honkai: Nexus Anima Siapkan Closed Beta Baru, Hadirkan Karakter dan Sistem Baru

SteamOS 3.8 Resmi Meluncur, Beri Dukungan Awal untuk Steam Machine

PS6 Diprediksi Bisa Mundur ke 2028 atau 2029 Oleh Embracer Group

Bocoran Retailer Portugal Indikasikan GTA 6 Bisa Dibanderol Sekitar $105

Jagat Review