NVIDIA Blackwell Jadi Standar Generative AI di Benchmark MLPerf

Author
Irham
Reading time:
August 29, 2024

Perusahaan kini menghadapi tantangan besar dalam memenuhi tuntutan infrastruktur pusat data akibat adopsi AI generatif yang semakin meningkat. Salah satu tantangan utamanya adalah melatih model bahasa besar (LLM) dan menyediakan layanan real-time berbasis LLM.

NVIDIA Blackwell Benchmark

NVIDIA menunjukan kepemimpinannya di industri dengan menampilkan benchmark MLPerf Inference v4.1, dimana NVIDIA mendapatkan hasil terbaik di semua tes pusat data. Platform terbaru mereka yaitu NVIDIA Blackwell, yang baru diumumkan di bulan Maret lalu, menunjukkan performa 4 kali lebih baik dari H100 Tensor Core GPU pada model LLM Llama 2 70B. Platform Blackwell sendiri bisa dikombinasikan dengan semua chip dan juga software milik NVIDIA.

GB200

Sementara itu, NVIDIA H200 Tensor Core GPU juga berhasil mencetak hasil luar biasa, terutama dalam benchmark model Mixtral 8x7B MoE yang memiliki 46,7 miliar parameter, memperkuat efisiensi dan kecepatan model MoE dalam menangani berbagai tugas LLM.

Perkenalkan NVLink dan NVSwitch

Pertumbuhan LLM meningkatkan kebutuhan komputasi untuk memproses permintaan inferensi. Untuk mendukung kebutuhan real-time, NVIDIA memperkenalkan NVLink dan NVSwitch, yang memungkinkan komunikasi bandwidth tinggi antar GPU. Dengan teknologi ini, platform Blackwell bisa meningkatkan perfoma dengan memperluas dukungan hingga 72 GPU.

Baca Juga: NVIDIA Bakal Pamer Sejumlah Inovasi AI Terbaru di Hot Chips 2024 • Jagat Review

NVLink switch tray top view open black NVIDIA juga fokus pada pengembangan perangkat lunak. H200 GPU menawarkan peningkatan performa inferensi AI generatif hingga 27% dibandingkan sebelumnya. Triton Inference Server dari NVIDIA membantu menggabungkan server inferensi menjadi satu platform terpadu untuk mempercepat penerapan model.

Model AI generatif di edge juga mendapat perhatian. Dengan platform NVIDIA Jetson AGX Orin, pengembang dapat menjalankan model AI secara lokal. Dalam benchmark MLPerf terbaru, Jetson AGX Orin meningkatkan throughput 6,2 kali lipat dan mengurangi latensi 2,4 kali lipat pada workload GPT-J LLM.

Secara keseluruhan, performa NVIDIA dalam benchmark MLPerf Inference kali ini menunjukkan keunggulan mereka dalam menyediakan infrastruktur AI yang kuat, baik di pusat data maupun di edge. Sistem bertenaga H200 GPU kini tersedia melalui penyedia layanan cloud dan produsen server, siap mendukung inovasi aplikasi dan layanan berbasis AI.

Share
Load Comments

Gadget

October 19, 2025 - 0

Review Infinix GT 30: Smartphone Gaming Padahal Aslinya All-Rounder!

Ini adalah Infinix GT 30! Ya, hape ini adalah versi…
July 10, 2025 - 0

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Fossil mengumumkan hadrinya dua jam tangan eksklusif hasil kolaborasi Marvel…
June 18, 2025 - 0

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Ini hape yang memicu Pro-kontra.  Banyak orang, bahkan kami pun…
June 17, 2025 - 0

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Kalian sedang cari smartwatch bentuk kotak yang canggih, baterai irit,…

Laptop

June 18, 2026 - 0

Review ASUS ROG Zephyrus Duo (2026): Kencang “Pol” Buat Multitasking & Gaming AAA

Laptop Gaming kekinian tuh harusnya kayak gini. Ini adalah “ASUS…
May 27, 2026 - 0

Review Polytron Luxia with AMD Ryzen 5: Rp 7 Jutaan, Kencang, Upgradeable, 5X USB, ADP+

Ini dia Laptop pertama Polytron dengan prosesor AMD Ryzen. Harganya?…
May 25, 2026 - 0

Review Acer TravelMate X4 14 AI: Laptop Bisnis AI Cepat, Ringan & Produktif

Kata siapa bisnis UMKM ga butuh Laptop canggih?! Apalagi sekarang…
May 21, 2026 - 0

Review ASUS Zenbook DUO 2026 (UX8407AA): Desain Baru, Makin Kokoh, Makin Kenceng!

Kerja serius pakai laptop thin and light biasa? Kurang mantap…

Gaming

June 22, 2026 - 0

Honkai: Nexus Anima Siapkan Closed Beta Baru, Hadirkan Karakter dan Sistem Baru

HoYoverse akan menggelar closed beta dari game monster collection baru…
June 22, 2026 - 0

SteamOS 3.8 Resmi Meluncur, Beri Dukungan Awal untuk Steam Machine

SteamOS 3.8 resmi dirilis dengan dukungan awal untuk Steam Machine,…
June 22, 2026 - 0

PS6 Diprediksi Bisa Mundur ke 2028 atau 2029 Oleh Embracer Group

Laporan dari Embracer Group memprediksi Sony kemungkinan besar mempertimbangkan memundurkan…
June 22, 2026 - 0

Bocoran Retailer Portugal Indikasikan GTA 6 Bisa Dibanderol Sekitar $105

Listing bocoran dari FNAC Portugal mengindikasikan GTA 6 edisi standar…