NVIDIA Blackwell Jadi Standar Generative AI di Benchmark MLPerf

Author
Irham
Reading time:
August 29, 2024

Perusahaan kini menghadapi tantangan besar dalam memenuhi tuntutan infrastruktur pusat data akibat adopsi AI generatif yang semakin meningkat. Salah satu tantangan utamanya adalah melatih model bahasa besar (LLM) dan menyediakan layanan real-time berbasis LLM.

NVIDIA Blackwell Benchmark

NVIDIA menunjukan kepemimpinannya di industri dengan menampilkan benchmark MLPerf Inference v4.1, dimana NVIDIA mendapatkan hasil terbaik di semua tes pusat data. Platform terbaru mereka yaitu NVIDIA Blackwell, yang baru diumumkan di bulan Maret lalu, menunjukkan performa 4 kali lebih baik dari H100 Tensor Core GPU pada model LLM Llama 2 70B. Platform Blackwell sendiri bisa dikombinasikan dengan semua chip dan juga software milik NVIDIA.

GB200

Sementara itu, NVIDIA H200 Tensor Core GPU juga berhasil mencetak hasil luar biasa, terutama dalam benchmark model Mixtral 8x7B MoE yang memiliki 46,7 miliar parameter, memperkuat efisiensi dan kecepatan model MoE dalam menangani berbagai tugas LLM.

Perkenalkan NVLink dan NVSwitch

Pertumbuhan LLM meningkatkan kebutuhan komputasi untuk memproses permintaan inferensi. Untuk mendukung kebutuhan real-time, NVIDIA memperkenalkan NVLink dan NVSwitch, yang memungkinkan komunikasi bandwidth tinggi antar GPU. Dengan teknologi ini, platform Blackwell bisa meningkatkan perfoma dengan memperluas dukungan hingga 72 GPU.

Baca Juga: NVIDIA Bakal Pamer Sejumlah Inovasi AI Terbaru di Hot Chips 2024 • Jagat Review

NVLink switch tray top view open black NVIDIA juga fokus pada pengembangan perangkat lunak. H200 GPU menawarkan peningkatan performa inferensi AI generatif hingga 27% dibandingkan sebelumnya. Triton Inference Server dari NVIDIA membantu menggabungkan server inferensi menjadi satu platform terpadu untuk mempercepat penerapan model.

Model AI generatif di edge juga mendapat perhatian. Dengan platform NVIDIA Jetson AGX Orin, pengembang dapat menjalankan model AI secara lokal. Dalam benchmark MLPerf terbaru, Jetson AGX Orin meningkatkan throughput 6,2 kali lipat dan mengurangi latensi 2,4 kali lipat pada workload GPT-J LLM.

Secara keseluruhan, performa NVIDIA dalam benchmark MLPerf Inference kali ini menunjukkan keunggulan mereka dalam menyediakan infrastruktur AI yang kuat, baik di pusat data maupun di edge. Sistem bertenaga H200 GPU kini tersedia melalui penyedia layanan cloud dan produsen server, siap mendukung inovasi aplikasi dan layanan berbasis AI.

Share
Load Comments

Gadget

October 19, 2025 - 0

Review Infinix GT 30: Smartphone Gaming Padahal Aslinya All-Rounder!

Ini adalah Infinix GT 30! Ya, hape ini adalah versi…
July 10, 2025 - 0

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Fossil mengumumkan hadrinya dua jam tangan eksklusif hasil kolaborasi Marvel…
June 18, 2025 - 0

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Ini hape yang memicu Pro-kontra.  Banyak orang, bahkan kami pun…
June 17, 2025 - 0

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Kalian sedang cari smartwatch bentuk kotak yang canggih, baterai irit,…

Laptop

June 18, 2026 - 0

Review ASUS ROG Zephyrus Duo (2026): Kencang “Pol” Buat Multitasking & Gaming AAA

Laptop Gaming kekinian tuh harusnya kayak gini. Ini adalah “ASUS…
May 27, 2026 - 0

Review Polytron Luxia with AMD Ryzen 5: Rp 7 Jutaan, Kencang, Upgradeable, 5X USB, ADP+

Ini dia Laptop pertama Polytron dengan prosesor AMD Ryzen. Harganya?…
May 25, 2026 - 0

Review Acer TravelMate X4 14 AI: Laptop Bisnis AI Cepat, Ringan & Produktif

Kata siapa bisnis UMKM ga butuh Laptop canggih?! Apalagi sekarang…
May 21, 2026 - 0

Review ASUS Zenbook DUO 2026 (UX8407AA): Desain Baru, Makin Kokoh, Makin Kenceng!

Kerja serius pakai laptop thin and light biasa? Kurang mantap…

Gaming

June 20, 2026 - 0

Epic Games Akan Rombak Store Launcher Supaya Lebih Cepat

Epic Games siapkan perombakan besar untuk Epic Games Store, dan…
June 20, 2026 - 0

Sony Mulai Andalkan AI untuk Masa Depan PlayStation

Sony mengungkap rencana penggunaan AI untuk pengembangan game, PS Store,…
June 19, 2026 - 0

Tanggal Rilis GTA 6 Hilang dari Situs Rockstar, Picu Kekhawatiran Akan Delay

Akibat hilangnya tanggal rilis GTA 6 dari situs Rockstar Games…
June 19, 2026 - 0

Pasar Game Global Cetak Rekor Pendapatan di Tengah Gelombang PHK

Pendapatan pasar game global tembus $201,6 miliar pada 2025, di…