Samsung Luncurkan TRUEBench, Benchmark Khusus Model AI

Author
Irham
Reading time:
September 29, 2025

Samsung baru saja mengumumkan aplikasi benchmark buatan mereka sendiri yaitu TRUEBench. Aplikasi benchmark ini dirancang khusus untuk mengukur kecerdasan buatan alias AI, sejauh mana bisa membantu produktivitas di dunia kerja nyata. Benchmark ini dikembangkan langsung oleh Samsung Research, dimana benchmark ini dirancang untuk menilai performa large language models (LLM) dalam menyelesaikan tugas sehari-hari di lingkungan profesional.

Benchmark AI Samsung TrueBench

Keunggulan Benchmark TRUEBench

Berbeda dari benchmark yang sudah ada, TRUEBench menawarkan cakupan yang lebih luas. Ada 10 kategori dengan 46 sub-kategori yang digunakan sebagai tolok ukur, mencakup berbagai kebutuhan seperti pembuatan konten, analisis data, ringkasan, hingga terjemahan. Totalnya, Samsung menyiapkan 2.485 set pengujian yang tidak hanya menggunakan bahasa Inggris, tapi juga 12 bahasa lain termasuk Korea, Jepang, Mandarin, Spanyol, hingga Vietnam.

Skala pengujiannya pun cukup realistis. Mulai dari permintaan singkat sepanjang 8 karakter, sampai ringkasan dokumen dengan panjang lebih dari 20.000 karakter. Semua ini dirancang untuk menggambarkan tantangan nyata di dunia kerja.

Baca Juga: Samsung Odyssey OLED G5 G50SF Resmi Hadir di Indonesia • Jagat Review

Benchmark AI Samsung TrueBench

TRUEBench tidak memberikan penilaian sekadar benar atau salahnya jawaban AI. Benchmark ini juga menghitung faktor kebutuhan implisit pengguna yang sering kali tidak tertulis secara langsung. Untuk memastikan hasil lebih objektif, evaluasi tidak hanya dibuat pakai mesin, tapi juga kolaborasi dari manusia dan AI, lalu disempurnakan secara berulang. Berikutnya, evaluasi bakal dilakukan secara otomatis menggunakan patokan yang sudah dibuat sebagai standar ini, sehingga hasilnya diharapkan bisa konsisten dan minim bias.

Buat para peneliti dan juga pengembang, Samsung juga membuka akses ke data sampel dan leaderboard TRUEBench di platform Hugging Face. Pengguna bisa membandingkan performa hingga lima model AI sekaligus, termasuk melihat data tambahan seperti panjang rata-rata jawaban untuk mengukur efisiensi.

Tapi, perlu digaris bawahi, benchmark ini hanya digunakan untuk menguji kemampuan sebuah model LLM, bukan untuk menguji performa sistem atau perangkat keras dalam memproses AI.

Sumber

Share
Load Comments

Gadget

October 19, 2025 - 0

Review Infinix GT 30: Smartphone Gaming Padahal Aslinya All-Rounder!

Ini adalah Infinix GT 30! Ya, hape ini adalah versi…
July 10, 2025 - 0

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Fossil mengumumkan hadrinya dua jam tangan eksklusif hasil kolaborasi Marvel…
June 18, 2025 - 0

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Ini hape yang memicu Pro-kontra.  Banyak orang, bahkan kami pun…
June 17, 2025 - 0

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Kalian sedang cari smartwatch bentuk kotak yang canggih, baterai irit,…

Laptop

April 13, 2026 - 0

Review Axioo Hype AI 5: Racikan Kencang Merk Lokal dengan Intel Core Ultra

Ini Laptop tipis dan ringan pertama dari Axioo dengan prosesor…
April 10, 2026 - 0

Review ADVAN Workplus AI: Makin “Plus” Buat Kerja Berat dan Main Game

Laptop tipis dan ringan ini punya tipe GPU yang mirip…
March 26, 2026 - 0

Review ASUS Zenbook S16 OLED (UM5606GA): Tipis dan Ringan tapi Kencang dan Kekinian!

Ini adalah ASUS Zenbook S 16 OLED keluaran 2026. Desainnya…

Gaming

April 25, 2026 - 0

Update Besar Slay the Spire 2 Picu Gelombang Review Negatif

Kehadiran update besar untuk Slay the Spire 2 justru memicu…
April 25, 2026 - 0

Xbox Fokus Perkuat Game Pass Dengan Tekankan Harga dan Fleksibilitas

Xbox tetapkan Game Pass sebagai prioritas layanan utama, dengan fokus…
April 24, 2026 - 0

Avalanche Studios Buka Rekrutmen untuk Proyek Game AAA Baru

Kreator dari seri Just Cause, Avalanche Studios, membuka rekrutmen untuk…
April 24, 2026 - 0

Xbox Tinggalkan Branding Microsoft Gaming & Siap Evaluasi Eksklusivitas

Xbox resmi kembali ke branding lama mereka, sambil siapkan untuk…