Samsung Luncurkan TRUEBench, Benchmark Khusus Model AI

Author
Irham
Reading time:
September 29, 2025

Samsung baru saja mengumumkan aplikasi benchmark buatan mereka sendiri yaitu TRUEBench. Aplikasi benchmark ini dirancang khusus untuk mengukur kecerdasan buatan alias AI, sejauh mana bisa membantu produktivitas di dunia kerja nyata. Benchmark ini dikembangkan langsung oleh Samsung Research, dimana benchmark ini dirancang untuk menilai performa large language models (LLM) dalam menyelesaikan tugas sehari-hari di lingkungan profesional.

Benchmark AI Samsung TrueBench

Keunggulan Benchmark TRUEBench

Berbeda dari benchmark yang sudah ada, TRUEBench menawarkan cakupan yang lebih luas. Ada 10 kategori dengan 46 sub-kategori yang digunakan sebagai tolok ukur, mencakup berbagai kebutuhan seperti pembuatan konten, analisis data, ringkasan, hingga terjemahan. Totalnya, Samsung menyiapkan 2.485 set pengujian yang tidak hanya menggunakan bahasa Inggris, tapi juga 12 bahasa lain termasuk Korea, Jepang, Mandarin, Spanyol, hingga Vietnam.

Skala pengujiannya pun cukup realistis. Mulai dari permintaan singkat sepanjang 8 karakter, sampai ringkasan dokumen dengan panjang lebih dari 20.000 karakter. Semua ini dirancang untuk menggambarkan tantangan nyata di dunia kerja.

Baca Juga: Samsung Odyssey OLED G5 G50SF Resmi Hadir di Indonesia • Jagat Review

Benchmark AI Samsung TrueBench

TRUEBench tidak memberikan penilaian sekadar benar atau salahnya jawaban AI. Benchmark ini juga menghitung faktor kebutuhan implisit pengguna yang sering kali tidak tertulis secara langsung. Untuk memastikan hasil lebih objektif, evaluasi tidak hanya dibuat pakai mesin, tapi juga kolaborasi dari manusia dan AI, lalu disempurnakan secara berulang. Berikutnya, evaluasi bakal dilakukan secara otomatis menggunakan patokan yang sudah dibuat sebagai standar ini, sehingga hasilnya diharapkan bisa konsisten dan minim bias.

Buat para peneliti dan juga pengembang, Samsung juga membuka akses ke data sampel dan leaderboard TRUEBench di platform Hugging Face. Pengguna bisa membandingkan performa hingga lima model AI sekaligus, termasuk melihat data tambahan seperti panjang rata-rata jawaban untuk mengukur efisiensi.

Tapi, perlu digaris bawahi, benchmark ini hanya digunakan untuk menguji kemampuan sebuah model LLM, bukan untuk menguji performa sistem atau perangkat keras dalam memproses AI.

Sumber

Share
Load Comments

Gadget

October 19, 2025 - 0

Review Infinix GT 30: Smartphone Gaming Padahal Aslinya All-Rounder!

Ini adalah Infinix GT 30! Ya, hape ini adalah versi…
July 10, 2025 - 0

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Fossil mengumumkan hadrinya dua jam tangan eksklusif hasil kolaborasi Marvel…
June 18, 2025 - 0

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Ini hape yang memicu Pro-kontra.  Banyak orang, bahkan kami pun…
June 17, 2025 - 0

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Kalian sedang cari smartwatch bentuk kotak yang canggih, baterai irit,…

Laptop

November 8, 2025 - 0

Review Axioo Hype-R X8 OLED: Laptop AMD Ryzen PRO Rp 8 Jutaan

Setelah sebelumnya menggunakan prosesor Intel, Laptop Axioo Hype-R kini hadir…
November 7, 2025 - 0

Review Acer Swift Go 14 AI (2025): Desain Cantik, Layar Mewah, Baterai Tahan Seharian!

Ini adalah laptop yang cocok banget diajak kerja outdoor. Karena…
November 4, 2025 - 0

Seri Mengenal Laptop Gaming feat. HP – Part 4: Ini Rahasia Kenapa Performa Laptop Gaming Lebih Kencang!

Kita semua tahu Laptop Gaming itu bisa kencang karena menggunakan…
October 28, 2025 - 0

Review Acer Nitro V 15 (2025): Laptop RTX 5050 Ternyata Sekencang Ini!

Ini Laptop Gaming terjangkau dari Acer dengan GPU RTX 50…

Gaming

November 17, 2025 - 0

ARC Raiders Tetap Dominasi Steam Pasca Rilis Escape from Tarkov

ARC Raiders menembus rekor baru peak player di Steam, di…
November 17, 2025 - 0

Guerrilla Games Pastikan Proyek Game Multiplayer Horizon Akan Hadir

Guerrilla Games menegaskan bahwa mereka menyiapkan game multiplayer Horizon mereka…
November 17, 2025 - 0

Escape from Tarkov Akhirnya Berikan Tutorial untuk Pemain Baru

Siapa sangka, butuh waktu satu dekade untuk Escape from Tarkov…
November 17, 2025 - 0

Horizon Steel Frontiers Gunakan AI Secara Agresif dalam Pengembangannya

Tim developer Horizon Steel Frontiers akui gunakan begitu banyak teknologi…