Samsung Luncurkan TRUEBench, Benchmark Khusus Model AI

Author
Irham
Reading time:
September 29, 2025

Samsung baru saja mengumumkan aplikasi benchmark buatan mereka sendiri yaitu TRUEBench. Aplikasi benchmark ini dirancang khusus untuk mengukur kecerdasan buatan alias AI, sejauh mana bisa membantu produktivitas di dunia kerja nyata. Benchmark ini dikembangkan langsung oleh Samsung Research, dimana benchmark ini dirancang untuk menilai performa large language models (LLM) dalam menyelesaikan tugas sehari-hari di lingkungan profesional.

Benchmark AI Samsung TrueBench

Keunggulan Benchmark TRUEBench

Berbeda dari benchmark yang sudah ada, TRUEBench menawarkan cakupan yang lebih luas. Ada 10 kategori dengan 46 sub-kategori yang digunakan sebagai tolok ukur, mencakup berbagai kebutuhan seperti pembuatan konten, analisis data, ringkasan, hingga terjemahan. Totalnya, Samsung menyiapkan 2.485 set pengujian yang tidak hanya menggunakan bahasa Inggris, tapi juga 12 bahasa lain termasuk Korea, Jepang, Mandarin, Spanyol, hingga Vietnam.

Skala pengujiannya pun cukup realistis. Mulai dari permintaan singkat sepanjang 8 karakter, sampai ringkasan dokumen dengan panjang lebih dari 20.000 karakter. Semua ini dirancang untuk menggambarkan tantangan nyata di dunia kerja.

Baca Juga: Samsung Odyssey OLED G5 G50SF Resmi Hadir di Indonesia • Jagat Review

Benchmark AI Samsung TrueBench

TRUEBench tidak memberikan penilaian sekadar benar atau salahnya jawaban AI. Benchmark ini juga menghitung faktor kebutuhan implisit pengguna yang sering kali tidak tertulis secara langsung. Untuk memastikan hasil lebih objektif, evaluasi tidak hanya dibuat pakai mesin, tapi juga kolaborasi dari manusia dan AI, lalu disempurnakan secara berulang. Berikutnya, evaluasi bakal dilakukan secara otomatis menggunakan patokan yang sudah dibuat sebagai standar ini, sehingga hasilnya diharapkan bisa konsisten dan minim bias.

Buat para peneliti dan juga pengembang, Samsung juga membuka akses ke data sampel dan leaderboard TRUEBench di platform Hugging Face. Pengguna bisa membandingkan performa hingga lima model AI sekaligus, termasuk melihat data tambahan seperti panjang rata-rata jawaban untuk mengukur efisiensi.

Tapi, perlu digaris bawahi, benchmark ini hanya digunakan untuk menguji kemampuan sebuah model LLM, bukan untuk menguji performa sistem atau perangkat keras dalam memproses AI.

Sumber

Share
Load Comments

Gadget

July 10, 2025 - 0

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Fossil mengumumkan hadrinya dua jam tangan eksklusif hasil kolaborasi Marvel…
June 18, 2025 - 0

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Ini hape yang memicu Pro-kontra.  Banyak orang, bahkan kami pun…
June 17, 2025 - 0

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Kalian sedang cari smartwatch bentuk kotak yang canggih, baterai irit,…
June 17, 2025 - 0

Review Huawei nova 13 Pro: Kamera Selfie Terbaik, Desain Keren!

Huawei nova akhirnya balik lagi ke Indonesia! Ini adalah smartphone…

Laptop

September 29, 2025 - 0

Podcast: Apa Hebatnya Laptop AI? Buka-Bukaan dengan ASUS!

Belakangan ini kata “Laptop AI” semakin sering kedengaran. Biasanya ini…
September 24, 2025 - 0

Review ASUS Gaming V16 (V3607VM) 2025: Kombo Kencang-Terjangkau Buat Main Game dan Kerja

  Jujur deh ASUS, kalian bikin Laptop Gaming atau Laptop…
September 19, 2025 - 0

Review Lenovo Legion 5 (15AKP10): Laptop Gaming Performa Kencang Cocok Buat Kerja

Ini adalah Laptop Gaming Copilot+ PC pertama dari Lenovo! Prosesornya…
September 14, 2025 - 0

Rekomendasi Laptop Gaming Rp 10-15 Juta 2025 (September)

Untuk kebutuhan kerja yang berat, biasanya kita butuh laptop yang…

Gaming

September 30, 2025 - 0

Rumor: Game Lord of the Rings Baru Dikabarkan Dalam Pengembangan

Setelah cukup lama tidak digarap dengan baik, dikabarkan game baru…
September 30, 2025 - 0

Developer Escape from Tarkov Janjikan Tetap Dukung Game Setelah 1.0 Rilis

Peralihan Escape from Tarkov dari early access ke full release…
September 30, 2025 - 0

Rumor: Harga ROG Raikiri II Xbox Controller Diklaim Lebih Dari $150

ROG Raikiri II Xbox Controller yang kompatibel dengan handheld console…
September 30, 2025 - 0

Lebih Dari 50% Developer Jepang Gunakan AI Untuk Membuat Game

Penggunaan bantuan AI ternyata menjadi hal lumrah untuk developer game…