Salah Ketik Buat Sistem Amazon Web Services Kacau
Beberapa hari lalu, sebagian pengguna layanan Amazon Web Services mendapati bahwa layanan tersebut tidak beroperasi sebagaimana mestinya. Hal itu membuat banyak situs besar dan aplikasi yang ditempatkan di layanan tersebut tidak bisa diakses. Setelah berjuang selama beberapa jam, Amazon akhirnya berhasil memperbaiki masalah tersebut. Kini mereka menyebutkan apa penyebab hal tersebut.

Kesalahan Kecil Saat Maintenance
Amazon mengakui bahwa terjadi human error yang menyebabkan masalah yang terbilang besar tersebut terjadi. Saat mencoba mengatasi masalah di beberapa server mereka, salah satu karyawan Amazon salah mengetikkan perintah yang justru membuat lebih banyak server dimatikan dari yang seharusnya. Sialnya, server yang tidak sengaja dimatikan itu justru memegang peran yang besar di sistem AWS.
Akibat dari kesalahan kecil ini, berbagai situs ternama seperti Netflix dan Reddit tidak bisa diakses untuk beberapa jam. Memang, karena besarnya data yang tersimpan di server-server yang tidak sengaja dimatikan saat manitenance itu, sistem membutuhkan waktu beberapa jam hingga bisa beroperasi normal lagi. Server-server itu sendiri disebut menangani index subsystem dan placement subsystem, yang memang sangatlah krusial di sistem AWS secara keseluruhan.
Janjikan Pencegahan Masalah Serupa
Sebagai imbas dari masalah ini, Amazon langsung menjanjikan perbaikan untuk mengatasi masalah serupa terjadi lagi di kemudian hari. Beberapa perbaikan yang sudah disiapkan Amazon di antaranya adalah mengubah bagaimana tool yang digunakan untuk mematikan server bekerja, sehingga karyawan mereka bisa melakukan koreksi bila ada kesalahan di perintah yang dimasukkan. Selain itu, Amazon juga siap mengubah index subsystem, membuatnya lebih ringan dengan melakukan beberapa operasi tertentu yang bisa membantu mempercepat waktu booting server.