Pelatihan Model AI Semakin Mahal, DeepSeek Tawarkan Metode Baru Bernama mHC

Bagikan ke :

SMJTimes.com – Berawal dari pelatihan model kecerdasan buatan atau artificial intelligence (AI) berukuran besar yang semakin mahal dan boros energi, sebuah platform DeepSeek menawarkan pendekatan baru yang dapat mengurangi pemborosan tersebut menjadi lebih stabil.

Melansir dari Detik, DeepSeek melalui makalah riset terbarunya berhasil memperkenalkan metode bernama manifold-constrained hyperconnection (mHC) yang difokuskan pada stabilitas pelatihan model AI berskala besar yang selama ini kerap menjadi sumber masalah bagi industri teknologi.

Hal ini bermula dari sebuah fakta terkait dengan banyaknya model AI canggih yang terpaksa mengalami kegagalan di tengah proses pelatihan.

Pengulangan dari kegagalan tersebut sama dengan membuang banyak waktu, konsumsi listrik, serta ribuan jam komputasi GPU yang membuat biaya pengembangan melonjak tajam.

Oleh sebab itu, mHC diperkenalan sebagai bentuk penjagaan terhadap perilaku model agar tetap berada dalam batas wajar yang lebih terkontrol selama proses pelatihan, agar hasil akhir dapat berpeluang lebih besar tanpa perlu pengulangan.

Meskipun mHC tidak secara langsung membuat GPU menjadi lebih hemat daya, namun metode tersebut berpotensi mampu mengurangi energi yang terbuang. Hal ini dinilai lebih efektif daripada melalui perubahan dalam perangkat kerasnya.

Selain itu, stabilitas pelatihan juga dinilai dapat mengurangi ketergantungan industri pada pendekatan “brute force“, seperti penambahan jumlah GPU, kapasitas memori yang diperbesar, atau perpanjangan waktu pelatihan hanya demi menjaga model tetap berjalan.

Riset ini diposisikan sebagai langkah penting dalam memaksimalkan pemanfaatan infrastruktur yang sudah ada. Di tengah tekanan ekonomi dan lingkungan yang meningkat, efisiensi seperti kehadiran mHC ini menjadi semakin krusial. (*)

Komentar