Apa Itu Small Language Models (SLMs)?
SLM adalah versi ringkas dari model bahasa besar (LLM) yang memiliki jumlah parameter jauh lebih sedikit, biasanya berkisar antara beberapa juta hingga beberapa miliar, berbeda dengan LLM yang memiliki ratusan miliar parameter.
Meskipun ukurannya lebih kecil, SLM dirancang untuk tugas-tugas spesifik dengan akurasi tinggi, seringkali dilatih menggunakan teknik penyulingan pengetahuan dari model yang lebih besar.Mengapa Perusahaan Beralih ke SLM?
Berikut adalah alasan utama mengapa raksasa teknologi dan perusahaan beralih ke model ini:
1. Efisiensi Energi dan Biaya Infrastruktur
2. Kemampuan Edge AI: Berjalan di Laptop dan HP
3. Privasi dan Keamanan Data
Pemain Utama dalam Tren SLM
Beberapa model kecil yang telah membuktikan bahwa ukuran bukanlah segalanya meliputi:
Microsoft Phi-3: Model ini dirancang untuk berjalan di ponsel namun memiliki kemampuan penalaran linguistik yang mampu menyaingi model sebesar ChatGPT (GPT-3.5) dalam tolok ukur tertentu.
Google Gemma 2: Varian model terbuka dari Google yang dibangun dengan teknologi yang sama dengan Gemini, menawarkan performa tinggi dalam paket yang ringan (mulai dari 2 miliar parameter)
. Mistral 7B: Model ini terkenal karena efisiensinya, di mana ia mampu mengungguli model Llama 2 13B (yang ukurannya hampir dua kali lipat) di semua tolok ukur standar.
Apple OpenELM: Model sumber terbuka yang dioptimalkan secara spesifik untuk berjalan efisien di perangkat Apple seperti iPhone dan Mac, memprioritaskan privasi pengguna.
