Gemma 3n Resmi Dirilis, Kini Bisa Berjalan di RAM 2 GB
langgananinfo.com – Google baru saja meluncurkan Gemma 3n, model AI multimodal yang dapat berjalan langsung di smartphone dan perangkat edge. Berbeda dari model AI besar yang butuh koneksi internet cepat dan server cloud, Gemma 3n memungkinkan pemrosesan AI offline tanpa bergantung pada cloud. Teknologi ini membuka peluang baru bagi pengembang dan pengguna dengan perangkat berspesifikasi terbatas, sekaligus menjawab kebutuhan privasi data dan kecepatan respons.
“Baca Juga: TikTok Kembangkan Versi Baru Bernama M2 untuk Pengguna AS”
Gemma 3n dibangun dengan arsitektur inovatif bernama MatFormer (Matryoshka Transformer). Arsitektur ini berisi satu model besar dengan sub-model kecil yang bisa bekerja secara mandiri. Struktur ini memungkinkan Gemma 3n menyesuaikan performa dengan kemampuan perangkat, termasuk smartphone dengan RAM rendah. Dengan begitu, pengembang dapat memanfaatkan AI canggih di berbagai perangkat tanpa harus mengorbankan performa.
Google menyediakan dua varian Gemma 3n, yakni model E2B yang dapat berjalan di RAM 2GB dan model E4B untuk perangkat RAM 3GB. Meskipun memiliki parameter besar (5 miliar dan 8 miliar), Gemma 3n sangat efisien. Fitur seperti Per-Layer Embeddings (PLE) memindahkan beban kerja dari GPU ke CPU, dan KV Cache Sharing mempercepat pemrosesan audio-video berdurasi panjang hingga dua kali lebih cepat dari sebelumnya. Selain itu, optimasi ini memungkinkan penggunaan daya yang lebih hemat, sehingga baterai perangkat bisa lebih awet saat menjalankan aplikasi AI berat. Pendekatan ini juga mengurangi kebutuhan akan hardware canggih, membuka peluang untuk perangkat dengan spesifikasi rendah tetap bisa memanfaatkan kecanggihan AI modern.
Model ini dilengkapi dengan encoder suara dari Universal Speech Model Google yang mampu melakukan transkripsi dan terjemahan bahasa secara langsung di perangkat tanpa koneksi internet. Kinerjanya sangat baik untuk bahasa Eropa Barat seperti Spanyol, Prancis, Italia, dan Portugis. Untuk video, Gemma 3n memakai MobileNet-V5 yang bisa memproses gambar hingga 60 fps. Memberikan akurasi dan kecepatan unggul di perangkat seperti Google Pixel. Selain itu, Gemma 3n mendukung lebih dari 140 bahasa teks dan pemahaman multimodal di 35 bahasa.
“Baca Juga: Qualcomm Perkenalkan Snapdragon 8 Gen 3 Versi 6-Core”
Google membuka integrasi Gemma 3n melalui berbagai framework populer seperti Hugging Face Transformers, llama.cpp, Ollama, dan MLX. Developer dapat memilih platform yang paling sesuai untuk kebutuhan mereka dan melakukan penyesuaian lebih lanjut. Selain itu, Google menggelar Gemma 3n Impact Challenge dengan total hadiah USD 150.000. Kompetisi ini fokus pada aplikasi AI offline yang bermanfaat untuk daerah terpencil atau situasi yang sensitif terhadap privasi. Gemma 3n menegaskan visi AI yang pintar, cepat, dan bisa diakses di mana saja tanpa ketergantungan pada server pusat.