Google Perkenalkan Gemini 3.1 Flash-Lite, Model AI Lebih Cepat dan Murah untuk Skala Besar

AKURAT.CO Google memperkenalkan Gemini 3.1 Flash-Lite, model kecerdasan buatan (AI) terbaru dalam seri Gemini 3 yang menawarkan kecepatan tinggi dengan biaya lebih efisien. Model ini dirancang untuk pengembang yang membutuhkan pemrosesan AI skala besar dengan performa tetap optimal.
Saat ini, Gemini 3.1 Flash-Lite telah tersedia dalam tahap pratinjau untuk pengembang melalui Gemini API di Google AI Studio. Perusahaan juga dapat mengakses model tersebut melalui platform Vertex AI.
Google menekankan bahwa Flash-Lite merupakan model tercepat dan paling hemat biaya dalam seri Gemini 3. Pendekatan ini ditujukan untuk mendukung aplikasi AI yang memerlukan pemrosesan data dalam jumlah besar secara konsisten.
Dari sisi harga, model ini dibanderol sekitar $0,25 (sekitar Rp4 ribuan) per satu juta token input dan $1,50 (sekitar Rp25 ribuan) per satu juta token output. Biaya tersebut membuatnya lebih ekonomis dibandingkan model AI berukuran lebih besar dengan kemampuan serupa.
Dalam pengujian internal, Gemini 3.1 Flash-Lite disebut mampu memberikan respons lebih cepat dibandingkan generasi sebelumnya. Model ini memiliki 2,5 kali lebih cepat Time to First Answer Token dibandingkan Gemini 2.5 Flash.
Selain itu, kecepatan keluaran model meningkat hingga 45 persen, yang membantu mempercepat proses generasi teks atau respons AI. Latensi rendah ini penting untuk aplikasi yang membutuhkan interaksi real-time.
Pada berbagai benchmark, Gemini 3.1 Flash-Lite juga menunjukkan performa kompetitif. Model ini mencatat skor Elo 1432 di Arena.ai serta nilai 86,9 persen pada GPQA Diamond dan 76,8 persen pada MMMU Pro.
Hasil tersebut menunjukkan bahwa model ini mampu bersaing bahkan dengan model Gemini generasi sebelumnya yang lebih besar. Dengan kata lain, efisiensi biaya tidak mengorbankan kualitas pemahaman dan penalaran, sebagaimana dikutip dari laman resmi Google, Rabu (4/3/2026).
Google juga menyematkan fitur pengaturan tingkat pemikiran yang membuat pengembang dapat menentukan seberapa dalam model melakukan proses analisis. Fitur ini memberi fleksibilitas untuk menyesuaikan performa dengan kebutuhan aplikasi.
Beberapa perusahaan seperti Latitude, Cartwheel dan Whering sudah mulai menguji Gemini 3.1 Flash-Lite dalam penggunaan awal. Pengujian menunjukkan model ini mampu menangani input kompleks dengan baik sekaligus tetap efisien untuk penggunaan dalam skala besar.
Dilarang mengambil dan/atau menayangkan ulang sebagian atau keseluruhan artikel di atas untuk konten akun media sosial komersil tanpa seizin redaksi.
Berita Terkait
Berita Terkini









