Gemini 1.5 Flash-8B akhirnya rilis dengan performa lebih cepat dan ringan. Yuk, intip bocorannya!
Setelah sukses dengan model bahasa AI atau kecerdasan buatan pada Mei 2024 lalu, Gemini 1.5 Flash, Google kembali kejutkan dengan versi pembaruannya. AI yang diberi Gemini 1.5 Flash-8B ini hadir dengan banyak peningkatan untuk membuat pengguna merasa lebih nyaman dan terbantu ketika menggunakannya.
Katanya, Gemini 1.5 Flash-8B hadir dengan bobot lebih ringan dan semakin cepat dalam memproses prompt atau perintah. Benarkah? Yuk, cek detailnya!
Gemini 1.5 Flash-8B Hadir dengan Lebih Ringan dan Cepat
Pada awal kehadirannya di bulan Mei, Gemini 1.5 Flash sudah mempunyai kemampuan memberikan respon cepat daripada mode Gemini lain ketika pengguna mengajukan pertanyaan atau perintah.
Lalu, dengan pembaharuannya ini, layanan tersebut hadir dengan respon lebih cepat lagi untuk membantumu.
Tidak hanya itu, rate limit prompt atau permintaan pada AI ini sekarang juga sudah dua kali lipat. Jika pada awalnya totalnya adalah 2.000 request per menitnya, sekarang request-nya mencapai 4.000.
Tidak sampai di situ, jeda respon atau latensi pada model AI ini lebih rendah, sehingga layanannya semakin efisien dan ringan. Hal ini akan semakin terasa saat AI tersebut menjawab beberapa prompt yang mereka anggap ringan atau tidak butuh banyak sumber.
Berkat hal itu pulalah, Gemini 1.5 Flash-8B bisa memberikan respon dan menjalankan tugasnya dengan lebih cepat dan baik. Ini tercermin pada beberapa respon mereka, seperti:
- Melakukan transkrip audio dengan real time, sehingga cocok bagi aplikasi yang butuh menjalankan tugas konversi suara menjadi teks.
- Menjawab pertanyaan secara cepat, sehingga cocok dalam bidang asisten virtual, layanan pelanggan, hingga aplikasi dengan basis pengetahuan.
- Menerjemahkan bahasa asing secara cepat dan akurat.
Pengembang Bisa Uji Coba Gratis Gemini 1.5 Flash-8B Sebelum Berlangganan
Bukan hanya tampil dengan performa yang kencang dan ringan, pemanfaatan Gemini 1.5 Flash-8B untuk aplikasi (AP1) sekarang pun sudah lebih murah 50% daripada versi 1.5 Flash.
Pengurangan harga berlangganan ini hadir dalam bermacam layanannya, seperti input, output, storage, dan caching.
Karena adanya penurunan harga tersebut, nantinya para pengembang atau developer bisa membuat aplikasi dengan AI secara ekonomis, tapi mampu menjalankan kemampuan kompleks dan beban kerja besar.
Sebelum memutuskan untuk menggunakan layanan berbayarnya, para pengembang bisa mendapatkan uji coba gratis lebih dulu. Jika kamu salah satunya, maka akses gratis tersebut dapat ditemukan pada Gemini API dan Google AI Studio.
Pemberian akses gratis tersebut bertujuan untuk membuat semakin banyak developer yang berminat untuk menerapkan teknologi AI yang canggih ini dalam menunjang proyek mereka.
Untuk melakukan uji coba ini, kamu akan mendapatkan token yang terbatas. Namun ketika tokennya sudah habis, mau tak mau kamu harus membayarnya sesuai tarif yang sudah diberikan sebelumnya.
Nah, setelah masa uji coba, model AI ini mulai menerapkan sistem berbayar mulai tanggal 14 Oktober 2024 mendatang.
Dengan begitu, para pengembang yang tertarik setelah melakukan uji coba, sudah bisa mulai menciptakan aplikasinya sendiri. Dengan layanan berbayar, kamu bisa membuat aplikasi secara hemat dan berperforma AI sesuai kemampuan dan kategori yang diinginkan.
Berkat semua benefit yang layanan ini berikan bagi pengembang, maka rasanya mengeluarkan sejumlah uang untuk langganan token, bukanlah hal buruk.