Firma Google wprowadziła na rynek Gemini 3.1 Flash-Lite, najszybszy i najtańszy jak dotąd model Gemini 3, którego cena wynosi 0,25 dolara za milion tokenów wejściowych i 1,50 dolara za milion tokenów wyjściowych.
Model jest przeznaczony do dużych obciążeń programistycznych, przetwarzania danych i zadań tłumaczeniowych. Jest dostępna w wersji zapoznawczej za pośrednictwem interfejsu API Gemini w Google AI Studio i Vertex AI, ale nie jest zawarta w aplikacji konsumenckiej Gemini.
W porównaniu do Gemini 2.5 Flash-Lite nowa wersja jest droższa, ale znacznie bardziej wydajna. Generalnie przewyższa Gemini 2.5 Flash w niższej cenie.
Model przewyższa konkurencję m.in. GPT-5 mini i Claude 4.5 Haiku. Grok 4.1 Fast jest tańszy, ale Gemini 3.1 Flash-Lite jest szybszy, obiecując do 363 tokenów na sekundę.
W testach multimodalnych model zdobył 1432 punkty Elo w tabeli liderów Arena.ai. To plasuje go wśród modeli o otwartej wadze i ofert komercyjnych ostatniej generacji.
Google nie opublikował testów porównawczych agentów dla tej wersji. Firma stwierdziła, że model jest przeznaczony do zadań masowych i przetwarzania danych, a nie do zarządzania flotą agentów.
Programiści mogą używać interfejsu API do dostrojenia czasu wnioskowania modelu w celu kontroli kosztów. Niższe ustawienia rozumowania generują mniej tokenów, co jest istotne w przypadku obciążeń o dużej objętości.
To jest pierwsza wersja Flash-Lite dla Gemini 3.1. Google tradycyjnie najpierw uruchamia bardziej wydajne wersje Flash lub całkowicie pomija Flash-Lite, tak jak to miało miejsce w przypadku Gemini 3.
Google wypuściło Gemini 3.1 Pro dwa tygodnie wcześniej. Firma opisuje Flash-Lite jako przeznaczony do obsługi dużych obciążeń programistycznych na dużą skalę.








