Firma Google wprowadziła na rynek Gemini 3.1 Flash-Lite, najszybszy i najtańszy jak dotąd model Gemini 3, którego cena wynosi 0,25 dolara za milion tokenów wejściowych i 1,50 dolara za milion tokenów wyjściowych.

Model jest przeznaczony do dużych obciążeń programistycznych, przetwarzania danych i zadań tłumaczeniowych. Jest dostępna w wersji zapoznawczej za pośrednictwem interfejsu API Gemini w Google AI Studio i Vertex AI, ale nie jest zawarta w aplikacji konsumenckiej Gemini.

W porównaniu do Gemini 2.5 Flash-Lite nowa wersja jest droższa, ale znacznie bardziej wydajna. Generalnie przewyższa Gemini 2.5 Flash w niższej cenie.

Model przewyższa konkurencję m.in. GPT-5 mini i Claude 4.5 Haiku. Grok 4.1 Fast jest tańszy, ale Gemini 3.1 Flash-Lite jest szybszy, obiecując do 363 tokenów na sekundę.

  Jak wyłączyć odległość ekranu w iOS 17?

W testach multimodalnych model zdobył 1432 punkty Elo w tabeli liderów Arena.ai. To plasuje go wśród modeli o otwartej wadze i ofert komercyjnych ostatniej generacji.

Google nie opublikował testów porównawczych agentów dla tej wersji. Firma stwierdziła, że ​​model jest przeznaczony do zadań masowych i przetwarzania danych, a nie do zarządzania flotą agentów.

Programiści mogą używać interfejsu API do dostrojenia czasu wnioskowania modelu w celu kontroli kosztów. Niższe ustawienia rozumowania generują mniej tokenów, co jest istotne w przypadku obciążeń o dużej objętości.

To jest pierwsza wersja Flash-Lite dla Gemini 3.1. Google tradycyjnie najpierw uruchamia bardziej wydajne wersje Flash lub całkowicie pomija Flash-Lite, tak jak to miało miejsce w przypadku Gemini 3.

Google wypuściło Gemini 3.1 Pro dwa tygodnie wcześniej. Firma opisuje Flash-Lite jako przeznaczony do obsługi dużych obciążeń programistycznych na dużą skalę.

Autor wyróżnionego zdjęcia