DeepSeek ogłosił znaczne obniżki cen swojej usługi API w sobotę, wkrótce po wypuszczeniu na rynek wielkojęzycznego modelu V4 24 kwietnia 2023 r. Cena obniża opłaty za trafienie w pamięć podręczną danych wejściowych do jednej dziesiątej poprzednich opłat i oferuje 75% zniżki na model V4-Pro do 5 maja 2023 r.

Hitowa cena wejściowej pamięci podręcznej V4-Pro spadła do 0,025 juana (około 0,0036 dolara) za milion tokenów. Ceny standardowe w okresie promocyjnym wynoszą 3 juany za wkład i 6 juanów za milion tokenów. Według danych OpenRouter ta strategia cenowa wyraźnie podcina konkurencję, a modele firm Anthropic, OpenAI i Google kosztują od 12 do 25 dolarów za milion tokenów.

DeepSeek uruchomił V4-Pro i V4-Flash w wersji zapoznawczej, co oznaczało pierwszą znaczącą premierę modelu od czasu wersji V3.2 w grudniu 2022 r. V4-Pro ma 1,6 biliona parametrów i 49 miliardów aktywnych parametrów na przebieg wnioskowania, co czyni go największym obecnie dostępnym modelem o otwartej wadze. V4-Flash charakteryzuje się mniejszą konfiguracją z 284 miliardami parametrów.

Jeszcze przed ostatnimi obniżkami standardowe ceny V4-Pro wynosiły 1,74 dolara za milion tokenów wejściowych i 3,48 dolara za milion tokenów, czyli o około 98% mniej niż cena GPT-5.5 Pro OpenAI. Najnowsze rabaty jeszcze bardziej poszerzają tę przewagę konkurencyjną.

  Meta pracuje nad klonem sztucznej inteligencji dyrektora generalnego Marka Zuckerberga

W obliczu rosnących kosztów mocy obliczeniowej w sektorze sztucznej inteligencji strategia DeepSeek wpisuje się w szerszy trend obniżek cen w branży. Według raportu Gelonghui firma w pełni przyjęła koncepcję „obniżki cen sztucznej inteligencji”.

Warto zauważyć, że V4 działa na sprzęcie Huawei Ascend zamiast na chipach Nvidia, co według obserwatorów może zwiększyć krajowe przyjęcie systemów sztucznej inteligencji. Wei Sun, główny analityk AI w Counterpoint Research, wskazał, że rozwój ten pozwala na wdrażanie systemów AI bez polegania wyłącznie na Nvidii, co potencjalnie przyspiesza rozwój sztucznej inteligencji zarówno w kraju, jak i na świecie.

V4-Pro wykazuje znaczną wydajność, wymagając jedynie 27% mocy obliczeniowej swojego poprzednika, V3.2, dla okna kontekstowego zawierającego milion tokenów. Pomimo swoich udoskonaleń firma DeepSeek przyznaje, że V4 pozostaje w tyle za wiodącymi modelami, takimi jak GPT-5.4 i Gemini 3.1 Pro, pod względem wydajności o około trzy do sześciu miesięcy, jak stwierdzono w dokumencie technicznym firmy.

  BBC Verify: Konflikt amerykańsko-irański przyniósł rekordową liczbę fałszywych treści

Autor wyróżnionego zdjęcia