DeepSeek wprowadził na rynek nowy model sztucznej inteligencji, DeepSeek V4, twierdząc, że ma lepszą wydajność zoptymalizowaną pod kątem chipów produkowanych w kraju w Chinach. Model zawiera bardzo długi kontekst składający się z miliona słów, zwiększający możliwości agenta, wiedzę o świecie i wydajność rozumowania.
DeepSeek V4 jest dostępny w dwóch wersjach: DeepSeek V4-Pro i DeepSeek V4-Flash. Firma opisuje tę drugą opcję jako bardziej wydajną i ekonomiczną opcję. Według DeepSeek, V4-Pro znacznie przewyższa inne modele typu open source w światowych testach porównawczych wiedzy i tylko nieznacznie przewyższa model Google o zamkniętym kodzie źródłowym, Gemini-Pro-3.1.
Wariant V4-Pro zawiera „tryb maksymalnego wysiłku wnioskowania”, zaprojektowany w celu zwiększenia możliwości wiedzy modeli open source, ustanawiając go jako czołowego konkurenta w tej przestrzeni. DeepSeek spowodował już wcześniej wyprzedaż na giełdzie wartą bilion dolarów dzięki swojemu wcześniejszemu modelowi R1, który stanowił wyzwanie dla systemów sztucznej inteligencji, takich jak ChatGPT OpenAI, przy niższych kosztach rozwoju.
Zeszłoroczna premiera R1 przyniosła znaczne straty największym firmom technologicznym, a Nvidia poniosła straty w wysokości ponad 500 miliardów dolarów w ciągu jednego dnia. Premiera była także pierwszą poważną konkurencją chińskiej firmy zajmującej się sztuczną inteligencją z uznanymi amerykańskimi gigantami technologicznymi. Premiera DeepSeek następuje w związku z ograniczeniami eksportu półprzewodników z USA do Chin, szczególnie wpływającymi na wysokiej klasy procesory graficzne niezbędne do rozwoju sztucznej inteligencji.
System chipów użyty do treningu DeepSeek V4 nie został ujawniony, ale firma stwierdziła, że obsługuje zarówno chipy Nvidia, jak i Huawei. DeepSeek V4 może przetworzyć do 384 000 tokenów, czyli podstawowej jednostki danych dla modeli AI. Oznacza to znaczną poprawę w stosunku do swojego poprzednika, V3, który zarządzał jedynie 128 000 tokenów.
Aktualizacja umożliwia analizę wielu dokumentów, umożliwiając sztucznej inteligencji zrozumienie całych książek i baz danych z pełnym kodem. Firma twierdzi, że ta funkcja stanowi „dramatyczny skok w wydajności obliczeniowej” i inicjuje nową erę dużych modeli językowych z kontekstami o długości miliona.
DeepSeek V4-Pro przewyższa Gemini-3.1-Pro firmy Google, ale nadal pozostaje w tyle za modelem Claude Opus 4.6 firmy Anthropic. Celem DeepSeek jest dalsze zwiększanie inteligencji, solidności i użyteczności modelu w różnych zadaniach i scenariuszach.








