Chiński startup AI Deepseek wydał V3.1, aktualizację swojego flagowego modelu V3, ustawionego jako rywal do GPT-5 Openai. Nowy model jest zoptymalizowany pod kątem chińskich układów i wyceniony na podcięcie Openai, co oznacza znaczący rozwój w globalnym krajobrazie AI.
V3.1 Deepseek został po cichu wypuszczony przez wiadomość na temat WeChat i platformę Hisging Face. To wydanie podkreśla ambicje Chin do opracowania i kontrolowania zaawansowanych systemów AI niezależnie od zagranicznych technologii.
Modele Deepseeka odnotowały powszechne przyjęcie w Chinach i wzrosły na całym świecie, nawet wśród niektórych amerykańskich firm wykorzystujących model rozumowania R1. Jednak wzniesiono obawy dotyczące wyników modeli zgodnych z chińskimi narracjami partii komunistycznej, potencjalnie wpływającej na ich neutralność.
Chiński sektor AI obejmuje również modele firm takich jak Alibaba, Moonsshot AI i Baidu. Wydanie Deepseek V3.1, po GPT-5 Openai, podkreśla determinację Chin do konkurowania z wiodącymi amerykańskimi laboratoriami.
Sam Altman, dyrektor generalny Openai, przyznał, że konkurencja ze strony chińskich modeli open source, w tym Deepseek, wpłynęła na decyzję Openai o wydaniu własnych modeli otwartych. Altman stwierdził: „Było jasne, że gdybyśmy tego nie zrobili, świat będzie zbudowany głównie na chińskich modelach typu open source. Na pewno był to czynnik naszej decyzji. Nie był jedyny, ale ten był duży”.
Rząd USA udzielił licencji NVIDIA i AMD na eksport układów AI specyficznych dla Chin, w tym H20 NVIDIA, pod warunkiem, że 15% przychodów z tej sprzedaży trafia do Waszyngtonu. W odpowiedzi Pekin przeprowadził się, aby ograniczyć zakupy nvidia po oświadczeniach sekretarza handlu Howarda Lutnicka, wskazując ograniczenia sprzedaży czołgów najwyższego poziomu do Chin. Lutnick stwierdził 15 lipca: „Nie sprzedajemy im naszych najlepszych rzeczy, nie naszych drugich najlepszych rzeczy, nawet trzeciej najlepszych”.
Optymalizacja Deepseek dla chińskich układów Chips sygnalizuje strategię łagodzącą wpływ kontroli eksportu USA. Firma wspomniała w swoim poście WeChat, że nowy format modelu został zaprojektowany do „niedługo wydanych krajowych układów nowej generacji”.
Altman wyraził obawy dotyczące niedoceniania postępów Chin w sztucznej inteligencji i zasugerował, że kontrola eksportu może nie być wystarczającym rozwiązaniem. Zauważył: „Martwię się o Chiny”.
Model v3.1 jest godny uwagi ze względu na specyfikacje techniczne, w tym 685 miliardów parametrów. Jego konstrukcja „mieszanki ekspertów” ma na celu obniżenie kosztów obliczeniowych dla programistów poprzez aktywację tylko ułamka modelu dla każdego zapytania. W przeciwieństwie do poprzednich modeli DeepSeek, które oddzielają zadania oparte na wymaganiach dotyczących wstępnego i rozumowania, V3.1 łączy zarówno szybkie odpowiedzi, jak i rozumowanie w jednym systemie.
Ta hybrydowa architektura jest znaczącym postępem, jak zauważył analityk technologii Ben Dickson, założyciel bloga TechTalks. Stwierdził, że hybrydowa architektura v3.1 jest zdecydowanie „największą cechą”.
Source: Chińskie Deepseek v3.1 podcinają Openai z tańszymi cenami








