Według Whale Lab zarówno DeepSeek V4, jak i nowy model Tencent Hunyuan mają zostać wprowadzone na rynek w kwietniu 2026 roku.
Te jednoczesne publikacje wskazują na przyspieszenie rozwoju sztucznej inteligencji (AI) w Chinach, skupiając się na praktycznych zastosowaniach, a nie na wydajności wzorcowej.
DeepSeek V4 jest opisywany jako multimodalny duży model zdolny do generowania tekstu, obrazów i wideo. Model ma na celu poprawę możliwości kodowania i pamięci długotrwałej, co jest znanym wyzwaniem w przypadku dużych modeli językowych.
Wcześniejsze raporty, w tym jeden z Financial Times, sugerowały marcową premierę DeepSeek V4. Lżejszy wariant, „V4 Lite”, pojawił się na stronie internetowej DeepSeek 9 marca.
Whale Lab poinformowało, że na platformie OpenRouter pojawiły się dwa modele, „Healer Alpha” i „Hunter Alpha”, co sugeruje, że mogą to być wczesne wersje DeepSeek V4. Hunter Alpha jest opisywany jako model o bilionach parametrów z oknem kontekstowym zawierającym milion tokenów. Healer Alpha jest reklamowany jako model multimodalny z rozumowaniem międzymodalnym. Żaden podmiot nie zgłosił oficjalnie roszczeń do tych modeli.
DeepSeek współpracował z Huawei i Cambricon w celu optymalizacji V4 dla krajowych chińskich chipów AI. Firma nawiązała także współpracę z Baidu w celu ulepszenia funkcji wyszukiwania AI.
Nowym modelem Hunyuan firmy Tencent będzie kierował Shunyu Yao, główny naukowiec firmy Tencent zajmujący się sztuczną inteligencją, który dołączył do firmy w grudniu 2025 r. Model ma około 30 miliardów parametrów i będzie skupiał się na uczeniu się w kontekście i użyteczności agentów.
Yao, absolwent Uniwersytetu Tsinghua, jest znany ze swojej pracy nad frameworkami agentów AI, takimi jak ReAct i Tree of Thoughts. Według Caixina opowiadał się za przejściem od testów porównawczych do aplikacji opartych na scenariuszach.
Wydania te są następstwem wprowadzenia innych modeli sztucznej inteligencji wprowadzonych na rynek w Chinach przez takie firmy, jak Alibaba i ByteDance. Wyścig branżowy nasila się w zakresie możliwości multimodalnych, pamięci długoterminowej i wydajności agentów w świecie rzeczywistym.








