MiniMax wypuścił obciążniki swojego modelu MiniMax M2.7 12 kwietnia 2023 r., pośród fali publikacji o otwartej masie z chińskich laboratoriów, znacząco wpływających na konkurencyjny krajobraz sztucznej inteligencji.
To wydanie wpisuje się w szerszy trend panujący w Chinach, gdzie różne firmy spieszą się z prezentacją swoich osiągnięć. MiniMax M2.7 został po raz pierwszy zaprezentowany w marcu i uzyskał 56,22% w teście SWE-Pro, co odpowiada wynikom GPT-5.3-Codex. Ponadto osiągnął 55,6% w teście VIBE-Pro, co jest prawie porównywalne z Opus 4.6 pod względem realizacji projektów w zadaniach internetowych, mobilnych i symulacyjnych. Model uzyskał także najwyższą ocenę ELO wynoszącą 1495 w ocenie PKBval-AA wśród modeli open source.
Obciążniki MiniMax M2.7 są teraz dostępne na platformie Hugging Face i obsługiwane na platformach NVIDIA. Jednak wydanie spotkało się z krytyką ze względu na ograniczenia licencyjne, które zabraniają wykorzystania komercyjnego bez uprzedniej pisemnej zgody, co zdaniem niektórych członków społeczności podważa jego klasyfikację jako open source. MiniMax scharakteryzował M2.7 jako pierwszy model uczestniczący we własnym cyklu rozwoju poprzez proces, który nazywają „samoewolucją”.
Premiera MiniMax następuje po udostępnieniu 7 kwietnia przez Zhipu AI modelu GLM-5.1 na licencji open source, który działa na licencji MIT. Model ten, zawierający 754 miliardy parametrów, może autonomicznie wykonywać zadania inżynieryjne nawet przez osiem godzin. Z drugiej strony Alibaba uruchomiła 2 kwietnia swój zastrzeżony model API, Qwen 3.6 Plus, wywołując spekulacje na temat jej zaangażowania w praktyki open source. Od 11 kwietnia Qwen 3.6 Plus był nadal bezpłatny na OpenRouter, ale jego długoterminowa dostępność pozostaje niepewna.
Oczekiwania na model V4 firmy DeepSeek, którego premiera planowana jest na koniec kwietnia, rosną. Założyciel DeepSeek, Liang Wenfeng, wskazał, że model będzie działał na chipach Huawei Ascend, co podkreśla wysiłki Chin na rzecz samowystarczalności w zakresie półprzewodników. Oczekuje się, że wersja V4 będzie zawierać około jednego biliona parametrów i będzie wykorzystywać architekturę Mixture-of-Experts z oknem kontekstowym zawierającym milion tokenów, a także będzie zawierać wiele wariantów, takich jak tryb Vision do obsługi multimodalnej. Pomimo dwóch opóźnień, wczesne testy warunków skrajnych sugerują, że publiczna premiera może być nieuchronna.







