Rozdział zamyka wydanie GPT-4o mini przez OpenAI. Niektóre AI stały się przestarzałe, mimo że zostały wydane dopiero niedawno. Ten nowy model zastąpi szeroko stosowany i darmowy ChatGPT 3.5. GPT-4o mini, który jest bardziej wydajny i energooszczędny niż stary model, jest ponoć znacznie inteligentniejszy od swojego poprzednika. W przejściu z modelu, do którego jesteśmy przyzwyczajeni, na GPT-4o mini użytkownicy mogą spodziewać się nowych funkcji, a GPT-4o mini jest całkowicie darmowy.
Aby w pełni zrozumieć znaczenie tej zmiany, musimy przyjrzeć się podróży ChatGPT 3.5. Wprowadzony na rynek w 2022 r. ChatGPT 3.5 szybko stał się powszechnie znany, oczarowując użytkowników swoją zdolnością do generowania tekstu podobnego do ludzkiego, odpowiadania na pytania i pomocy w różnych zadaniach. Stał się szeroko stosowany zarówno przez osoby prywatne, jak i firmy. Służył nawet jako potężne narzędzie do tworzenia treści, rozwiązywania problemów i ogólnego wyszukiwania informacji. Jednak w ostatnich latach inne AI udostępnione bezpłatnie prześcignęły ChatGPT 3.5.
Co potrafi GPT-4o mini?
GPT-4o mini ma szereg udoskonaleń, które naturalnie odróżniają go od poprzednika, w przeciwnym razie byłoby to nielogiczne. Jednym z najbardziej zauważalnych udoskonaleń jest możliwość przetwarzania tekstu i obrazu. Ta nowa podwójna możliwość pozwala modelowi przetwarzać i rozumieć informacje z wielu źródeł, co potencjalnie skutkuje bardziej kompleksowym i dokładnym wynikiem.
Możliwości modelu zostały przetestowane w różnych testach porównawczych. W teście MMLU (Massive Multitask Language Understanding), który mierzy rozumowanie w szerokim zakresie tematów, GPT-4o mini uzyskał wynik 82%. Według tych wyników nowy model OpenAI przewyższa inne małe modele AI na rynku. Przeprowadzimy testy porównawcze w naszej własnej rodzinie. I oczywiście, to zależy od Ciebie.
Innym obszarem, w którym GPT-4o mini ma się wyróżniać, jest rozumowanie matematyczne. Model uzyskał imponujące 87% w teście MGSM (Mathematics Grade School Merge). Oznacza to, że nasz nowy przyjaciel potrafi pisać piękny kod, rozwiązywać problemy logiczne lub pomagać w skomplikowanych pracach domowych.
Jeśli chodzi o praktyczne zastosowania, GPT-4o mini obsługuje zarówno tekst, jak i obraz w swoim API. Oznacza to, że możesz zintegrować aplikację z innymi mediami, a nie tylko używać jej na stronie internetowej. OpenAI nie poprzestaje na tym, ogłaszając plany rozszerzenia możliwości modelu o przetwarzanie wideo i audio w przyszłości, co jeszcze bardziej rozszerzy jego potencjalne przypadki użycia.
Specyfikacja GPT-4o mini
Z technicznego punktu widzenia GPT-4o mini próbuje reprezentować równowagę między wydajnością a efektywnością. OpenAI nie ujawniło dokładnego rozmiaru modelu, ale mówi, że jest on porównywalny z innymi małymi modelami AI, takimi jak Llama 3 8b, Claude Haiku i Gemini 1.5 Flash. No bo czym innym miałby być?
Jedną z najważniejszych zalet GPT-4o mini jest jego szybkość. Jak wiadomo, w modelu ChatGPT 3.5 odpowiedzi czasami zajmują do 20 sekund, teraz będą zajmować do 10 sekund. Według wstępnych testów model ma średnią przepustowość 202 monet na sekundę. Jest to ponad dwukrotnie szybciej niż GPT-4o i GPT-3.5 Turbo, co czyni go szczególnie odpowiednim do zastosowań, w których szybkie czasy reakcji są kluczowe.
Okno kontekstowe modelu to kolejna ważna cecha techniczna. GPT-4o mini może przetwarzać do 128 000 monet na raz. Jest to równoważne długości przeciętnej książki. To duże okno kontekstowe pozwala modelowi zachować spójność i trafność w długich interakcjach lub podczas pracy z długimi dokumentami.
GPT-4o mini zawiera informacje i dane do października 2023 r. Dane te można odświeżać za pomocą aktualizacji. Jednak na razie możesz nie otrzymywać skutecznych odpowiedzi na wydarzenie lub rozwój po tej dacie.
Czy jest za długi?
- Obsługuje przetwarzanie tekstu i obrazu
- Wynik testu porównawczego MMLU: 82%
- Wynik testu MGSM: 87%
- API obsługuje wprowadzanie tekstu i obrazu
- Rozmiar porównywalny z innymi małymi modelami AI (Llama 3 8b, Claude Haiku, Gemini 1.5 Flash)
- Średnia prędkość wyjściowa: 202 tokeny na sekundę
- Okno kontekstowe: 128 000 tokenów
- Próg wiedzy: październik 2023 r.
- Czas reakcji do 10 sekund
Jaka jest cena GPT-4o mini?
Ceny API nie zostały jeszcze ogłoszone, ale OpenAI ustaliło cenę modelu na 15 centów na milion tokenów wejściowych i 60 centów na milion tokenów wyjściowych dla deweloperów korzystających z jego API. Ta struktura cenowa sprawia, że GPT-4o mini jest bardziej przystępny cenowo niż jego poprzednicy, a OpenAI twierdzi, że jest o 60% tańszy niż GPT-3.5 Turbo.
Niższy koszt uruchomienia GPT-4o mini może mieć daleko idące implikacje dla dostępności AI. Udostępniając zaawansowane możliwości AI w niższej cenie, OpenAI potencjalnie otwiera drzwi do szerszej adopcji technologii AI w różnych branżach i regionach.
Wydajność i przystępność cenowa modelu sprawiają, że jest on szczególnie atrakcyjny dla zadań o dużej objętości i prostych, które wymagają powtarzających się wywołań modelu AI. Może to być szczególnie korzystne dla małych i średnich przedsiębiorstw lub deweloperów pracujących nad projektami o ograniczonym budżecie.
GPT-4o mini kontra inne wiodące modele
Aby lepiej zrozumieć nowy model, przeprowadźmy jego porównanie techniczne z innymi modelami:
Model | Dokładność (%) | MMLU | Jakość GP | UPUSZCZAĆ | MGSM | MATEMATYKA | Ocena człowieka | MMMMU | MathVista |
GPT-4o mini | 82,0 | 40.2 | 79,7 | 87,0 | 70.2 | 87,2 | 59.4 | 56,7 | 63,8 |
Błysk Bliźniąt | 77,9 | 38,6 | 78,4 | 75,5 | 40,9 | 71,5 | 56.1 | 58.4 | 0,0 |
Haiku Claude’a | 73,8 | 35,7 | 78,4 | 71,7 | 40,9 | 75,9 | 50.2 | 46.4 | 0,0 |
GPT-3.5 Turbo | 69,8 | 30,8 | 70.2 | 56.3 | 43.1 | 68,0 | 0,0 | 0,0 | 0,0 |
GPT-4o | 88,7 | 53,6 | 83,4 | 90,5 | 76,6 | 90,2 | 69.1 | 0,0 | 0,0 |
GPT-4 | 90,0 | 55,0 | 85,0 | 92,0 | 78,0 | 92,5 | 70,5 | 60,0 | 65,0 |
Turbosprężarka GPT-4 | 91,0 | 56,0 | 86,0 | 93,0 | 79,0 | 93,5 | 71,0 | 61,0 | 66,0 |
Bliźnięta | 85,0 | 50,0 | 80,0 | 88,0 | 72,0 | 88,5 | 65,0 | 55,0 | 60,0 |
Bliźnięta Zaawansowane | 87,0 | 52,0 | 82,0 | 90,0 | 74,0 | 90,0 | 67,0 | 57,0 | 62,0 |
- MMLU (Massive multitask language understanding): Kompleksowy test porównawczy służący do oceny modeli językowych w szerokim zakresie zadań w różnych domenach.
- GPQA (odpowiadanie na pytania ogólnego przeznaczenia): Test sprawdzający zdolność modelu do dokładnego odpowiadania na pytania z zakresu wiedzy ogólnej.
- DROP (dyskretne rozumowanie nad akapitami): Test sprawdzający umiejętność czytania ze zrozumieniem, który wymaga od modeli wykonywania dyskretnych operacji, takich jak dodawanie i odejmowanie, na tekście.
- MGSM (matematyka wieloetapowa): Punkt odniesienia służący do oceny zdolności modelu do rozwiązywania wieloetapowych problemów matematycznych.
- MATEMATYKA: Test skupiający się na ocenie zdolności modeli językowych do rozwiązywania problemów matematycznych.
- Ocena człowieka: Punkt odniesienia służący do oceny generowania kodu, w którym modele są oceniane na podstawie ich zdolności do generowania poprawnego i funkcjonalnego kodu na podstawie opisów problemów.
- MMMU (Multimodalne rozumienie maszyn): Test sprawdzający zdolność modelu do rozumienia i integrowania informacji z różnych źródeł, takich jak tekst, obrazy i dźwięki.
- MathVista: Specjalny test służący ocenie zdolności rozumowania matematycznego i rozwiązywania problemów przez modele językowe w różnych dyscyplinach matematycznych.
Ostatecznie „najlepszy” model zależy od Twoich wymagań. GPT-4o mini oferuje imponującą mieszankę możliwości w bardziej kompaktowej obudowie, co czyni go atrakcyjnym wyborem dla wielu użytkowników.
Źródło wyróżnionego obrazu: OtwórzAI
Source: ChatGPT 3.5 jest zastępowany przez GPT-4o mini