10 maja 2024 roku współzałożyciel i dyrektor generalny OpenAI Sam Altman zapowiedział nadchodzącą wiosenną aktualizację OpenAI na platformie X.
Podczas gdy krążyły plotki o GPT-5 lub wyszukiwarce, Altman zasugerował „nowe rzeczy”, które wydawałyby się „magią”.
Od GPT-4o po aplikację komputerową ChatGPT – oto wszystko, co ogłoszono podczas wiosennej aktualizacji OpenAI. Brać się do rzeczy!
GPT-4o było wielkim wydarzeniem podczas wiosennej aktualizacji OpenAI
OpenAI zaprezentowało swoje najnowsze udoskonalenie niezwykle popularnego ChatGPT, GPT-4o, opisanego przez CTO Mirę Murati jako „najnowszy flagowy model”.
Ta iteracja opiera się na możliwościach GPT-4, w szczególności na jego zdolności do rozumowania za pomocą głosu, tekstu i obrazu.
Murati podkreślił swoje zaangażowanie w dostępność, mając na celu bezpłatne oferowanie zaawansowanych narzędzi AI. Jest to zgodne z ich misją demokratyzacji dostępu do potężnych modeli językowych.
Kolejny pracownik OpenAI, Williama Fedusa, stwierdza: „GPT-4o to nasz nowy, najnowocześniejszy model graniczny. Testowaliśmy wersję na arenie LMSys jako im-również-dobry-gpt2-chatbot „, z następującymi wynikami testów porównawczych, nowy GPT-4o sobie poradził Arena LMSys na X:
Jednak ELO może ostatecznie zostać ograniczone przez trudność podpowiedzi (tzn. nie może osiągnąć dowolnie wysokiego wskaźnika wygranych w odpowiedzi na pytanie: „co słychać”). W trudniejszych zestawach podpowiedzi — a w szczególności w kodowaniu — zauważamy jeszcze większą lukę: GPT-4o osiąga +100 ELO w porównaniu z naszymi wcześniejszymi… pic.twitter.com/ReJzcQdgC8
— William Fedus (@LiamFedus) 13 maja 2024 r
Wraz z wprowadzeniem GPT-4o w OpenAI API, OpenAI demonstruje swoje zaangażowanie we wspieranie innowacji i wzmacnianie pozycji programistów.
Przyszłość kryje w sobie ekscytujące możliwości, ponieważ funkcje audio i wideo staną się szerzej dostępne, co jeszcze bardziej rozszerzy potencjał przełomowych aplikacji.
Użytkownicy zyskają więcej na darmowej wersji ChatGPT
Tryb głosowy ChatGPT, wcześniej ograniczony do urządzeń mobilnych, jest teraz dostępny na komputerach stacjonarnych za pośrednictwem dedykowanej aplikacji na komputery Mac – a nie asystenta głosowego, jak niektórzy spekulowali. Według Murati podkreśla to zmianę w sposobie współpracy ludzi i maszyn. Wyjaśniła, że GPT-4o przetwarza informacje na różne sposoby, umożliwiając rozszerzenie inteligencji na poziomie GPT-4 na bezpłatnych użytkowników, nad czym pracowali od miesięcy.
Ponad 100 milionów użytkowników korzysta z ChatGPTi pozwala na to ulepszona efektywność wykorzystania zasobów GPT-4o OpenAI oferuje konfigurowalne chatbotyNiestandardowe GPT, w ramach poziomu bezpłatnego. Użytkownicy mogą wkrótce spodziewać się narzędzi do analizy danych, kodowania i obrazu, eliminujących potrzebę płatnej subskrypcji w przypadku podstawowych zadań wizualnych.
Funkcje te zostaną udostępnione w nadchodzących tygodniach.
Znaczące ulepszenia poziomu bezpłatnego rodzą pytania o propozycję wartości miesięcznej subskrypcji ChatGPT Plus za 20 USD. Murati wyjaśnia, że podstawową korzyścią pozostaje możliwość wykonywania pięciokrotnie większej dziennej liczby żądań do GPT-4o w porównaniu z planem bezpłatnym.
Korzystając z GPT-4o, użytkownicy ChatGPT Free będą teraz mieli dostęp do takich funkcji, jak:
- Poznaj inteligencję na poziomie GPT-4
- Uzyskaj odpowiedzi zarówno od modelki, jak i z Internetu
- Analizuj dane i twórz wykresy
- Porozmawiaj o zrobionych zdjęciach
- Prześlij pliki, aby pomóc w podsumowaniu, pisaniu lub analizie
- Odkryj i korzystaj z GPT oraz sklepu GPT
- Zbuduj bardziej pomocne doświadczenie dzięki Memory
Czat głosowy w czasie rzeczywistym za pomocą ChatGPT
GPT-4o bezpośrednio przetwarza wejścia audio, eliminując potrzebę transkrypcji tekstu. Podczas demonstracji podczas wiosennej aktualizacji OpenAI pracownik OpenAI symulował ćwiczenia oddechowe, a GPT-4o z powodzeniem przedstawił sugestie dotyczące poprawy techniki, poprawy śpiewu, a nawet zaoferował porady poprawiające nastrój.
Kolejna innowacja obejmuje zdolność GPT-4o do oferowania pomocy w czasie rzeczywistym poprzez transmisję strumieniową na żywo. Pokazuje to potencjał platformy w zakresie interaktywnego rozwiązywania problemów i edukacji. Wyobraź sobie studentów lub badaczy prezentujących złożone równania podczas transmisji na żywo, a ChatGPT natychmiast dostarcza wyjaśnień i rozwiązań – rewolucyjne podejście do nauki.
Sprawdź jak Grega Brockmana prezentuje tę funkcję w poniższym filmie.
Przedstawiamy GPT-4o, nasz nowy model, który potrafi analizować tekst, dźwięk i wideo w czasie rzeczywistym.
Jest niezwykle wszechstronna, przyjemna w graniu i stanowi krok w kierunku znacznie bardziej naturalnej formy interakcji człowiek-komputer (a nawet interakcji człowiek-komputer-komputer): pic.twitter.com/VLG7TJ1JQx
— Greg Brockman (@gdb) 13 maja 2024 r
Pojawia się aplikacja komputerowa ChatGPT
Aplikacja komputerowa Mac prezentuje niezwykle naturalny interfejs głosowy dla ChatGPT. Podczas prezentacji w OpenAI Spring Update widzieliśmy, że potrafi on obserwować pisany kod w czasie rzeczywistym, analizować go i artykułować swoje obserwacje, w tym potencjalne problemy. Wydaje się, że funkcje wizyjne wykraczają poza kod, o czym świadczy zdolność aplikacji do sprawdzania i przedstawiania wniosków na wyświetlanym wykresie.
ChatGPT jako tłumacz w czasie rzeczywistym
I na koniec, podczas wiosennej aktualizacji OpenAI, zespół OpenAI zaprezentował swoje rozwiązania ChatGPT Voice jako narzędzie do tłumaczenia na żywo.
Zdania wypowiedziane przez Muratiego po włosku zostały bezproblemowo przetłumaczone na angielski, a odpowiedzi przetłumaczone z powrotem z angielskiego na włoski Tomka Warrena uchwycił momenty na X:
OpenAI właśnie zademonstrowało swój nowy model GPT-4o wykonujący tłumaczenia w czasie rzeczywistym pic.twitter.com/Cl0gp9v3kN
— Tom Warren (@tomwarren) 13 maja 2024 r
Aktualizacje te stanowią znaczący krok naprzód dla OpenAI i dziedziny dużych modeli językowych. Koncentrując się na dostępności, ulepszonej funkcjonalności i możliwościach działania w czasie rzeczywistym, OpenAI plasuje się w czołówce technologii przetwarzania języka. Konsekwencje tych osiągnięć są ogromne i mogą zrewolucjonizować komunikację, edukację i wysiłki twórcze.
Przeczytaj więcej o GPT-4o w wpis na blogu zespołu OpenAI tutaj.
Autor wyróżnionego obrazu: OpenAI
Source: Wszystko ogłoszono podczas wiosennej aktualizacji OpenAI