OpenAI uruchomiło funkcje wideo w czasie rzeczywistym dla ChatGPT, integrując funkcje wizualne z zaawansowanym trybem głosowym. Ogłoszenie to zostało ogłoszone podczas transmisji na żywo, która odbyła się 12 grudnia 2024 r. Zaktualizowana wersja może rozpoznawać obiekty w czasie rzeczywistym za pomocą kamery urządzenia użytkownika, przetwarzać informacje wizualne poprzez udostępnianie ekranu i prowadzić ludzkie rozmowy. Dostępna dla abonentów ChatGPT Plus, Team i Pro aktualizacja zostanie wdrożona w ciągu następnego tygodnia, a niektórzy użytkownicy w UE będą musieli zmierzyć się z potencjalnymi opóźnieniami.
Dzięki temu ulepszeniu ChatGPT może odpowiadać użytkownikom, interpretując to, co widzi, na przykład oferując wyjaśnienia ustawień urządzenia lub dostarczając sugestie dotyczące rozwiązywania problemów matematycznych. Aby skorzystać z tych funkcji, użytkownicy mogą dotknąć ikony głosu w aplikacji ChatGPT i aktywować udostępnianie wideo lub ekranu. Wdrożenie jest priorytetowe dla abonentów Plus, natomiast użytkownicy ChatGPT Enterprise i Edu uzyskają dostęp w styczniu 2025 r.
OpenAI prezentuje zaawansowane funkcje w demonstracji na żywo
Podczas niedawnej demonstracji na żywo prezes OpenAI Greg Brockman podkreślił wciągające możliwości zaawansowanego trybu głosowego z wizją. Brockman przepytał Andersona Coopera z CNN z anatomii, demonstrując, w jaki sposób ChatGPT może rozumieć i komentować rysunki wykonane przez Coopera na tablicy. Interakcja pokazała potencjał interaktywnego uczenia się i przekazywania informacji zwrotnych w czasie rzeczywistym, chociaż ChatGPT wykazał pewne błędy, takie jak błędne obliczenie problemu z geometrii, podkreślając ciągłe wyzwania związane z dokładnością modelu.
Ta zaktualizowana funkcja napotkała opóźnienia w rozwoju, ponieważ OpenAI wcześniej wskazywało, że okna uruchamiania zostały ostatecznie wydłużone. Zaprezentowany pierwotnie w maju 2024 r. zaawansowany tryb głosowy miał pojawić się wcześniej. Niedawne ogłoszenie stanowi kulminację wysiłków mających na celu udoskonalenie i sfinalizowanie tej możliwości, wskazując strategiczne skupienie się na poprawie komfortu użytkowania i możliwości technologicznych chatbota.
Oprócz nowych funkcjonalności wizualnych, OpenAI zaprezentowało także „Tryb Świętego Mikołaja” na okres świąteczny, umożliwiający użytkownikom interakcję z ChatGPT w świątecznym tonie. Aby uzyskać dostęp do tej funkcji, użytkownicy mogą kliknąć ikonę płatka śniegu w aplikacji. Ta opcja sezonowa resetuje limity użytkowania dla początkowej interakcji, dając użytkownikom więcej możliwości korzystania z funkcji świątecznej.
Rywale tacy jak Google i Meta rozwijają podobne możliwości, jak Google Project Astra, który niedawno został udostępniony wybranym testerom na Androidzie. Wysiłki te odzwierciedlają szerszy trend, zgodnie z którym największe firmy technologiczne pracują nad integracją interaktywnych funkcji wideo ze swoimi modelami sztucznej inteligencji, zwiększając zaangażowanie użytkowników i wszechstronność aplikacji.
OpenAI wskazało również plany wprowadzenia innych ulepszeń, takich jak wzmocnienie programu badawczego dotyczącego dostrajania zbrojenia, zaprojektowanego w celu optymalizacji wydajności modelu w wyspecjalizowanych zadaniach. Program ten skierowany jest do instytucji badawczych i przedsiębiorstw, umożliwiając im dostosowanie modeli OpenAI do złożonych aplikacji.
Autor wyróżnionego obrazu: OpenAI
Wpis OpenAI uruchamia funkcje wideo w czasie rzeczywistym dla ChatGPT pojawił się jako pierwszy w TechBriefly.
Source: OpenAI uruchamia funkcje wideo w czasie rzeczywistym dla ChatGPT








