Dzisiejszy dzień to ważny kamień milowy w rozwoju sztucznej inteligencji – wdrażanie zaawansowanego trybu głosowego ChatGPT rozpoczyna fazę alfa.
Niedawny przeciek na temat X.com ujawnia, że wybrana grupa użytkowników ChatGPT Plus uzyska wcześniejszy dostęp do tej wyczekiwanej funkcji, która umożliwi im prowadzenie rozmów z ulubionym asystentem AI w sposób przypominający rozmowę z człowiekiem.
Choć sztuczna inteligencja konwersacyjna rozwija się w szybkim tempie, już teraz jest o niej głośno — i to nie tylko w kontekście nowych funkcji.
Kiedy zostanie wdrożony zaawansowany tryb głosowy ChatGPT?
Choć dzisiejsze wdrożenie zaawansowanego trybu głosowego ChatGPT oznacza pierwszą okazję do wypróbowania tej funkcji dla wybranej grupy użytkowników ChatGPT Plus, nie wszyscy uzyskają do niej natychmiastowy dostęp.
Według przecieku udział w fazie alfa zależeć będzie od wielu czynników. Zasadniczo nie każdy abonent Plus może spodziewać się, że będzie mógł skorzystać z tej przełomowej funkcji już teraz.
E-mail od zespołu ChatGPT potwierdza, że tryb zaawansowany jest częścią ograniczonej wersji alfa, która rozpocznie się dzisiaj, we wtorek, 24 września 2024 r.. Podczas gdy OpenAI obiecało, że „wszyscy użytkownicy Plus będą mieli dostęp do końca jesieni”, ten test alfa jest pierwszym namacalnym krokiem w kierunku tego celu.
Wygląda na to, że potwierdzono, iż tryb Advanced Voice zostanie udostępniony wybranej grupie użytkowników już we wtorek, 24 września 2024 r.! fot.twitter.com/XJa2o4HIaJ
— „Brian” (@Arktophylaxxx) 23 września 2024 r.
Pomimo ograniczonego charakteru wdrożenia, w społeczności narasta entuzjazm. Wielu uważa to za znak, że OpenAI jest zobowiązane do spełnienia obietnicy udostępnienia użytkownikom tego nowego trybu konwersacyjnego przed końcem roku. A dla tych, którzy nie uzyskają dostępu od razu, jest to pewny wskaźnik, że pełne publiczne wydanie jest już blisko.
Czym jest zaawansowany tryb głosowy ChatGPT?
Firma OpenAI po raz pierwszy zaprezentowała tryb Advanced Voice Mode w maju 2024 r., pokazując tym samym kolejny krok w sposobie interakcji ze sztuczną inteligencją.
W przeciwieństwie do poprzednich wersji, ten nowy tryb pozwala na dynamiczną, realizowaną w czasie rzeczywistym, interakcję z ChatGPT, przypominającą interakcję z człowiekiem, w tym na możliwość przerwania lub przekierowania rozmowy w połowie zdania, jeśli zboczy ona z tematu lub stanie się zbyt szczegółowa.
Jest to szczególnie ekscytujące dla użytkowników, którzy chcą prowadzić bardziej naturalne, płynne konwersacje bez konieczności czekania na odpowiedź tekstową lub zmagania się z długimi odpowiedziami. Teraz możesz zadawać złożone pytania i oczekiwać wyrafinowanych, szczegółowych odpowiedzi od chatbota w czasie rzeczywistym!
Nowa era konwersacyjnej sztucznej inteligencji
To wdrożenie przybliża ChatGPT do przyszłości, w której interakcja z AI wydaje się tak naturalna, jak rozmowa z inną osobą. Podczas gdy OpenAI kiedyś wyprzedzało konkurencję — po raz pierwszy demonstrując Advanced Voice Mode — firma zaczęła odczuwać presję ze strony rywali. Google już wprowadził Gemini Live, AI o podobnym zakresie, podczas gdy plotkowana Siri 2.0 firmy Apple wywołuje szum dzięki swoim ulepszonym możliwościom AI.
Konkurencja w dziedzinie konwersacyjnej AI nabiera tempa, ale ten test alfa może być impulsem, którego OpenAI potrzebuje, aby wrócić na czoło wyścigu. Oczekuje się, że ulepszona funkcjonalność trybu głosowego sprawi, że ChatGPT stanie się bardziej przyjazny dla użytkownika i dostępny, zwłaszcza dla osób w podróży, gdzie wpisywanie długich zapytań nie zawsze jest wykonalne.
Miejmy nadzieję, że podróż będzie płynniejsza
Jednak nie wszystko idzie zgodnie z planem dla OpenAI, gdyż zbliża się data wdrożenia zaawansowanego trybu głosowego ChatGPT.
W maju OpenAI zostało uwikłane w skandal z udziałem aktorki Scarlett Johansson, której głos został wykorzystany do demonstracji funkcji. Johansson, znana ze swojego kultowego głosu, wyraziła sprzeciw wobec używania jej głosu bez jej wyraźnej zgody, co wywołało debatę na temat etycznej sztucznej inteligencji i wykorzystywania podobizn celebrytów w treściach generowanych przez sztuczną inteligencję. Podczas gdy OpenAI twierdziło, że był to ogólny głos, który przypadkowo brzmiał podobnie, reakcja podkreśliła złożoność technologii głosowej, zwłaszcza jeśli chodzi o własność intelektualną i prawa osobiste.
Kontrowersje wokół głosu Johansson wysuwają na pierwszy plan ważne dyskusje na temat tego, gdzie należy wyznaczyć granicę w treściach generowanych przez AI, szczególnie gdy dotyczą one prawdziwych ludzi. W miarę jak OpenAI nadal się rozwija i wprowadza Advanced Voice Mode, będzie musiało ostrożnie poruszać się po tych prawnych i etycznych wodach, aby uniknąć dalszych wpadek.
Wprowadzenie trybu ChatGPT Advanced Voice Mode oznacza kluczowy moment w ewolucji konwersacyjnej AI. Umożliwiając bardziej naturalne, płynne interakcje, ta funkcja przesuwa granice tego, co może zrobić AI. Ponieważ OpenAI konkuruje z gigantami technologicznymi, takimi jak Google i Apple, presja na dostarczenie dopracowanego, etycznego i rewolucyjnego produktu jest narastająca. Jednak przyszłość wygląda obiecująco dla tych, którzy czekają na szansę porozmawiania z ChatGPT — a ponieważ ta funkcja wchodzi w fazę alfa, pełne wydanie może być tuż za rogiem.
Źródło wyróżnionego obrazu: Emre Çıtak/Ideogram AI
Source: Wdrożenie zaawansowanego trybu głosowego ChatGPT już wkrótce!