OpenAI otwiera drogę do realistycznych rozmów z chatbotami dzięki ChatGPT Advanced Voice Mode. Firma pozwoli nam korespondować z AI jak z człowiekiem i teraz rozmawiać z nią jak z człowiekiem. Przyjrzyjmy się ChatGPT Advanced Voice Mode, który jest obecnie dostępny tylko dla ograniczonej liczby członków Plus.
Ta przełomowa funkcja, która zrewolucjonizuje sposób, w jaki wchodzimy w interakcje ze sztuczną inteligencją, wywołuje debatę niemal tak interesującą, jak sama technologia. Hej, Jarvis, jesteś tam?
Zaczynamy udostępniać zaawansowany tryb głosowy niewielkiej grupie użytkowników ChatGPT Plus. Zaawansowany tryb głosowy oferuje bardziej naturalne rozmowy w czasie rzeczywistym, pozwala na przerwanie w dowolnym momencie oraz wyczuwa i reaguje na Twoje emocje. fot.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) 30 lipca 2024 r.
Zaawansowany tryb głosowy ChatGPT: coś więcej niż tylko rozmowa
Najnowszy produkt OpenAI nie jest zwyczajny asystent głosowy. Tryb ChatGPT Advanced Voice Mode ma rzekomo hiperrealistyczne odpowiedzi głosowe, które zacierają granicę między ludźmi a sztuczną inteligencją. W przeciwieństwie do swojego poprzednika, który opierał się na trzech oddzielnych modelach do przetwarzania danych głosowych, GPT-4o (silnik stojący za tą nową funkcją) jest w stanie wykonywać zadania multimodalne w jednym. Wyobraź sobie maszynę, która może obsługiwać konwersję głosu na tekst, przetwarzanie podpowiedzi i wyjście tekstu na mowę w jednym kroku. Płynne konwersacje, które sprawiają, że zapominasz, że rozmawiasz z robotem, nie są daleko.
Ale czekaj, to nie wszystko! Ten czatbox AI twierdzi, że potrafi wykrywać emocjonalne intonacje; potrafi stwierdzić, czy jesteś smutny czy podekscytowany. Może nawet dołączyć do ciebie na sesji karaoke – ale nie spodziewaj się, że zaśpiewa jakieś utwory chronione prawem autorskim. Najpierw przyjrzyjmy się, jak korzystać z trybu ChatGPT Advanced Voice Mode.
Jak korzystać z zaawansowanego trybu głosowego ChatGPT
Gotowy, aby dać odpocząć palcom i poćwiczyć struny głosowe? Oto, jak zacząć czatować z najnowszym dziełem OpenAI. Zaawansowany tryb głosowy ChatGPT jest obecnie dostępny dla ograniczonej liczby Użytkownicy ChatGPT Plus (więc nie każdy członek Plus ma do niego dostęp)ale tylko jeśli jesteś wśród nich:
- Zaktualizuj swoją aplikację: Przede wszystkim upewnij się, że używasz najnowszej wersji aplikacji ChatGPT. Dla użytkowników Androida jest to wersja 1.2024.206 lub nowsza. Dla użytkowników iOS będzie potrzebna wersja 1.2024.205 lub nowsza, a na urządzeniu musi być zainstalowany system iOS 16.4 lub nowszy. Na tej futurystycznej imprezie nie ma miejsca na stare technologie!
- Znajdź swój głos: Gdy już wszystko będzie zaktualizowane, poszukaj ikony głosu w prawym dolnym rogu ekranu. Stuknij ją i gotowe.
- Wybierz swojego wojownika: Będziesz mieć wybór pomiędzy standardowym trybem głosowym a błyszczącym nowym trybem głosowym Advanced. Wybierz „Advanced”, aby doświadczyć pełnej mocy GPT-4o.
- Mów głośniej: Twój mikrofon powinien być domyślnie włączony, ale jeśli otrzymujesz ciche traktowanie, sprawdź ikonę mikrofonu w lewym dolnym rogu ekranu. Stuknij, aby przełączyć, jeśli to konieczne.
- Rozmawiać dalej: Zacznij rozmawiać ze swoim przyjacielem AI tak naturalnie, jak rozmawiałbyś z przyjacielem człowiekiem. Pamiętaj, że potrafi zrozumieć twoje emocje, więc nie krępuj się pozwolić, aby twoja osobowość przebijała.
- Zakończ to: Gdy skończysz wpływać na swojego nowego mówcę sterowanego sztuczną inteligencją (lub będziesz pod jego wpływem), naciśnij czerwoną ikonę w prawym dolnym rogu, aby zakończyć rozmowę.
Profesjonalna wskazówka: Aby uzyskać najlepsze wrażenia, załóż słuchawki. A użytkownicy iPhone’a, włączcie Izolacja głosu tryb mikrofonu, aby uniknąć niechcianych przerw. W końcu, trzy osoby to tłum, gdy próbujesz porozmawiać szczerze ze swoim asystentem AI!
Pamiętaj, że ta funkcja jest nadal w fazie alfa, więc może mieć kilka dziwactw. Ale hej, nawet ludzie nie są idealnymi rozmówcami przez 100% czasu, prawda?
Scarlett Johansson: Głos kontrowersji
Podczas gdy OpenAI chwali się zaawansowanymi możliwościami swojej nowej funkcji głosowej ChatGPT Advanced Voice Mode, droga do jej wydania nie obyła się bez przeszkód. Pamiętasz oszałamiającą wersję demonstracyjną z maja? Okazuje się, że jeden z głosów, Sky, ma niesamowite podobieństwo do Gwiazda Hollywood.
Scarlett Johansson, znana również z roli asystentki AI w filmie „Her”, podobno odrzuciła wiele próśb CEO OpenAI, Sama Altmana, o użycie jej głosu. Johansson szybciej opowiedziała się za tym, co można by nazwać „sztuczną inteligencją”, gdy opublikowano demo z głosem, który brzmiał podejrzanie podobnie do jej własnego. OpenAI zaprzeczyło użyciu jej głosu, ale natychmiast usunęło kontrowersyjny sample ze swojego programu.
Bezpieczeństwo przede wszystkim, gwiazdki na drugim miejscu
W odpowiedzi na kontrowersje OpenAI wstrzymało wydanie, poświęcając czas na zwiększenie środków bezpieczeństwa. Firma twierdzi, że przetestowała GPT-4o z ponad 100 zewnętrznymi członkami zespołu red, mówiącymi w 45 różnych językach. Rezultat. We współpracy z płatnymi aktorami głosowymi stworzono bezpieczniejszy system z czterema wstępnie ustawionymi głosami – Juniper, Breeze, Cove i Ember.
Rzecznik OpenAI Lindsay McCallum zapewnia, że ChatGPT „nie może naśladować głosów innych osób, zarówno osób prywatnych, jak i osób publicznych, i zablokuje dane wyjściowe różniące się od jednego z tych wstępnie ustawionych głosów”. Tak więc, jeśli miałeś nadzieję na czat z wirtualną Scarlett Johansson, nie masz szczęścia.
W miarę jak OpenAI stopniowo wprowadza zaawansowany tryb głosowy ChatGPT, wszystko Plus użytkowników tej jesieniświat technologii obserwuje z zapartym tchem. Czy to będzie konwersacyjna sztuczna inteligencja, na którą wszyscy czekaliśmy, czy też otworzy nową puszkę Pandory w trwającej debacie na temat etyki sztucznej inteligencji i kwestii praw autorskich?
Źródło wyróżnionego obrazu: X / OpenAI Edytować: Furkan Demirkaja
Source: Zaawansowany tryb głosowy ChatGPT: sprawia, że Scarlett zapomina o głosie