W niedawnym ogłoszeniu Meta zaprezentowała swój najnowszy, przełomowy rozwój sztucznej inteligencji Skrzynka głosowa Meta. Ten innowacyjna technologia generowania mowy szczyci się imponującymi możliwościami, które przewyższają jego konkurentów.

Jednak Meta podjęła decyzję o opóźnieniu wydania ze względu na obawy związane z potencjalne nadużycie I szkoda co mogłoby z niej wynikać nieograniczona dostępność. Zwłaszcza jeśli chodzi o wykonalność użycia Voicebox dla produkcja deepfake audio, Meta wydaje się uważać, że warto być ostrożnym w kwestii wydania. Poniżej możesz sprawdzić szczegóły dotyczące funkcji Meta Voicebox i powodów, dla których może być niebezpieczny.

Skrzynka głosowa Meta
Wydanie Meta Voicebox zostało anulowane ze względu na możliwość wykorzystania go do deepfake’ów

Dlaczego wydanie Meta Voicebox jest ryzykowne?

Rozwój technologii sztucznej inteligencji, w tym chatbotów i generatorów głosu, wzbudził obawy dotyczące potencjalnych nadużyć i tworzenia deepfake’ów. Prezentuje Meta Voicebox, ze swoimi możliwościami naśladowania głosów podobne ryzyko według firmy. Deepfake, które polegają na tworzeniu fałszywych treści audio lub wideo, mogą zaszkodzić reputacji, prywatności i wiarygodności. Oszuści mogą nadużywać Meta Voicebox Do tworzyć fałszywe wiadomości poczty głosowej, podszywać się pod osoby, Lub tworzyć sfabrykowane filmy oszukiwać i manipulować innymi.

Uznając potencjalne ryzyko związane z Voicebox, Meta zdecydowała się udostępnić próbki audio I artykuł naukowy zamiast zwalniać narzędzie w stanie pełnej sprawności. W ten sposób Meta ma na celu sprzyjać zrozumieniu wśród naukowcówi badaczy o potencjale tej technologii. Firma potwierdza, że ​​Voicebox reprezentuje ważny krok naprzód w generatywnych badaniach nad sztuczną inteligencją i oczekuje dalszej eksploracji i współpracy w dziedzinie audio.

  Krążą pogłoski, że Instagram integruje wirtualne zwierzaki w historie za pomocą hashtaga „Instagram Pals”
Skrzynka głosowa Meta
Meta Voicebox podekscytował wielu użytkowników z różnych dziedzin

Meta zobowiązuje się do odpowiedzialnego użytkowania

Meta jest świadoma wyzwań związanych z deepfake’ami oraz możliwości niewłaściwego użycia i niezamierzonych szkód związanych z technologiami takimi jak Voicebox. Firma jest aktywnie pracuje aby rozwiać te obawy i zamierza zwolnić artykuł badawczy wraz z narzędzie klasyfikatora. To narzędzie pomoże rozróżnić mowę generowaną przez Voiceboxi prawdziwej ludzkiej mowypomagając w identyfikacji przypadków potencjalnej manipulacji.

Pomimo ryzyka Meta podkreśla potencjalne korzyści generowania mowy AI. Skrzynka głosowa może zrewolucjonizować komunikację dla osób, które są niemy Lub mają trudności z wyrażaniem siebie, przełamywanie barier interakcji. Co więcej, tłumaczenie w czasie rzeczywistym mogłoby stać się rzeczywistością, przybliżając nas do koncepcji „uniwersalny tłumacz” przedstawiony w science fiction. Voicebox oferuje również twórcom treści możliwość edycji i ulepszania nagranej mowy, pozwalając na bezproblemowe usuwanie i zastępowanie problematycznych segmentów.

Co to jest Meta Voicebox?

Meta Voicebox wprowadza nową erę generowania mowy, wykraczając poza nią jego specyficzne szkolenie I doskonale radzi sobie z zadaniami, do których nie był pierwotnie przeznaczony. W przeciwieństwie do poprzednich platform generatorów głosu, Voicebox może generować mowę, która brzmi przekonująco podobnie do oryginalnego źródła, nawet przy minimalnym podanym kontekście. Wykorzystując wprowadzanie tekstu i krótki klip audio, Voicebox tworzy świeżą i autentycznie brzmiącą mowę, naśladując prezentowanego mówcę z klipu źródłowego. Oto krótkie podsumowanie jego charakterystycznych cech:

  Przewodnik po wyspie Snowpang Lost Ark: lokalizacja, token wyspy i nasiona Mokoko

Synteza tekstu na mowę w kontekście: Voicebox, z możliwością syntezy tekstu na mowę w kontekście, może generować mowę przy użyciu zaledwie dwusekundowej próbki audio jako wejścia. Dopasowując styl audio próbki, Voicebox wyróżnia się w generowaniu zamiany tekstu na mowę.

Transfer w stylu międzyjęzykowym: Intrygującą cechą Voicebox jest możliwość przenoszenia stylów między językami. Udostępniając próbkę mowy i fragment tekstu w języku angielskim, francuskim, niemieckim, hiszpańskim, polskim lub portugalskim, Voicebox może wygenerować odczyt tekstu w określonym języku.

Odszumianie i edycja mowy: Uczenie kontekstowe Voicebox umożliwia bezproblemowe usuwanie szumów i edycję mowy. Może skutecznie przywracać segmenty mowy uszkodzone przez krótkotrwały hałas lub zastępować błędnie wypowiedziane słowa bez konieczności ponownego nagrywania całej mowy. Użytkownicy mogą bez wysiłku identyfikować i wycinać zaszumione segmenty, instruując Voicebox, aby zregenerował te fragmenty.

Zróżnicowane próbkowanie mowy: Opierając się na różnych rzeczywistych danych, Voicebox tworzy mowę, która dokładnie naśladuje sposób, w jaki ludzie naturalnie mówią we wspomnianych sześciu językach. Ta funkcja otwiera drzwi do generowania danych syntetycznych w celu lepszego szkolenia modeli asystentów mowy. Wyniki eksperymentów pokazują, że modele rozpoznawania mowy trenowane na syntetycznej mowie generowanej przez Voicebox wykazują wydajność porównywalną z tymi trenowanymi na prawdziwej mowie, przy zaledwie 1-procentowym spadku współczynnika błędów.

Skrzynka głosowa Meta
Meta Voicebox obiecuje niezwykle bogate możliwości na przyszłość

Sztuczna inteligencja meta-text-to-speech ma wiele możliwych zastosowań w przyszłości

Meta przewiduje Voicebox jako narzędzie wielofunkcyjne z szeroką gamą zastosowań. Wirtualni asystenci I postacie niezależne w metaverse mogłoby skorzystać z naturalnie brzmiących głosów generowanych przez Voicebox. Dodatkowo, osoby niedowidzące mogli odczytywać im pisemne wiadomości głosami swoich przyjaciół dzięki pomocy AI. Twórcy treści zyskaliby dostęp do nowych narzędzi łatwe tworzenie i edytowanie ścieżek audio wideo, otwierając możliwości ulepszonych wrażeń multimedialnych.

  Ewolucja technologii i aplikacji w sporcie

Voicebox posiada niezwykłe możliwości, w tym zdolność do edytować, próbkować, I stylizować mowę, nawet bez wyraźnego szkolenia w tych obszarach. Może generować wysokiej jakości klipy audio i manipulować wcześniej nagranym dźwiękiem, zachowując jednocześnie styl i treść oryginalnego nagrania. Na przykład może usunąć niepożądane dźwięki, takie jak klaksony samochodów lub szczekanie psów. Równie imponująca jest wszechstronność językowa Voicebox, ponieważ może mówić w sześciu różnych językach, a nawet kombinacjach dwujęzycznych.

Skrzynka głosowa Meta
Meta Voicebox może prezentować bardzo szerokie rozwiązania audio

Voicebox Meta reprezentuje znaczący postęp w Generowanie mowy oparte na sztucznej inteligencji, obiecując liczne potencjalne zastosowania i korzyści. Jednak decyzja o opóźnieniu wydania odzwierciedla zaangażowanie Meta odpowiedzialny rozwój I adresowanie zagrożeń związane z technologią. Przyjmując ostrożne podejście i aktywnie pracując nad łagodzeniem potencjalnych nadużyć, Meta ma na celu zapewnienie tego Voicebox pozytywnie wpływa na społeczeństwo chroniąc jednocześnie przed szkodliwymi konsekwencjami, które mogą wynikać z jego nieograniczonego używania.

Jeśli interesuje Cię futurystyczny rozwój firmy, sprawdź nowe narzędzia Meta, które mogą zmaksymalizować Twój wpływ na media społecznościowe.

Source: Uruchomienie Meta Voicebox zostało anulowane z powodu obaw o niewłaściwe użycie i szkody