W niedawnym ogłoszeniu Meta zaprezentowała swój najnowszy, przełomowy rozwój sztucznej inteligencji Skrzynka głosowa Meta. Ten innowacyjna technologia generowania mowy szczyci się imponującymi możliwościami, które przewyższają jego konkurentów.
Jednak Meta podjęła decyzję o opóźnieniu wydania ze względu na obawy związane z potencjalne nadużycie I szkoda co mogłoby z niej wynikać nieograniczona dostępność. Zwłaszcza jeśli chodzi o wykonalność użycia Voicebox dla produkcja deepfake audio, Meta wydaje się uważać, że warto być ostrożnym w kwestii wydania. Poniżej możesz sprawdzić szczegóły dotyczące funkcji Meta Voicebox i powodów, dla których może być niebezpieczny.

Dlaczego wydanie Meta Voicebox jest ryzykowne?
Rozwój technologii sztucznej inteligencji, w tym chatbotów i generatorów głosu, wzbudził obawy dotyczące potencjalnych nadużyć i tworzenia deepfake’ów. Prezentuje Meta Voicebox, ze swoimi możliwościami naśladowania głosów podobne ryzyko według firmy. Deepfake, które polegają na tworzeniu fałszywych treści audio lub wideo, mogą zaszkodzić reputacji, prywatności i wiarygodności. Oszuści mogą nadużywać Meta Voicebox Do tworzyć fałszywe wiadomości poczty głosowej, podszywać się pod osoby, Lub tworzyć sfabrykowane filmy oszukiwać i manipulować innymi.
Uznając potencjalne ryzyko związane z Voicebox, Meta zdecydowała się udostępnić próbki audio I artykuł naukowy zamiast zwalniać narzędzie w stanie pełnej sprawności. W ten sposób Meta ma na celu sprzyjać zrozumieniu wśród naukowcówi badaczy o potencjale tej technologii. Firma potwierdza, że Voicebox reprezentuje ważny krok naprzód w generatywnych badaniach nad sztuczną inteligencją i oczekuje dalszej eksploracji i współpracy w dziedzinie audio.

Meta zobowiązuje się do odpowiedzialnego użytkowania
Meta jest świadoma wyzwań związanych z deepfake’ami oraz możliwości niewłaściwego użycia i niezamierzonych szkód związanych z technologiami takimi jak Voicebox. Firma jest aktywnie pracuje aby rozwiać te obawy i zamierza zwolnić artykuł badawczy wraz z narzędzie klasyfikatora. To narzędzie pomoże rozróżnić mowę generowaną przez Voiceboxi prawdziwej ludzkiej mowypomagając w identyfikacji przypadków potencjalnej manipulacji.
Pomimo ryzyka Meta podkreśla potencjalne korzyści generowania mowy AI. Skrzynka głosowa może zrewolucjonizować komunikację dla osób, które są niemy Lub mają trudności z wyrażaniem siebie, przełamywanie barier interakcji. Co więcej, tłumaczenie w czasie rzeczywistym mogłoby stać się rzeczywistością, przybliżając nas do koncepcji „uniwersalny tłumacz” przedstawiony w science fiction. Voicebox oferuje również twórcom treści możliwość edycji i ulepszania nagranej mowy, pozwalając na bezproblemowe usuwanie i zastępowanie problematycznych segmentów.
Co to jest Meta Voicebox?
Meta Voicebox wprowadza nową erę generowania mowy, wykraczając poza nią jego specyficzne szkolenie I doskonale radzi sobie z zadaniami, do których nie był pierwotnie przeznaczony. W przeciwieństwie do poprzednich platform generatorów głosu, Voicebox może generować mowę, która brzmi przekonująco podobnie do oryginalnego źródła, nawet przy minimalnym podanym kontekście. Wykorzystując wprowadzanie tekstu i krótki klip audio, Voicebox tworzy świeżą i autentycznie brzmiącą mowę, naśladując prezentowanego mówcę z klipu źródłowego. Oto krótkie podsumowanie jego charakterystycznych cech:
Synteza tekstu na mowę w kontekście: Voicebox, z możliwością syntezy tekstu na mowę w kontekście, może generować mowę przy użyciu zaledwie dwusekundowej próbki audio jako wejścia. Dopasowując styl audio próbki, Voicebox wyróżnia się w generowaniu zamiany tekstu na mowę.
Transfer w stylu międzyjęzykowym: Intrygującą cechą Voicebox jest możliwość przenoszenia stylów między językami. Udostępniając próbkę mowy i fragment tekstu w języku angielskim, francuskim, niemieckim, hiszpańskim, polskim lub portugalskim, Voicebox może wygenerować odczyt tekstu w określonym języku.
Odszumianie i edycja mowy: Uczenie kontekstowe Voicebox umożliwia bezproblemowe usuwanie szumów i edycję mowy. Może skutecznie przywracać segmenty mowy uszkodzone przez krótkotrwały hałas lub zastępować błędnie wypowiedziane słowa bez konieczności ponownego nagrywania całej mowy. Użytkownicy mogą bez wysiłku identyfikować i wycinać zaszumione segmenty, instruując Voicebox, aby zregenerował te fragmenty.
Zróżnicowane próbkowanie mowy: Opierając się na różnych rzeczywistych danych, Voicebox tworzy mowę, która dokładnie naśladuje sposób, w jaki ludzie naturalnie mówią we wspomnianych sześciu językach. Ta funkcja otwiera drzwi do generowania danych syntetycznych w celu lepszego szkolenia modeli asystentów mowy. Wyniki eksperymentów pokazują, że modele rozpoznawania mowy trenowane na syntetycznej mowie generowanej przez Voicebox wykazują wydajność porównywalną z tymi trenowanymi na prawdziwej mowie, przy zaledwie 1-procentowym spadku współczynnika błędów.

Sztuczna inteligencja meta-text-to-speech ma wiele możliwych zastosowań w przyszłości
Meta przewiduje Voicebox jako narzędzie wielofunkcyjne z szeroką gamą zastosowań. Wirtualni asystenci I postacie niezależne w metaverse mogłoby skorzystać z naturalnie brzmiących głosów generowanych przez Voicebox. Dodatkowo, osoby niedowidzące mogli odczytywać im pisemne wiadomości głosami swoich przyjaciół dzięki pomocy AI. Twórcy treści zyskaliby dostęp do nowych narzędzi łatwe tworzenie i edytowanie ścieżek audio wideo, otwierając możliwości ulepszonych wrażeń multimedialnych.
Voicebox posiada niezwykłe możliwości, w tym zdolność do edytować, próbkować, I stylizować mowę, nawet bez wyraźnego szkolenia w tych obszarach. Może generować wysokiej jakości klipy audio i manipulować wcześniej nagranym dźwiękiem, zachowując jednocześnie styl i treść oryginalnego nagrania. Na przykład może usunąć niepożądane dźwięki, takie jak klaksony samochodów lub szczekanie psów. Równie imponująca jest wszechstronność językowa Voicebox, ponieważ może mówić w sześciu różnych językach, a nawet kombinacjach dwujęzycznych.

Voicebox Meta reprezentuje znaczący postęp w Generowanie mowy oparte na sztucznej inteligencji, obiecując liczne potencjalne zastosowania i korzyści. Jednak decyzja o opóźnieniu wydania odzwierciedla zaangażowanie Meta odpowiedzialny rozwój I adresowanie zagrożeń związane z technologią. Przyjmując ostrożne podejście i aktywnie pracując nad łagodzeniem potencjalnych nadużyć, Meta ma na celu zapewnienie tego Voicebox pozytywnie wpływa na społeczeństwo chroniąc jednocześnie przed szkodliwymi konsekwencjami, które mogą wynikać z jego nieograniczonego używania.
Jeśli interesuje Cię futurystyczny rozwój firmy, sprawdź nowe narzędzia Meta, które mogą zmaksymalizować Twój wpływ na media społecznościowe.
Source: Uruchomienie Meta Voicebox zostało anulowane z powodu obaw o niewłaściwe użycie i szkody








