Google MusicLM AI: Zamień tekst w… muzykę!

Wprowadzono Google MusicLM AI, przełomowy system AI zdolny do komponowania utworów muzycznych w dowolnym gatunku z opisem tekstowym. Pomimo imponujących możliwości firma zdecydowała się zachować ostrożność i nie ma obecnie planów upublicznienia jej. Podczas gdy poprzednie generatywne systemy sztucznej inteligencji dla muzyki, takie jak Riffusion i Dance Diffusion, podejmowały próby komponowania piosenek, były one ograniczone ograniczeniami technicznymi i niewystarczającymi danymi szkoleniowymi, co skutkowało kompozycjami, które nie są złożone i wierne. Jednak Google MusicLM AI stanowi znaczący krok naprzód i może być pierwszym systemem, który poradzi sobie z tymi wyzwaniami.

wow, to jest dla mnie większe niż ChatGPT.
Powiedziałbym, że google prawie rozwiązało generowanie muzyki. https://t.co/s9PQaJ5R6A
— Keunwoo Choi (@keunwoochoi) 27 stycznia 2023 r

Poznaj Google MusicLM AI, pierwsze znaczące narzędzie zamiany tekstu na muzykę

niedawny artykuł naukowy podkreśla rozwój MusicLM, systemu AI przeszkolonego na ogromnym zbiorze danych składającym się z 280 000 godzin muzyki. Celem systemu było generowanie utworów o „znacznej złożoności” na podstawie opisów tekstowych, takich jak „czarująca piosenka jazzowa z niezapomnianym solo na saksofonie i solistą” lub „Berlińskie techno z lat 90. z niskim basem i mocnym uderzeniem”. Produkcja wytwarzana przez Google MusicLM AI, choć niekoniecznie tak pomysłowa lub zunifikowana muzycznie jak ludzki artysta, ma jednak niezwykłe podobieństwo do muzyki skomponowanej przez człowieka.

Byłoby niedopowiedzeniem wyrazić, jak imponujący jest wynik wytwarzany przez Google MusicLM AI, zwłaszcza biorąc pod uwagę brak ludzkich muzyków lub instrumentalistów w procesie tworzenia. Pomimo dostarczania czasami długich i skomplikowanych opisów, MusicLM ma niezwykłą zdolność włączania skomplikowanych elementów, takich jak instrumentalne riffy, linie melodyczne i emocjonalne podteksty w swoich kompozycjach.

Możliwości Google MusicLM AI wykraczają poza zwykłe generowanie krótkich fragmentów muzycznych. Zespół badawczy Google zademonstrował zdolność systemu do konstruowania na podstawie wcześniej istniejących melodii, niezależnie od tego, czy są nucone, śpiewane, gwizdane czy grane na instrumencie. Co więcej, MusicLM ma możliwość wykonania kilku kolejnych opisów i stworzenia melodyjnej narracji obejmującej kilka minut, dzięki czemu nadaje się do ścieżki dźwiękowej filmu.

Huawei Watch 5 wystrzelony w Chinach

Wszechstronność Google MusicLM AI rozciąga się na kierowanie poprzez kombinację obrazów i podpisów, a także tworzenie dźwięku, który naśladuje dźwięk określonego instrumentu w ramach określonego gatunku. Specjalizację „muzyka” AI można również dostosować, umożliwiając systemowi generowanie muzyki pod wpływem różnych lokalizacji, okresów lub określonych celów, takich jak podnosząca na duchu muzyka do ćwiczeń fizycznych.

Możesz dotrzeć do sztucznej inteligencji Google MusicLM Strona GitHuba posłuchać kilku sampli!

Czy kompozytor muzyki Google AI jest naprawdę dobry?

Należy jednak zauważyć, że Google MusicLM AI nie jest bez wad. Niektóre dane wyjściowe wytwarzane przez system mogą wykazywać chaotyczną jakość, co jest naturalnym wynikiem procedury szkoleniowej. Zdolność systemu do generowania wokali, w tym harmonii chóralnych, nie spełnia oczekiwań. Generowane teksty są często niezrozumiałe, składają się z łamanego angielskiego lub bezsensownego bełkotu, a zsyntetyzowane wokale nie mają wyrafinowania jednego artysty i zamiast tego brzmią jak hybryda różnych głosów.

Nowy model muzyczny Google MusicLM to przełom tygodnia.
Oto w akcji.
Po prostu opisz muzykę, a wygeneruje utwór: pic.twitter.com/xAhzHfGnMH
— Pete (@nonmayorpete) 27 stycznia 2023 r

Pomimo imponujących możliwości, badacze Google dostrzegają liczne dylematy etyczne stwarzane przez system taki jak MusicLM, w tym prawdopodobieństwo włączenia materiałów chronionych prawem autorskim z danych treningowych do generowanych utworów. Podczas eksperymentów odkryli, że około 1% wygenerowanej muzyki stanowiło dokładną kopię utworów z zestawu danych treningowych. Ta wysoka częstość powielania skłoniła badaczy do podjęcia decyzji o nieudostępnianiu Google MusicLM AI w jej obecnej formie.

iOS 16: Jak cofnąć wysłanie wiadomości iMessage?

„Zdajemy sobie sprawę z ryzyka potencjalnego sprzeniewierzenia kreatywnych treści związanych z przypadkiem użycia. Mocno podkreślamy potrzebę dalszych prac nad przeciwdziałaniem tym zagrożeniom związanym z generowaniem muzyki” – stwierdzili współautorzy artykułu.

Jeśli MusicLM lub podobny system miałby zostać wydany w przyszłości, prawdopodobnie pojawiłyby się istotne problemy prawne, niezależnie od tego, w jaki sposób system jest sprzedawany lub pozycjonowany, czy jako pomoc dla artystów, czy nie. Jest to obawa, która już się pojawiła w odniesieniu do prostszych systemów sztucznej inteligencji. W 2020 roku wytwórnia płytowa Jay-Z złożyła pozew o naruszenie praw autorskich przeciwko kanałowi YouTube, Vocal Synthesis, za wykorzystanie sztucznej inteligencji do tworzenia okładek piosenek Jay-Z, w tym „We Didn’t Start the Fire” Billy’ego Joela. Po początkowym usunięciu filmów YouTube przywrócił je później, stwierdzając, że żądania usunięcia były „niekompletne”. Legalność muzyki generowanej przez sztuczną inteligencję pozostaje szarą strefą.

Google ogłasza MusicLM: model do generowania muzyki z tekstu. Oto kilka szalonych rzeczy, które może zrobić:
1. Biorąc pod uwagę dźwięk melodii, może generować nową muzykę inspirowaną tą melodią dostosowaną za pomocą monitów! Oto ktoś nucący bella ciao przerobiony na refren a cappella, EDM itp. pic.twitter.com/HKDnXI1C8U
— krwawienie.ai (@krwawieniedgeai) 27 stycznia 2023 r

Ponieważ technologia sztucznej inteligencji do generowania muzyki stale się rozwija, pytania dotyczące jej legalności pozostają na pierwszym planie. Eric Sunray, praktykant prawniczy w Music Publishers Association, jest autorem książki pt biały papier który twierdzi, że systemy takie jak MusicLM naruszają prawa chronione na mocy amerykańskiej ustawy o prawie autorskim poprzez tworzenie „gobelinów spójnego dźwięku” z materiałów chronionych prawem autorskim wykorzystywanych w ich szkoleniu.

Apple i OpenAI mogą ogłosić partnerstwo podczas WWDC 10 czerwca

Obawy te zostały powtórzone w odniesieniu do systemów sztucznej inteligencji w innych dziedzinach, w tym do generowania obrazów, kodu i tekstu, ponieważ ich dane szkoleniowe są często pozyskiwane z sieci bez zgody twórców. Kwestia dozwolonego użytku była również dyskutowana po wydaniu Jukebox OpenAI, a niektórzy kwestionowali wykorzystanie materiałów chronionych prawem autorskim w szkoleniu modeli AI.

Zgodnie z opinią Andy’ego Baio z Waxy’ego, spekuluje się, że muzyka generowana przez systemy sztucznej inteligencji może być uznana za dzieło pochodne z perspektywy użytkownika, a tym samym zapewnia ochronę praw autorskich jedynie jej oryginalnym komponentom. Definicja tego, co stanowi „oryginalność” w tym kontekście, pozostaje niejasna, co sprawia, że komercyjne wykorzystanie takiej muzyki pozostaje niezbadanym terytorium. Jeśli jednak wygenerowana muzyka mieści się w zakresie dozwolonego użytku, takiego jak parodia lub komentarz, sprawa staje się mniej skomplikowana. Niemniej jednak Baio przewiduje, że system sądowniczy będzie musiał przyjąć podejście indywidualne, aby wydać werdykt.

Ponieważ krajobraz prawny wciąż ewoluuje, jasność w kwestii sztucznej inteligencji do generowania muzyki może być nieuchronna. Kilka toczących się procesów sądowych, w tym jeden dotyczący praw artystów, których praca jest wykorzystywana do szkolenia systemów AI bez ich zgody lub wiedzy, prawdopodobnie wpłynie na branżę. Dopiero czas pokaże wynik tych postępowań sądowych.

Czy słyszałeś o nowym AI Text Classifier OpenAI do wykrywania tekstów generowanych przez AI?

Source: Google MusicLM AI: Zamień tekst w… muzykę!