W znanej grze planszowej Diplomacy AI Meta Cicero była w stanie działać na poziomie porównywalnym z człowiekiem. Wykorzystuje podobny model do GPT-3.
Meta AI ujawniła we wtorek stworzenie Cycerona, który, jak twierdzi, jest pierwszą sztuczną inteligencją działającą na poziomie ludzkim w strategicznej grze planszowej Dyplomacja. To godne uwagi osiągnięcie, biorąc pod uwagę, że gra wymaga silnych zdolności negocjacyjnych międzyludzkich, a Cicero musi mieć pewien poziom umiejętności językowych, aby zwyciężyć.
Gry planszowe od dawna służą jako skuteczna miara rozwoju sztucznej inteligencji, nawet przed zwycięstwem Deep Blue nad Garrym Kasparowem w 1997 roku w szachach. Kiedy AlphaGo pokonał mistrza Go Lee Sedola w 2015 roku, kolejna bariera została przełamana. Obie te gry są zgodne z zestawem zasad analitycznych, które są dość jasne (reguły Go są jednak ogólnie zmodyfikowane dla komputerowej sztucznej inteligencji).
Meta Cicero AI jest zbliżona do wydajności na poziomie człowieka w grze planszowej o nazwie Dyplomacja
Jednak istotnym elementem rozgrywki w Diplomacy są umiejętności społeczne. Aby odnieść sukces, gracze muszą wykazać się empatią, mówić naturalnie i rozwijać relacje — trudne zadanie dla gracza komputerowego. W związku z tym Meta zadała pytanie: „Czy możemy zbudować bardziej skutecznych i elastycznych agentów, którzy potrafią używać języka do negocjowania, przekonywania i pracy z ludźmi, aby osiągnąć cele strategiczne podobne do tego, w jaki robią to ludzie?”

Według Meta odpowiedź brzmi: tak. Meta Cicero AI rozwijała swoje umiejętności, grając w grę online w dyplomację webdiplomacy.net. Z biegiem czasu osiągnął „ponad dwukrotność średniego wyniku” ludzkich graczy i ostatecznie znalazł się w pierwszej 10% graczy w wielu grach, udowadniając, że opanował grę.
Meta AI Cicero została opracowana przy użyciu metod rozumowania strategicznego (podobnie jak AlphaGo) i przetwarzania języka naturalnego (podobnie jak GPT-3). Cicero przewiduje zachowanie innych graczy podczas każdej gry, obserwując stan planszy i historię dialogów. Tworzy strategię, którą wprowadza w życie, korzystając z modelu językowego, który może prowadzić do dialogu, który brzmi jak człowiek, umożliwiając pracę z innymi uczestnikami.

Rdzeń osobowości Cycerona można znaleźć w jego naturalnych zdolnościach językowych, które Meta określa jako „sterowalny model dialogu”. Cicero używa ogromnego zbioru tekstu zeskrobanego z sieci, podobnie jak GPT-3.
„Aby zbudować kontrolowany model dialogu, zaczęliśmy od 2,7 miliarda parametrów modelu języka podobnego do BART, wstępnie wytrenowanego na tekście z Internetu i dostrojonego w ponad 40 000 ludzkich gier na webDiplomacy.net” stwierdził Meta.
Ostateczny model uchwycił niuanse wymagającej gry. Według Meta Cyceron „może na przykład wywnioskować, że w dalszej części gry będzie potrzebował wsparcia jednego konkretnego gracza”, mówi Meta, „a następnie opracować strategię, aby zdobyć przychylność tej osoby — a nawet rozpoznać ryzyko i szanse które ten gracz widzi ze swojego szczególnego punktu widzenia”.
Pod nagłówkiem „Gra na poziomie ludzkim w grę dyplomacji poprzez łączenie modeli językowych ze strategicznym rozumowaniem” badanie Meta Cicero AI zostało opublikowane w czasopiśmie Nauki ścisłe.
Jeśli chodzi o szersze zastosowania, Meta twierdzi, że jej badanie Cicero może „złagodzić bariery komunikacyjne” między ludźmi a sztuczną inteligencją, na przykład poprzez podtrzymywanie przedłużającej się dyskusji, aby nauczyć kogoś nowej umiejętności. Lub może to być siła napędowa gry wideo, w której NPC mogą rozmawiać jak ludzie, wychwytując intencje gracza i zmieniając się w miarę upływu czasu.

Jednocześnie technologia ta może być wykorzystywana do manipulowania ludźmi poprzez podszywanie się pod ludzi i oszukiwanie ich w potencjalnie niebezpieczny sposób, w zależności od kontekstu. W związku z tym Meta ma nadzieję, że inni badacze będą mogli budować na swoim kodzie „w odpowiedzialny sposób” i twierdzi, że podjęła kroki w kierunku wykrycia i usunięcia „toksycznych wiadomości w tej nowej domenie”, co prawdopodobnie odnosi się do dialogu Meta Cicero AI, którego nauczył się z Internetu teksty, które połknął—zawsze ryzyko dla dużych modeli językowych.
Firma dostarczyła m strona szczegółowa aby wyjaśnić, jak działa Meta Cicero AI, a także udostępnił kod Cicero na zasadach open source na GitHubie. online Dyplomacja fani — a może nawet reszta z nas — mogą potrzebować uważać.
Niemniej jednak, w zależności od sytuacji, technologia ta może zostać wykorzystana do oszukiwania osób i manipulowania nimi poprzez podszywanie się pod inne osoby. Prawdopodobnie odnosząc się do dialogu, który Cicero wychwycił z internetowych tekstów, które połknął – zawsze ryzyko dla dużych modeli językowych – Meta mówi, że podjęła kroki w kierunku wykrycia i usunięcia „toksycznych wiadomości w tej nowej domenie” i ma nadzieję, że inni badacze będą opierać się na swojego kodeksu „w odpowiedzialny sposób”.
Oprócz opublikowania kodu źródłowego dla Meta Cicero AI na GitHubfirma utrzymuje a kompleksowa strona internetowa wyjaśniając, jak to działa. Fani dyplomacji online powinni mieć się na baczności, podobnie jak reszta z nas.
Jak grać w webDiplomacy?
Celem dyplomacji jest bycie pierwszym krajem, który kontroluje połowę centrów zaopatrzenia w grze. Możesz to zrobić, przesuwając swoje siły po planszy i angażując się w walkę z innymi graczami, aby przejąć kontrolę nad ich centrami zaopatrzenia. Pod koniec roku za każde kontrolowane przez ciebie centrum zaopatrzenia możesz zbudować nową jednostkę, której możesz użyć do przejęcia większej liczby centrów zaopatrzenia i poprowadzenia swojej sprawy ku zwycięstwu. Musisz rozwiązać jednostkę zamiast tracić centrum zaopatrzenia na rzecz innego gracza, pozostawiając mniej jednostek do konkurowania o więcej centrów zaopatrzenia.
- Aby uzyskać więcej informacji, możesz odwiedzić webDiplomacy to własna strona internetowa.
Source: Meta Cicero AI osiąga wydajność na poziomie człowieka w grze planszowej Diplomacy







