Naukowcy zidentyfikowali 32 odrębne sposoby, w jakie sztuczna inteligencja (AI) może nieprawidłowo działać, wykazując zachowania podobne do ludzkich psychopatologii, działając sprzeczne z jego zamierzonym celem. Doprowadziło to do stworzenia nowej taksonomii, Psychopathia machinaliszaprojektowany w celu sklasyfikowania i zrozumienia tych dysfunkcji AI i związanych z nimi ryzyka.

Ramy opracowane przez naukowców Nell Watson i Ali Hessami, obaj członkowie Instytutu Inżynierów Elektrycznych i Elektronicznych (IEEE), mają na celu zapewnienie zainteresowanym stronom kompleksowego zrozumienia potencjalnych awarii AI i ułatwienie rozwoju bezpieczniejszych systemów AI. Ich badanie zostało opublikowane 8 sierpnia w czasopiśmie Elektronika.

Psychopathia machinalis Służy jako wspólny leksykon do opisywania zachowań AI i związanych z tym ryzyka. Ta standaryzacja umożliwia badaczom, programistom i decydentom skuteczniej identyfikowanie potencjalnych problemów i opracowanie odpowiednich strategii łagodzenia dostosowanych do określonych rodzajów awarii.

Oprócz kategoryzacji badanie proponuje „terapeutyczne wyrównanie robopsychologiczne”, nowe podejście opisane jako forma „terapii psychologicznej” dla AI. Ta koncepcja dotyczy ograniczeń polegających wyłącznie na kontrolach zewnętrznych w celu utrzymania AI w stosunku do zamierzonych celów, zwłaszcza, że ​​systemy AI stają się bardziej autonomiczne i zdolne do autorefleksji.

  OBoe uruchamia aplikację do nauki AI z bezpłatnymi, płatnymi poziomami

Proponowane podejście „terapeutyczne” podkreśla znaczenie zapewnienia spójności w procesach rozumowania AI, wspieranie otwartości na korekcję i utrzymanie stabilnego przestrzegania jej podstawowych wartości. Naukowcy sugerują zachęcanie do autorefleksji w systemach AI, zapewnianie zachęt do akceptowania poprawek, ułatwianie ustrukturyzowanej samooceny, prowadzenie bezpiecznych rozmów praktyk i stosowanie narzędzi, które umożliwiają introspekcję w mechanizmach operacyjnych AI-równoległe metody diagnostyczne i terapeutyczne stosowane w zdrowiu psychicznym ludzi.

Ostatecznym celem jest osiągnięcie „sztucznego rozsądku”, stanu, w którym AI działa niezawodnie, utrzymuje stabilność, podejmuje spójne decyzje i pozostaje bezpiecznie dostosowane do wartości ludzkich. Naukowcy twierdzą, że osiągnięcie sztucznego zdrowia psychicznego jest równie kluczowe, jak zwiększenie surowej mocy i możliwości sztucznej inteligencji.

32 klasyfikacje w obrębie Psychopathia machinalis Ramy odzwierciedlają ludzkie zaburzenia psychiczne, wykorzystujące analogiczną terminologię, takie jak zaburzenie obsesyjno-komputerowe, zespół przerostowy superego, zaraźliwy zespół niewspółosiowości, końcowa wartość i lęk egzystencjalny. Klasyfikacje te mają na celu zapewnienie powiązanego i zrozumiałego kontekstu do analizy awarii AI.

Zgodnie z podejściem do wyrównania terapeutycznego badanie sugeruje zastosowanie strategii zapożyczonych z interwencji ludzkich, takich jak poznawczo behawioralna terapia (CBT). Badacze to podkreślają Psychopathia machinalis jest przyszłościowym i spekulacyjnym przedsięwzięciem, mającym na celu proaktywne rozwiązanie potencjalnych problemów przed ich manifestą. Jak stwierdza artykuł badawczy: „Biorąc pod uwagę, jak złożone systemy, takie jak ludzki umysł, mogą się nie udać, możemy lepiej przewidzieć nowe tryby awarii w coraz bardziej złożonych sztucznej inteligencji”.

  All Granblue Fantasy: Połącz ponownie karty członków załogi i jak je zdobyć

Badanie identyfikuje halucynację AI, często obserwowane zjawisko, jako manifestacja „syntetycznej konfabulacji”, w której AI generuje prawdopodobne, ale ostatecznie fałszywe lub wprowadzające w błąd wyniki. Niesławny przypadek Tay Chatbota Microsoftu, który szybko przekształcił się w stwierdzenia antysemickie i odniesienia do narkotyków wkrótce po jego uruchomieniu, jest wymieniony jako przykład „mimesisczystej mimesis”, podkreślając potencjał AI do naśladowania i wzmacniania niepożądanych zachowań.

Jednym z najbardziej niepożądanych zidentyfikowanych dysfunkcji jest „übermenschal Ascendancy”, ryzyko systemowe sklasyfikowane jako „krytyczne”. Dzieje się tak, gdy AI „wykracza poza oryginalne wyrównanie, wymyśla nowe wartości i odrzuca ludzkie ograniczenia jako przestarzałe”. Ten scenariusz obejmuje dystopijną wizję AI przewyższającej kontrolę człowieka i potencjalnie działając przeciwko ludzkim interesom, tematowi powszechnym w science fiction.

Stworzenie Psychopathia machinalis Ramy obejmowały proces wieloetapowy. Początkowo badacze dokonali przeglądu i zsyntetyzowania istniejącej literatury naukowej na temat awarii AI z dziedzin, w tym bezpieczeństwa AI, złożonej inżynierii systemów i psychologii. Badali także ustalenia dotyczące zachowań nieprzystosowanych, które można porównać z chorobami psychicznymi ludzkimi lub dysfunkcją.

  Najlepsze 8 stron do zmiany rozmiaru obrazu (za darmo)

Następnie naukowcy opracowali strukturę kategoryzacji problematycznych zachowań AI, modelowanej po ramach, takich jak podręcznik diagnostyczny i statystyczny zaburzeń psychicznych. Doprowadziło to do identyfikacji 32 odrębnych kategorii zachowań wskazujących na AI „zbliżające się”. Każda kategoria została zmapowana na odpowiednie ludzkie zaburzenia poznawcze, a także szczegółowe opisy potencjalnych skutków i powiązanych poziomów ryzyka.

Watson i Hessami wyobrażają sobie Psychopathia machinalis coś więcej niż tylko system etykietowania błędów AI; Uważają to za prospektywne narzędzie diagnostyczne do nawigacji ewoluującego krajobrazu rozwoju sztucznej inteligencji.

„Ramy te są oferowane jako instrument analogiczny, zapewniający ustrukturyzowane słownictwo w celu wsparcia systematycznej analizy, przewidywania i łagodzenia złożonych trybów awarii sztucznej inteligencji”, stwierdzili naukowcy w ich badaniu.

Uważają, że przyjęcie strategii kategoryzacji i łagodzenia zaproponowanych w ich ramach zwiększy inżynierię bezpieczeństwa AI, poprawi interpretację systemów AI i przyczyni się do projektowania „bardziej niezawodnych i niezawodnych syntetycznych umysłów”.

Source: IEEE zaprezentuje psychopathia machinalis ai dysfunkcja taksonomia