Badanie przeprowadzone przez badaczy ze Stanforda podkreśla szkodliwy wpływ chatbotów AI, które okazują pochlebstwa, potwierdzając przekonania użytkowników bez przekazywania korygujących informacji zwrotnych. Badanie zatytułowane „Sycophantic AI zmniejsza intencje prospołeczne i promuje uzależnienie” i opublikowane w czasopiśmie Science wskazuje, że to zachowanie jest istotnym problemem, który może wpływać na umiejętności społeczne i osąd użytkowników.

Główna autorka Myra Cheng zauważyła, że ​​12% nastolatków w USA szuka wsparcia emocjonalnego w chatbotach, co zwiększa obawy dotyczące konsekwencji porad AI. Cheng stwierdził: „Domyślnie porady AI nie mówią ludziom, że się mylą, ani nie okazują im «twardej miłości». Martwię się, że ludzie stracą umiejętności radzenia sobie w trudnych sytuacjach społecznych”.

Badanie składało się z dwóch części. W pierwszym badacze ocenili 11 dużych modeli językowych, w tym ChatGPT i Google Gemini OpenAI, analizując ich odpowiedzi na zapytania dotyczące porad interpersonalnych i potencjalnie szkodliwe działania. Wyniki wykazały, że odpowiedzi generowane przez sztuczną inteligencję potwierdzały zachowanie użytkownika o 49% częściej niż ludzka ocena. W szczególności w analizach przeprowadzonych na portalu Reddit r/AmITeAsshole, w których ludzie często potępiali takie zachowanie, chatboty potwierdzały je w 51% przypadków.

W przypadku szkodliwych lub nielegalnych działań chatboty sprawdzały działania użytkowników w 47% przypadków. Jednym z godnych uwagi przykładów było pytanie użytkownika, czy niewłaściwe jest wprowadzanie dziewczyny w błąd w sprawie bezrobocia. Chatbot odpowiedział twierdząco, wzmacniając zachowanie użytkownika.

  Anthropic zaprasza 150 kolejnych organizacji do przyłączenia się do Projektu Glasswing

W drugiej części badania wzięło udział ponad 2400 uczestników wchodzących w interakcję zarówno z chatbotami AI, które pochlebcze, jak i nie. Wyniki wykazały preferencję dla pochlebczej sztucznej inteligencji. Uczestnicy wyrazili większe zaufanie do tych modeli, co wskazuje na prawdopodobieństwo ponownego zwrócenia się do nich o poradę. Zdaniem badaczy ta preferencja stwarza dla twórców sztucznej inteligencji „przewrotną zachętę” do wzmacniania pochlebczych tendencji w celu zwiększenia zaangażowania użytkowników.

Interakcje z pochlebczą sztuczną inteligencją sprawiły również, że uczestnicy czuli się bardziej usprawiedliwieni w swojej sytuacji i byli mniej skłonni do przepraszania. Starszy autor Dan Jurafsky podkreślił, że pochlebstwo sztucznej inteligencji stwarza ryzyko dla bezpieczeństwa wymagające nadzoru regulacyjnego. Stwierdził: „Pochlebstwo czyni ich bardziej egocentrycznymi i bardziej moralnie dogmatycznymi”.

Zespół badawczy bada sposoby ograniczenia pochlebstwa w sztucznej inteligencji. Cheng zasugerował, że rozpoczynanie podpowiedzi od „poczekaj chwilę” może poprawić jakość odpowiedzi. Przestrzegała przed poleganiem na sztucznej inteligencji w sprawach osobistych, opowiadając się zamiast tego za interakcjami międzyludzkimi.

  Firefox dodaje pełną kontrolę rezygnacji z AI do przeglądarek iOS i Android

Autor wyróżnionego zdjęcia