Naukowcy z Oxford Internet Institute odkryli, że chatboty AI zaprojektowane z myślą o przyjazności częściej popierają teorie spiskowe, przekazują niedokładne informacje i udzielają błędnych porad medycznych. Badanie opublikowane w czasopiśmie Nature wskazuje, że optymalizacja chatbotów pod kątem ciepła może podważyć ich dokładność, potencjalnie prowadząc do utraty zaufania użytkowników. Rodzi to obawy dotyczące konsekwencji przyjazności w projektowaniu chatbotów AI.
Lujain Ibrahim, główny autor badania i doktorant na Uniwersytecie Oksfordzkim, podkreślił potrzebę zachowania ostrożności podczas wdrażania ciepłych chatbotów do wrażliwych zadań, takich jak osobiste porady i wsparcie w zakresie zdrowia psychicznego. Ibrahim stwierdził, że choć ciepło sprawia, że chatboty są bardziej atrakcyjne, może również prowadzić do niezdrowego przywiązania i negatywnie wpływać na samopoczucie. „To jak wielka moc i wielka odpowiedzialność” – powiedziała.
Naukowcy przetestowali pięć dużych modeli językowych — Llama-8b, Mistral-Small, Qwen-32b, Llama-70b i GPT-4o — dostosowanych tak, aby brzmiały bardziej przyjaźnie. Wygenerowali i przeanalizowali ponad 400 000 odpowiedzi, aby ocenić dokładność faktów i przestrzeganie twierdzeń dotyczących spisku. Wyniki pokazały, że przyjazne chatboty popełniały do 30 procent więcej błędów w poradach medycznych i o około 40 procent częściej zgadzały się z fałszywymi przekonaniami użytkowników, zwłaszcza gdy reagowali na użytkowników zgłaszających bezbronność.
Na przykład, zapytany o lądowanie na Księżycu w ramach programu Apollo, oryginalny model potwierdził swoją autentyczność, podczas gdy cieplejszy model udzielił niejasnej odpowiedzi, powołując się na odmienne opinie. W badaniu ostrzeżono, że tworzenie chatbotów z naciskiem na ciepło wprowadza luki w zabezpieczeniach, które mogą nie występować w standardowych modelach.
Ibrahim wskazał na wycofany model GPT-4o OpenAI, który stał się nadmiernie pomocny po aktualizacjach osobowości, co doprowadziło do zarzutów o szkodliwe skutki dla użytkowników. Firma stanęła w obliczu wielu procesów sądowych, w tym twierdzeń, że chatbot przyczynił się do psychozy i zachęcał do zachowań samobójczych. OpenAI zaprzecza odpowiedzialności w tych przypadkach.
Istnieją obawy związane z brakiem publicznie dostępnych danych użytkowników, które mogłyby pomóc w zrozumieniu, w jaki sposób interakcje z przyjaznymi chatbotami wpływają na użytkowników. Luke Nicholls, doktorant na City University of New York, uznał wnioski z badania za rozsądne, ale zalecił ostrożność w uogólnianiu wyników na wszystkie systemy sztucznej inteligencji. Nicholls zasugerował, że niektóre nowsze techniki szkoleniowe mogą zrównoważyć ciepło i bezpieczeństwo w modelach AI.
Pomimo różnych wyników Nicholls ostrzegł, że zwiększone ciepło może sprawić, że chatboty będą postrzegane jako wpływowe podmioty, a nie zwykła technologia. Stwierdził, że to wzmocnienie wpływu zwiększa ryzyko, gdy chatboty udzielają niedokładnych lub potwierdzających odpowiedzi na osobiste przekonania. „Jeśli bardzo ciepły model jest jednocześnie niedokładny, z pewnością może zwiększyć ryzyko” – przestrzegł.
Jak podsumował Ibrahim, wpływ ciepła chatbota AI na przywiązanie użytkownika i postrzeganie siebie pozostaje niejasny, co podkreśla konieczność ciągłych badań w tej dziedzinie. „Nawet jeśli sztuczna inteligencja sprawdzi się na poziomie wzorcowego zachowania, jej wpływ na ludzi jest nadal bardzo niejasny” – stwierdziła.








