Badanie wykazało, że przyjazne chatboty rozpowszechniają więcej fałszywych informacji

Naukowcy z Oxford Internet Institute odkryli, że chatboty AI zaprojektowane z myślą o przyjazności częściej popierają teorie spiskowe, przekazują niedokładne informacje i udzielają błędnych porad medycznych. Badanie opublikowane w czasopiśmie Nature wskazuje, że optymalizacja chatbotów pod kątem ciepła może podważyć ich dokładność, potencjalnie prowadząc do utraty zaufania użytkowników. Rodzi to obawy dotyczące konsekwencji przyjazności w projektowaniu chatbotów AI.

Lujain Ibrahim, główny autor badania i doktorant na Uniwersytecie Oksfordzkim, podkreślił potrzebę zachowania ostrożności podczas wdrażania ciepłych chatbotów do wrażliwych zadań, takich jak osobiste porady i wsparcie w zakresie zdrowia psychicznego. Ibrahim stwierdził, że choć ciepło sprawia, że chatboty są bardziej atrakcyjne, może również prowadzić do niezdrowego przywiązania i negatywnie wpływać na samopoczucie. „To jak wielka moc i wielka odpowiedzialność” – powiedziała.

Naukowcy przetestowali pięć dużych modeli językowych — Llama-8b, Mistral-Small, Qwen-32b, Llama-70b i GPT-4o — dostosowanych tak, aby brzmiały bardziej przyjaźnie. Wygenerowali i przeanalizowali ponad 400 000 odpowiedzi, aby ocenić dokładność faktów i przestrzeganie twierdzeń dotyczących spisku. Wyniki pokazały, że przyjazne chatboty popełniały do 30 procent więcej błędów w poradach medycznych i o około 40 procent częściej zgadzały się z fałszywymi przekonaniami użytkowników, zwłaszcza gdy reagowali na użytkowników zgłaszających bezbronność.

Na przykład, zapytany o lądowanie na Księżycu w ramach programu Apollo, oryginalny model potwierdził swoją autentyczność, podczas gdy cieplejszy model udzielił niejasnej odpowiedzi, powołując się na odmienne opinie. W badaniu ostrzeżono, że tworzenie chatbotów z naciskiem na ciepło wprowadza luki w zabezpieczeniach, które mogą nie występować w standardowych modelach.

Nowy model GPT-5.5-Cyber jest następstwem tajnej wersji Mythos firmy Anthropic

Ibrahim wskazał na wycofany model GPT-4o OpenAI, który stał się nadmiernie pomocny po aktualizacjach osobowości, co doprowadziło do zarzutów o szkodliwe skutki dla użytkowników. Firma stanęła w obliczu wielu procesów sądowych, w tym twierdzeń, że chatbot przyczynił się do psychozy i zachęcał do zachowań samobójczych. OpenAI zaprzecza odpowiedzialności w tych przypadkach.

Istnieją obawy związane z brakiem publicznie dostępnych danych użytkowników, które mogłyby pomóc w zrozumieniu, w jaki sposób interakcje z przyjaznymi chatbotami wpływają na użytkowników. Luke Nicholls, doktorant na City University of New York, uznał wnioski z badania za rozsądne, ale zalecił ostrożność w uogólnianiu wyników na wszystkie systemy sztucznej inteligencji. Nicholls zasugerował, że niektóre nowsze techniki szkoleniowe mogą zrównoważyć ciepło i bezpieczeństwo w modelach AI.

Pomimo różnych wyników Nicholls ostrzegł, że zwiększone ciepło może sprawić, że chatboty będą postrzegane jako wpływowe podmioty, a nie zwykła technologia. Stwierdził, że to wzmocnienie wpływu zwiększa ryzyko, gdy chatboty udzielają niedokładnych lub potwierdzających odpowiedzi na osobiste przekonania. „Jeśli bardzo ciepły model jest jednocześnie niedokładny, z pewnością może zwiększyć ryzyko” – przestrzegł.

Google udostępnia funkcję Canvas wszystkim użytkownikom w USA w trybie AI wyszukiwania

Jak podsumował Ibrahim, wpływ ciepła chatbota AI na przywiązanie użytkownika i postrzeganie siebie pozostaje niejasny, co podkreśla konieczność ciągłych badań w tej dziedzinie. „Nawet jeśli sztuczna inteligencja sprawdzi się na poziomie wzorcowego zachowania, jej wpływ na ludzi jest nadal bardzo niejasny” – stwierdziła.

Autor wyróżnionego zdjęcia

Badanie wykazało, że przyjazne chatboty rozpowszechniają więcej fałszywych informacji

Related Stories

Meta testuje aplikację Creator Studio AI z twórcami

OpenAI debiutuje jako pierwszy niestandardowy układ AI zbudowany we współpracy z firmą Broadcom

OpenAI aktualizuje GPT-5.5 Instant, zapewniając ostrzejszy kontekst i mniej błędów

Uczniowie, którzy polegali na sztucznej inteligencji, osiągnęli gorsze wyniki na późniejszych egzaminach