Ostatnie badanie opublikowane w Granice w komunikacji rzucił krytyczne światło na wpływ sztucznej inteligencji na środowisko, ujawniając, że nie wszystkie podpowiedzi AI są równe, jeśli chodzi o emisję dwutlenku węgla. Badania podkreślają, że bardziej złożone „modele rozumowania” w dużych modelach językowych (LLM) mogą generować znacznie więcej CO₂ niż ich „zwięzłe” odpowiedniki, co powoduje obawy wśród badaczy i zwolenników klimatu dotyczące eskalacji zapotrzebowania na energię AI.
Badanie, które skrupulatnie oceniło 14 różnych LLM przy użyciu znormalizowanego zestawu 500 pytań w różnych obszarach tematycznych, wykazało bezpośrednią korelację między liczbą „tokenów myślenia” generowanych przez model na zapytanie a związaną z nim emisję CO₂. Maximilian Dauner, doktorant z Hochschule München University of Applied Sciences i główny autor artykułu, podkreślił, że „wpływ na środowisko przesłuchania wyszkolonych LLM jest silnie określany przez podejście rozumujące, z wyraźnym rozumowaniem procesów zwiększania zużycia energii i emisji węgla”.
W szczególności ustalenia wskazują, że modele rozumowania, które mają większy zestaw szkoleń i wymagają więcej czasu przetwarzania, wytwarzały znacznie wyższe wyniki CO₂. W niektórych przypadkach te wyrafinowane modele generowały do 50 -krotności emisji zwięzłych modeli. Ta rozbieżność jest dodatkowo pogarszana przez złożoność postawionych pytań; Otwarte lub skomplikowane zapytania, takie jak te obejmujące zaawansowaną algebrę lub koncepcje filozoficzne, spowodowały większy ślad węglowy w porównaniu z prostszymi podpowiedziami, takimi jak pytania o historię w szkole średniej.
Modele rozumowania, czasem określane jako „modele myślenia”, są zoptymalizowane pod kątem złożonych zadań wymagających logiki, rozpadów krok po kroku lub szczegółowych instrukcji. Modele te, zilustrowane przez wersje takie jak GPT-4O Openai i O1/O3-Mini, wykorzystują to, co badacze LLM określają przetwarzanie „łańcucha myślenia”. To pozwala im reagować bardziej celowo i generować bardziej ludzkie reakcje, choć wraz z kompromisem zwiększonego czasu przetwarzania, a tym samym wyższego zużycia energii. I odwrotnie, uogólnione modele priorytetowo traktują prędkość i przejrzystość dla prostszych zadań.
Naukowcy przeprowadzili testy w dwóch fazach: początkowo z pytaniami wielokrotnego wyboru, a następnie podpowiedzi wolnej odpowiedzi. Średnio modele rozumowania wygenerowały zadziwiające 543,5 tokenów na pytanie, co stanowi wyraźny kontrast z zaledwie 37,7 tokenami wyprodukowanymi przez zwięzłe modele. Na przykład „Cogito”, zidentyfikowane jako najdokładniejszy badany model rozumowania, wyprodukował trzykrotnie więcej CO₂, niż modele o podobnej wielkości zoptymalizowane pod kątem zwięzłych odpowiedzi. Artykuł wyraźnie stwierdza, że „z perspektywy środowiska modele rozumowania konsekwentnie wykazywały wyższe emisje, napędzane przede wszystkim z ich podwyższonej produkcji tokena”.
Podczas gdy różnica w emisji na indywidualną monit może wydawać się marginalny, skumulowany efekt na skalę jest znaczący. Badania projektują, że zadawanie 600 000 pytań R1 Deepseek wygenerowałby około taką samą ilość Co₂, jak lot w obie strony z Londynu do Nowego Jorku. Dla porównania, nieuzasadniony model QWEN 2.5 może odpowiedzieć na trzy razy więcej pytań przed osiągnięciem równoważnego poziomu emisji. Podkreśla to krytyczną kompromis między dokładnością LLM a zrównoważonym rozwojem środowiska, ponieważ wraz ze wzrostem wielkości modelu dokładność ma tendencję do poprawy ”, ale„ ten zysk jest również powiązany ze znacznym wzrostem zarówno emisji CO₂, jak i liczbą wygenerowanych tokenów ”.
Odkrycia te pojawiają się wśród zaciętej globalnej konkurencji między gigantami technologicznymi w celu opracowania coraz bardziej zaawansowanych modeli AI. Eskalacyjne zapotrzebowanie na infrastrukturę opartą na AI może przynieść znaczne obciążenie istniejących sieci energetycznych. W ciągu ostatniego roku Apple ogłosiło plany zainwestowania oszałamiającego 500 miliardów dolarów w centra produkcyjne i danych w ciągu najbliższych czterech lat. Podobnie, Project Stargate, inicjatywa współpracy z udziałem Openai, SoftBank i Oracle, zobowiązała się do centrów danych zorientowanych na sztuczną inteligencję. Niedawny raport z przeglądu technologii MIT wskazuje, że od 2017 r. Centra danych coraz częściej włączają energooszczędny sprzęt specjalnie zaprojektowany do złożonych obliczeń AI, co prowadzi do wzrostu zużycia energii.
Electric Power Research Institute (EPRI) szacuje, że centra danych wspierające zaawansowane modele AI mogą stanowić do 9,1 procent całkowitego zapotrzebowania na energię Stanów Zjednoczonych do końca dekady, co stanowi znaczny wzrost z około 4,4 procent. Aby zaspokoić ten rosnący zapotrzebowanie na energię, główne firmy technologiczne badają różnorodne strategie wytwarzania energii. Meta, Google i Microsoft mają wszystkie partnerstwa z elektrowniami jądrowymi. W szczególności Microsoft podpisał 20-letnią umowę o źródło energii z zakładu nuklearnego Three Mile Island w Pensylwanii w celu zasilania rosnącej floty centrum danych. Meta dokonuje również znacznych inwestycji w technologię geotermalną, podczas gdy dyrektor generalny Openai Sam Altman inwestuje w eksperymentalną fuzję jądrową, uznając, że nadchodzący wiek AI będzie wymagał „przełomu energii”. Pomimo tych wysiłków ostatnie badania sugerują, że jest prawie pewne, że więcej paliw kopalnych, zwłaszcza gazu ziemnego, będzie zobowiązanych do pełnego spełnienia ogromnych wymagań energetycznych AI.
Jednak naukowcy uważają, że ich odkrycia mogą umożliwić codziennym użytkownikom AI do złagodzenia wpływu na emisję emisji dwutlenku węgla. Rozumiejąc znacznie wyższą intensywność energii modeli rozumowania, użytkownicy mogliby wykorzystywać ich bardziej oszczędnie, opierając się na zwięzłych modelach dla ogólnych codziennych zadań, takich jak wyszukiwanie stron internetowych i podstawowa odpowiedź na pytania. Dauner podkreślił tę kwestię, stwierdzając: „Jeśli użytkownicy znają dokładny koszt wyników wygenerowanych przez AI, takich jak swobodne przekształcenie się w figurę, mogą być bardziej selektywne i przemyślane, kiedy i jak korzystają z tych technologii”. To proaktywne zachowanie użytkownika, w połączeniu z bieżącymi postępami w zakresie energooszczędnego projektowania sztucznej inteligencji, będzie miało kluczowe znaczenie w nawigacji w wyzwaniach środowiskowych, jakie stwarza szybkie rozszerzenie sztucznej inteligencji.
Source: AI Modele Modele, ślad węglowy








