GTC 2024 rozpoczęło się z hukiem, a NVIDIA zaprezentowała kolejną generację akceleratorów AI, B200 I GB200 Procesory graficzne zbudowane w oparciu o przełomową architekturę Blackwell.
Procesory te stanowią ogromny krok w dziedzinie obliczeń AI i zostały zaprojektowane z myślą o sprostaniu stale rosnącej złożoności współczesnych obciążeń.
B200 może pochwalić się monolityczną konstrukcją z rekordową liczbą tranzystorów, podczas gdy GB200 wykorzystuje podejście wielochipowe, łącząc moc wielu procesorów B200 z procesorem Grace, zapewniając niezrównaną wydajność.
Razem te procesory graficzne oferują radykalny wzrost mocy obliczeniowej i pojemności pamięci, torując drogę postępowi w wielu dziedzinach, które w dużym stopniu opierają się na sztucznej inteligencji.
Monolityczny cud NVIDIA B200
NVIDIA B200 to arcydzieło inżynierii, mogące poszczycić się oszałamiającą liczbą 208 miliardów tranzystorów. To niezwykłe osiągnięcie jest możliwe dzięki konstrukcji chipletu, w której dwie masywne matryce są płynnie zintegrowane.
B200 to potęga obliczeniowa, oferująca trzykrotny wzrost wydajności obliczeń o wysokiej precyzji FP64 w porównaniu do swojego poprzednika opartego na Hopperze.
Być może najbardziej uderzająca jest zdolność B200 do wykonywania zadań wnioskowania AI.
twierdzi NVIDIA ten procesor graficzny zapewnia zdumiewającą pięciokrotną poprawę w porównaniu z H200. Ten skok wydajności jest znaczący w przypadku wdrażania dużych modeli językowych (LLM) i innych aplikacji AI, które w dużym stopniu opierają się na wnioskowaniu.
Oto każdy szczegół techniczny Nvidii B200 dla potentatów technologicznych:
Specyfikacja | Detale |
Architektura | Blackwella |
Proces wytwarzania | TSMC N4P (niestandardowa klasa 4 nm) |
Liczba tranzystorów | 208 miliardów (w dwóch chipletach) |
Typ pamięci | HBM3E |
Pojemność pamięci | 192 GB (stosy 8 x 24 GB) |
Przepustowość pamięci | 8 TB/s |
Interfejs NVLink | 1,8 TB/s |
Wydajność obliczeniowa FP64 | 3x poprawa w stosunku do H100 |
Wydajność wnioskowania AI | 5x poprawa w stosunku do H100 |
GB200 łączy w sobie architekturę Grace i Blackwell
GB200 rozwija koncepcję „superchipu”, łącząc moc dwóch procesorów graficznych B200 z procesorem Grace za pośrednictwem połączenia międzyukładowego NVLink o bardzo niskim poborze mocy.
Ta konfiguracja zapewnia jeszcze bardziej imponującą wydajność i pojemność pamięci dostosowaną do najbardziej wymagających obciążeń AI.
Funkcje GB200 obejmują:
- Ogromna pojemność pamięci: Zaprojektowany, aby sprostać wymaganiom pamięciowym A model sztucznej inteligencji o bilionach parametrów
- Szybka sieć: Obsługa platform Ethernet NVIDIA Quantum-X800 InfiniBand i Spectrum-X800 z ultraszybkie prędkości 800 Gb/s
- Skalowalność wielu węzłów: GB200 stanowi podstawę NVIDIA GB200 NVL72, chłodzonego cieczą systemu do montażu w szafie, zapewniającego najwyższy poziom intensywności obliczeniowej
Oto krótki przegląd specyfikacji GB200:
Specyfikacja | Detale |
Architektura | Blackwella |
składniki | 2 procesory graficzne B200 + procesor NVIDIA Grace |
Połączyć się | NVLink o bardzo małej mocy 900 GB/s (chip na chip) |
Pojemność pamięci | 384GB HBM3E |
Całkowita przepustowość pamięci | 16 TB/s |
Wsparcie sieciowe | NVIDIA Quantum-X800 InfiniBand (800 Gb/s), Spectrum-X800 Ethernet (800 Gb/s) |
Konfiguracja systemu | GB200 NVL72 (chłodzony cieczą, do montażu w szafie) |
Potencjalny wpływ B200 i GB200 rozciąga się na wiele branż i zastosowań.
Ich potężne przyspieszenie idealnie nadaje się do szkolenia i wdrażania ogromnych generatywnych modeli sztucznej inteligencji, zmieniających sposób, w jaki tworzymy grafikę, tekst, kod i nie tylko.
Modele B200/GB200 zapewniają ulepszone usługi w takich obszarach, jak przetwarzanie języka naturalnego i systemy rekomendacji. Naukowcy zyskają także precyzję i szybkość w takich dziedzinach, jak odkrywanie leków, modelowanie klimatu i materiałoznawstwo.
Blackwell na dużą skalę
NVIDIA ogłosiła jednocześnie DGX SuperPOD, zaprojektowany specjalnie, aby wykorzystać moc GB200 Grace Blackwell Superchips. To rozwiązanie „pod klucz” oferuje zoptymalizowaną platformę do skalowania obciążeń generatywnych AI z wiodącą w branży niezawodnością.
Przyszłość akceleracji AI
Karty NVIDIA B200 i GB200 stanowią znaczący postęp w przetwarzaniu sztucznej inteligencji i wyznaczają nowy rekord w dziedzinie wydajnych rozwiązań akceleracyjnych.
Te przełomowe procesory graficzne, dzięki swoim zaletom w zakresie wydajności i pamięci, są w stanie napędzać innowacje i przesuwać granice tego, co jest możliwe w wielu sektorach.
Autor wyróżnionego obrazu: pvproductions/Freepik.
Source: NVIDIA właśnie wprowadziła na rynek chipy AI nowej generacji B200 i GB200