NVIDIA Vera Rubin Superchip - omówienie platformy AI o pięciokrotnie wyższej wydajności niż Grace Blackwell

NVIDIA Vera Rubin Superchip - omówienie platformy AI o pięciokrotnie wyższej wydajności niż Grace Blackwell Jakiś czas temu na konferencji GTC w Waszyngtonie CEO NVIDIA, Jensen Huang, zaprezentował prototyp testowy platformy NVIDIA Vera Rubin Superchip. Teraz, podczas targów CES 2026, ku zaskoczeniu wielu, przedstawiono szerokie omówienie tej zaawansowanej platformy AI, której chipy są już w pełnej produkcji w zakładach TSMC. Sprawdźmy, jakie możliwości oferuje akcelerator AI o wymiarach porównywalnych do płyty głównej w formacie ATX.

Na targach CES 2026 odbyła się oficjalna premiera NVIDIA Vera Rubin Superchip, a wraz z nią prezentacja konstrukcji tej zaawansowanej platformy AI. Ma ona oferować 5-krotnie wyższą wydajność niż Grace Blackwell i wykorzystywać dwa GPU Rubin o łącznej mocy obliczeniowej 100 PFLOPs.

NVIDIA Vera Rubin Superchip – prezentacja prototypu wielkości płyty głównej, który wejdzie do produkcji już w przyszłym roku

NVIDIA Vera Rubin Superchip to kompletna platforma AI, która jest gotowym i zunifikowanym węzłem w serwerze (szafie rack) NVL72. Składa się z dwóch układów GPU Rubin, jednego procesora ARM Vera, przełącznika NVLink 6 oraz chipu BlueField‑4 zintegrowanego z układem ConnectX‑9 SuperNIC, odpowiadających za wysokowydajną łączność i komunikację w systemie. GPU Rubin to układy składające się z dwóch chipletów, łącznie z 336 miliardami tranzystorów, oferujące wydajność inferencji (zapytania do modelu AI) na poziomie 50 PFLOPS w dokładności FP4 oraz wydajność treningu na poziomie 35 PFLOPS, co stanowi odpowiednio 5‑krotny i 3,5‑krotny wzrost w porównaniu do GPU B200 (Blackwell). Przepustowość pojedynczego chipu wynosi 22 TB/s (2,8-krotny wzrost w porównaniu do Blackwell), przy pojemności pamięć operacyjnej HBM4 równej 288 GB na jednostkę GPU.

AMD Instinct MI400 z 432 GB pamięci HBM4 zadebiutuje w 2026 roku. AMD EPYC Verano z premierą w 2027 roku

Procesor Vera posiada 88 rdzeni ARM, wykorzystujących autorską architekturę Olympus, 176 wątków logicznych (NVIDIA Spatial Multi-Threading) oraz 227 miliardów tranzystorów. Chip oferuje 1,2 TB/s przepustowości pamięci SOCAMM LPDDR5X o pojemności 1,5 TB. W ramach serwera NVL72 pamięć procesorów działa jak spójna macierz, a każdy procesor może zaadresować wspomnianą pojemność, jednocześnie korzystając z funkcji Confidential Computing. Oznacza to, że dane przetwarzane w czasie rzeczywistym są chronione nawet przed systemem operacyjnym, hypervisorem czy administratorem – tworzone jest wydzielone, zaufane środowisko wykonawcze (TEE). W praktyce operacje na danych są bezpieczne i nie mogą zostać odczytane ani zmodyfikowane przez nieuprawnione podmioty. W połączeniu z innymi komponentami platformy procesor Vera oferuje 2-krotnie większą wydajność w przetwarzaniu danych, kompresji i automatyzacji CI/CD w porównaniu do procesora NVIDIA Grace.

NVIDIA GeForce RTX 5000 – Układy graficzne Blackwell mają mieć znacznie zmniejszoną produkcję w 2026 roku

Następnym chipem jest przełącznik NVLink 6, który odpowiada za łączność między dwoma GPU na PCB platformy z prędkością 3,6 TB/s dwukierunkowo, a także umożliwia komunikację all‑to‑all między wszystkimi GPU w serwerze NVL72 – 400G SerDes (400 Gb/s). Ponadto pozwala CPU na efektywną komunikację z dwoma GPU poprzez interfejs NVLink C2C z prędkością 1,8 TB/s dwukierunkowo, co eliminuje ograniczenia powolnego (z tej perspektywy) PCIe. Dodatkowo chip jest w stanie wykonać 14,4 TFLOPS obliczeń w precyzji FP8 „w sieci”, co oznacza, że część operacji obliczeniowych może być wykonywana bezpośrednio w chipie sieciowym (in‑network compute), zwiększając wydajność kolektywnych obliczeń i redukcji danych typowych dla modeli AI. Sam tylko przełącznik NVLink 6 posiada 108 miliardów tranzystorów.

NVIDIA RTX PRO 5000 Blackwell – Profesjonalna karta graficzna od teraz z o połowę większą ilością pamięci GDDR7

Układ NVIDIA BlueField‑4 wraz z towarzyszącym mu chipem ConnectX‑9 tworzy sieciowe serce platformy NVIDIA Vera Rubin Superchip, odpowiadając za połączenia zewnętrzne w porównaniu do NVLink 6, który działa wewnątrz węzłów i serwerów. BlueField‑4 DPU (Data Processing Unit) to wyspecjalizowany „procesor infrastrukturalny” wyposażony w 64‑rdzeniowy procesor ARM Grace, który przejmuje zadania tradycyjnie realizowane przez system operacyjny hosta, takie jak zarządzanie ruchem sieciowym, bezpieczeństwo, logika przepływu danych i akceleracja usług, odciążając tym samym CPU. Dodatkowo BlueField‑4 obsługuje połączenia o przepustowości do 800 Gb/s dla sieci w centrach danych. Natomiast chip ConnectX‑9 to bardzo zaawansowana karta sieciowa oferująca przepustowość 1,6 Tb/s (200G PAM4 SerDes), przyspieszanie RDMA, akcelerację ścieżek danych i zaawansowane funkcje bezpieczeństwa, w tym sprzętową kryptografię dla ruchu sieciowego. Oba układy umożliwiają między innymi komunikację między serwerami NVL72 i integrację z infrastrukturą centrów danych. Warto dodać, że układ BlueField-4 zawiera 126 miliardów tranzystorów, a chip ConnectX-9 składa się z 23 miliardów tranzystorów.

NVIDIA wydała trzykrotność wartości firmy Groq! To największy deal w historii firmy. Co kupują za 20 miliardów dolarów?

Warto podkreślić, że opisany węzeł nie funkcjonuje samodzielnie, lecz stanowi element serwera NVL72, który składa się z 36 takich węzłów (36 CPU i 72 GPU). Są one połączone bezkablowo za pomocą bezpośrednich konektorów oraz w całości chłodzone cieczą. Cały serwer NVL72 zapewnia 5-krotnie wyższą wydajność inferencji w precyzji FP4, sięgającą 3,6 EFLOPS, a także 3,5-krotnie wyższą wydajność treningu modeli AI na poziomie 2,5 EFLOPS w porównaniu do serwerów GB200 NVL72 (Grace Blackwell). Równocześnie znacząco zwiększono zasoby pamięciowe – pojemność pamięci LPDDR5X wzrosła 2,5-krotnie do 54 TB, natomiast pojemność HBM4 zwiększono o 50% do 20,7 TB, przy jednoczesnym niemal 3-krotnym wzroście jej przepustowości do 1,6 PB/s. Całość uzupełnia 2-krotnie wyższa przepustowość komunikacji typu scale-up, sięgająca 260 TB/s, co znacząco zwiększa efektywność współpracy wszystkich komponentów systemu. Dzięki tym innowacjom omawiana platforma pozwala na 10-krotne obniżenie kosztu tokenów inferencyjnych oraz 4-krotne zmniejszenie liczby GPU potrzebnych do trenowania modeli MoE w porównaniu do GB200 (Grace Blackwell).

NVIDIA wznawia produkcję układu GeForce RTX 3060. Kultowy model Ampere ma zaspokoić potrzeby oszczędnych graczy

NVIDIA zaprezentowała również zaawansowany przełącznik sieciowy Spectrum-X Ethernet Co-Packaged Optics, oferujący przepustowość do 102,4 Tb/s oraz spakowaną fotonikę krzemową (integralna część układów scalonych) o prędkości 200 Gb/s. Spectrum-X jest odrębnym produktem i nie stanowi fizycznej części serwerów NVL72 z węzłami NVIDIA Vera Rubin Superchip, jednak z punktu widzenia architektury systemowej jest ich integralnym elementem. Wraz z układami NVIDIA BlueField-4 oraz ConnectX-9 tworzy spójną warstwę sieciową, która łączy serwery NVL72 i umożliwia skalowanie infrastruktury w kierunku dużych konfiguracji DGX SuperPOD (wielu serwerów (szaf rack) połączonych w jeden spójny system obliczeniowy).

NVIDIA DLSS 4.5 oficjalnie zaprezentowany. Nowy model Transformer 2 oraz Multi Frame Generation w wersji x6

NVIDIA planuje także wprowadzenie Vera Rubin Ultra NVL576, którego premiera przewidziana jest na drugą połowę 2027 roku. W tej większej konfiguracji jeden węzeł będzie wyposażony w cztery GPU Rubin Ultra z 1 TB pamięci HBM4E rozmieszczonej w 16 modułach. Ponadto NVIDIA przygotowuje serwery Vera Rubin NVL144 CPX, w których na PCB węzłów znajdą się dodatkowe układy GPU CPX (po jednym chiplecie z GPU Rubin), przeznaczone do obsługi modeli AI o bardzo długich kontekstach. O czym więcej piszemy tutaj. Wracając do Vera Rubin Superchip, układy wchodzące w skład platformy są już w masowej produkcji u TSMC i trafiają do laboratoriów NVIDIA. Podsumowując, omawiana platforma będzie wykorzystywana zarówno w konfiguracjach DGX SuperPOD z 8 serwerami Vera Rubin NVL72, jak i w mniejszych centrach danych dzięki serwerom DGX Rubin NVL8. Obie konfiguracje mają trafić do klientów w drugiej połowie 2026 r.

Źródło: NVIDIA

NVIDIA Vera Rubin Superchip – omówienie platformy AI o pięciokrotnie wyższej wydajności niż Grace Blackwell

Tags: