
Наступне покоління NVIDIA Vera Rubin вже перебуває на стадії повного виробництва, і компанія надала нам детальний огляд архітектури стійки, заглиблюючись в окремі компоненти.
NVIDIA Vera Rubin: Шість Нових Покращених Чіпів, Розширена Рідинна Система Охолодження та Флагманський NVLink 6 Spine
Коли ми говоримо про еволюцію стійок, NVIDIA готує значні оновлення з Vera Rubin, які ми розглянемо детально. Нещодавнє відео від CNBC, присвячене архітектурі Vera Rubin, дозволило нам отримати всебічний погляд на численні компоненти, від основного обчислювального вузла до мережевих та охолоджувальних елементів. Найважливіше, Старший директор з інфраструктури NVIDIA, Діон Харріс, називає Vera Rubin однією з “найскладніших систем ШІ у світі”, стверджуючи, що те, що робить NVIDIA, є унікальним і складним у виконанні.
З огляду на те, що Vera Rubin очікує на замовлення від клієнтів найближчим часом, важливо заглибитись у те, як виглядає стійка NVL72. І, звісно, одним з найважливіших елементів стійки є сам SuperChip Vera Rubin. Ми вже обговорювали технічні аспекти конфігурації GPU Rubin та CPU Vera, але варто зазначити, що значні покращення продуктивності досягаються завдяки інтеграції NVIDIA HBM4 з GPU, а також спеціалізованих модулів SOCAMM. Загалом, пропускна здатність пам’яті сягає вражаючих 1.2 ТБ/с.

Суттєве оновлення від NVIDIA з Vera Rubin також стосується системи охолодження, оскільки Team Green планує інтегрувати модульні рідинні системи охолодження, що охоплюють елементи SuperChip, такі як Rubin GPU та Vera CPU, за допомогою спеціалізованих холодових пластин. Керівництво NVIDIA стверджує, що розгортання Vera Rubin переконає гіперскейлерів перейти на модернізовані системи рідинного охолодження. Цікаво, що поточна реалізація зменшує використання води, що є ще однією перевагою, яку рекламує NVIDIA.


2 з 9
NVLink є важливим аспектом Vera Rubin NVL72, і з інтерконект-мережею 6-го покоління, яку часто називають “NVLink Spine”, NVIDIA планує забезпечити загальну сукупну пропускну здатність 260 ТБ/с на стійку. Харріс зазначає, що з останнім поколінням NVLink компанія вивела модульність на абсолютно новий рівень, тому стверджує, що NVLink 6 spine підтримує обслуговування з нульовим простоєм та RAS-сервіси на рівні стійки.

Хоча оцінки свідчать про те, що Vera Rubin дебютує зі значним підвищенням ціни, NVIDIA стверджує, що архітектура забезпечує 10-кратне зниження вартості токена інференсу та 4-кратне зменшення кількості GPU для навчання моделей MoE порівняно з Blackwell GB200. Це означає, що правило генерального директора NVIDIA “чим більше купуєш, тим більше заощаджуєш” залишається чинним.
Чи варто купувати? (Порада ІТ-Блогу): Хоча очікується зростання ціни, заявлені NVIDIA покращення продуктивності та ефективності (10x зниження вартості інференсу, 4x менше GPU для тренування MoE) роблять Vera Rubin потенційно вигідною інвестицією для корпоративних клієнтів, де масштабованість та зниження операційних витрат є пріоритетом. Для менших проєктів це, ймовірно, буде надмірним рішенням.
За матеріалами: wccftech.com
