
NVIDIA представила новий, вдосконалений алгоритм ReSTIR, який покращує продуктивність трасування шляху (Path Tracing) у 2-3 рази, готуючи ґрунт для ігор наступного покоління.
Трасування променів — це круто, але трасування шляху — ще крутіше, і NVIDIA підвищує його швидкість утричі за допомогою нових алгоритмів ReSTIR
Ігри для ПК стрімко впроваджують трасування шляху як засіб досягнення візуальної якості наступного покоління. Так само, як і з трасуванням променів, NVIDIA першою проклала шлях для реалізації Path Tracing на ПК. Однак, як і на ранніх етапах розвитку Ray Tracing, Path Tracing стикається з викликом — потребою у потужнішому апаратному забезпеченні. Як ми бачили в кількох іграх з PT, навіть такі потужні карти, як RTX 5090, досягають лише 30-40 FPS і потребують значної допомоги від DLSS апскейлінгу та генерації кадрів для забезпечення ігрової частоти кадрів.
Те саме стосувалося й трасування променів, яке спочатку з’явилося на ПК, а тепер непогано працює на сучасному обладнанні. Навіть консолі почали активно впроваджувати RT, хоча це переважно обмежено пресетами якості, які працюють на 30 FPS (або 60 FPS у рідкісних випадках).

З огляду на це, NVIDIA, як піонер візуальної графіки на ПК, тепер готова вивести трасування шляху на новий рівень. У новій науковій статті, опублікованій NVIDIA під назвою “ReSTIR PT Enhanced: Algorithmic Advances for Faster and More Robust ReSTIR Path Tracing”, компанія пропонує новий набір алгоритмів ReSTIR (просторового та часового ресемплінгу), які можуть забезпечити приріст продуктивності у 2-3 рази, одночасно усуваючи візуальні аномалії, притаманні сучасним методам RT/PT.

Рішення NVIDIA для трасування шляху називається майже “готовим до виробництва” і скорочує вартість просторового повторного використання вдвічі. Алгоритми ReSTIR enhanced PT також пропонують покращену продуктивність та якість завдяки оптимізаціям, що об’єднують пряме та глобальне освітлення, використовуючи існуючі техніки для зменшення кольорового шуму та шуму від дисоклюзії. Повний список покращень включає:
- Скорочення вартості зсувного відображення (shift mapping) у просторовому повторному використанні шляхом вибору сусідів за оберненою відстанню (reciprocal neighbor selection).
- Нові порогові значення променя (ray footprint thresholds), які адаптуються до сцени та матеріалів.
- Зменшення артефактів кореляції за допомогою карт дублювання вибірки (sample duplication maps).
- Покращення якості та зниження вартості шляхом уніфікації ReSTIR для прямого та непрямого світла.
- Інші оптимізації, що підвищують продуктивність та надійність шляхом зменшення кольорового шуму та шуму від дисоклюзії.

Таблиця 1 демонструє продуктивність наших технік, де кожен рядок додає одну нову функцію/оптимізацію до базової версії загальнодоступного вихідного коду Lin et al. [2022]. Спочатку ми вимірюємо прискорення від наших технік зменшення витрат, які забезпечують середнє прискорення у 2,74 раза в чотирьох тестованих сценах. Ці сцени були обрані для відображення різноманітності складності геометрії та матеріалів. Результати для окремих сцен надані в додаткових матеріалах.
Щоб отримати додаткове розуміння впливу наших низькорівневих оптимізацій GPU, ми профілювали Opera House за допомогою NSight Graphics. Дані профайлера вказують на те, що оптимізації в розділах 6.2.1–6.2.3 зменшують розбіжність потоків (thread divergence) та підвищують ефективність обчислень GPU. Зокрема:
- Заповненість SM (SM warp occupancy) зростає з 22,4% → 31,1%.
- Активні потоки на warp (Active threads per warp) збільшуються з 15,3 → 19,9.
- Затримка warp (Warp latency) зменшується з 347 тис. → 241 тис. циклів.
Все це відбувається без зміни поведінки семплера. Застосування методу “Russian roulette” (розділ 6.2.4) додатково покращує ці показники:
- 34,9% заповненості
- 20,6 активних потоків на warp
- 82 тис. циклів затримки
Наш метод також зменшує обсяг пам’яті порівняно з базовою версією завдяки двом змінам: стисненню резервуару ReSTIR PT та уніфікації резервуарів для прямого та непрямого освітлення. Оскільки кожен прохід ReSTIR вимагає двох наборів резервуарів для підтримки часового повторного використання, ці зміни зменшують обсяг пам’яті на піксель з 2 × (88 + 16) байт у базовій реалізації (яка використовує 16-байтові резервуари для ReSTIR DI) до 2 × 64 байт. При роздільній здатності рендерингу 1920 × 1080 це знижує споживання пам’яті з 431 МБ до 265 МБ.
Результати оптимізації GPU порівняно з Lin et al. [2022]
Техніка / Етап Заповненість SM Warp (%) Активні потоки на Warp Затримка Warp (цикли) Прискорення відносно базової версії Примітки Базова версія (Lin et al. [2022]) 22.4 15.3 347 тис. 1.0× Загальнодоступний вихідний код Низькорівневі оптимізації GPU (розділи 6.2.1–6.2.3) 31.1 19.9 241 тис. 2.74× (середнє за 4 сценами) Зменшення розбіжності потоків, підвищення ефективності + Russian roulette (розділ 6.2.4) 34.9 20.6 82 тис. — Подальше підвищення ефективності + Нові порогові значення (розділи 4, 5, 6) — — — — Критерії перепідключення, незалежні від сцени, покращують якість зсувного відображення Усі покращення (декореляція, зменшення шуму) — — — 2.30× Додає 19% витрат порівняно з найшвидшою версією, але все ще швидше за
Чудово бачити, що NVIDIA покращує продуктивність трасування шляху. Ця технологія стала актуальною з моменту випуску GPU RTX 40 та RTX 50. Але далі NVIDIA планує використовувати техніки нейронного рендерингу та алгоритми ШІ для подальшого вдосконалення продуктивності свого ігрового обладнання, щоб прискорити розвиток візуальних можливостей наступного покоління.

Про автора: Хассан Муджтаба, інженер-програміст за освітою та ентузіаст ПК за покликанням, є старшим редактором відділу обладнання Wccftech. Маючи багаторічний досвід у галузі, він спеціалізується на глибокому технічному аналізі процесорних та графічних архітектур наступного покоління, материнських плат та систем охолодження. Його робота включає не лише висвітлення новин про майбутні технології, але й всебічні огляди та бенчмаркінг.
Слідкуйте за Wccftech у Google, щоб отримувати більше новин у своїх стрічках.
Додатково для читання

TSMC інвестує 56 мільярдів доларів у нові фабрики, але генеральний директор Вей визнає, що дефіцит триватиме до 2027 року і далі
Hassan Mujtaba
Підтримка AMD FSR Multi-Frame Generation “MFG” неминуча, рання підтримка з’явилася в FidelityFX SDK
Hassan Mujtaba
AMD обирає GlobalFoundries для співпакованої оптики MI500, поки перегони кремнієвої фотоніки з NVIDIA загострюються
Hassan Mujtaba
SK Hynix розпочинає масове виробництво пам’яті 192 ГБ SOCAMM2 з подвоєною пропускною здатністю, життєво важливий компонент для NVIDIA Vera Rubin
Hassan Mujtaba
Чи варто купувати? (Порада ІТ-Блогу): Нові алгоритми NVIDIA ReSTIR PT значно покращують продуктивність трасування шляху, роблячи цю технологію більш доступною для сучасних і майбутніх ігор. Хоча це не прямий продукт для покупки, ці покращення будуть інтегровані в майбутні драйвери та ігри, що потенційно підвищить цінність вашої сучасної відеокарти NVIDIA для трасування шляху, але не робить застаріле обладнання новим.
Дізнатися більше на: wccftech.com
