NVIDIA забезпечує підтримку DiffusionGemma від DeepMind одразу після релізу для RTX та DGX, досягаючи 150 токенів/с з DGX Spark

NVIDIA забезпечує підтримку DiffusionGemma від DeepMind одразу після релізу для RTX та DGX, досягаючи 150 токенів/с з DGX Spark 1

NVIDIA оголошує про повноцінну підтримку відкритої моделі штучного інтелекту DiffusionGemma від Google DeepMind для всіх своїх лінійок продуктів RTX та DGX.

Google представляє свою новітню модель ШІ: DiffusionGemma — NVIDIA надає повну підтримку в родинах DGX та RTX

Модель DiffusionGemma – це відкрита модель, призначена для швидкої генерації тексту. З її запуском NVIDIA анонсує підтримку в лінійках RTX та DGX. Що ще краще, хоча DiffusionGemma швидка, оптимізації NVIDIA для цієї моделі та її апаратного забезпечення роблять її ще швидшою.

Вітаємо @GoogleDeepMind із запуском DiffusionGemma.

Модель генерує 256 токенів паралельно за крок, видаючи 150+ TPS на DGX Spark та 1000+ TPS на одному H100.

Ми підтримуємо її з першого дня за допомогою:
• BF16 та NVFP4 чекпойнтів на @huggingface🤗
• Безкоштовні… pic.twitter.com/0xqMXKvMQV

— NVIDIA AI (@NVIDIAAI) June 10, 2026

Ось основні особливості моделі:

  • Паралельна генерація: DiffusionGemma обробляє до 256 токенів за крок, замість того, щоб передбачати їх по одному.
  • Побудована на базі Gemma 4: DiffusionGemma базується на Gemma 4, моделі “mixture-of-experts” із 26 мільярдами параметрів, яка активує лише 3,8 мільярда параметрів за крок, поєднуючи дифузійний “головний блок” з архітектурою Gemma 4 від Google.
  • До 4 разів вища продуктивність: Цей приріст означає швидку генерацію тексту, яка зазвичай сповільнюється на локальному обладнанні для генерації одним користувачем.
  • Відкрита та локальна: DiffusionGemma є відкритою моделлю з дозвільною ліцензією Apache 2.0 і працює повністю на RTX та DGX Spark — без хмари, без плати за токен — з підтримкою “нульового дня” в Hugging Face Transformers, vLLM та Unsloth.
Назва моделі DiffusionGemma
Підтримувані модальності Текст, зображення
Загальна кількість параметрів 25,2B
Активні параметри 3,8B
Довжина контексту До 256K токенів
Формат точності BF16, NVFP4

Зі свого боку, NVIDIA пропонує підтримку “першого дня” для графічних процесорів GeForce RTX, платформ RTX PRO та систем DGX, від міні-ПК Spark до робочих станцій, оснащених чіпами дата-центр-класу. NVIDIA використовує свою тензорну архітектуру ядер та програмний стек CUDA, забезпечуючи надійну підтримку, яка не потребує додаткового налаштування.

NVIDIA забезпечує підтримку DiffusionGemma від DeepMind одразу після релізу для RTX та DGX, досягаючи 150 токенів/с з DGX Spark 2

NVIDIA також поділилася статистикою. Компанія стверджує, що її GPU H100 Tensor Core на DGX Stations забезпечують 1000 токенів/с (один GPU), системи DGX Spark – 150 токенів/с, а DGX Station пропонує найшвидший локальний інференс у своєму класі. Рішення забезпечують приблизно в 4 рази вищу продуктивність порівняно з еквівалентною авторегресивною моделлю.

  • Локально на настільному персональному ШІ-суперкомп’ютері NVIDIA DGX Spark — з чіпом NVIDIA GB10 Grace Blackwell та 128 ГБ уніфікованої пам’яті — з попередньо встановленим програмним стеком NVIDIA AI, готовим для прототипування, тонкого налаштування та повністю локальних робочих процесів агентів.
  • На робочих станціях NVIDIA RTX PRO 6000, надаючи розробникам, дослідникам та ШІ-фахівцям простір для локальної генерації з низькою затримкою та агентних циклів як частину професійного робочого процесу.
  • На DGX Station, забезпечуючи найкращий у своєму класі високошвидкісний інференс до 800 токенів/сек для генерації тексту з низькою затримкою та агентних циклів з 748 ГБ когерентної пам’яті.
  • На GPU GeForce RTX, з незабаром доступною підтримкою llama.cpp.
Платформа Найкраще підходить для Ключові особливості Початок роботи
NVIDIA DGX Spark Персональний ШІ-суперкомп’ютер для локальної розробки ШІ, автономних агентів, досліджень ШІ та прототипування NVIDIA GB10 Grace Blackwell Superchip, 128 ГБ уніфікованої пам’яті, 1 PFLOP обчислень ШІ FP4 та попередньо встановлений програмний стек NVIDIA AI для повністю локальних робочих процесів OpenClaw Посібники DGX Spark для vLLM та Unsloth; посібники з розгортання; посібник з тонкого налаштування NVIDIA NeMo Automodel; посібник vLLM на DGX Spark
NVIDIA DGX Station Настільний ШІ-суперкомп’ютер для створення, запуску та масштабування робочих навантажень ШІ NVIDIA GB300 Grace Blackwell Ultra Superchip, програмний стек NVIDIA AI, 748 ГБ когерентної пам’яті, до 20 PFLOPS обчислень FP4 та підтримка моделей до 1T параметрів. Розробка передових ШІ, інференс та агенти за вашим столом. Посібники DGX Station; посібник vLLM на DGX Station
NVIDIA RTX + NVIDIA RTX PRO Настільні ШІ-додатки, розробка для Windows та локальний інференс Оптимізована продуктивність локального інференсу в настільних комп’ютерах та робочих станціях для творців та професіоналів NVIDIA GB300 Grace Blackwell Ultra Superchip, програмний стек NVIDIA AI, 748 ГБ когерентної пам’яті, до 20 PFLOPS обчислень FP4 та підтримка моделей до 1T параметрів. Розробка передових ШІ, інференс та агенти за вашим столом.

Користувачі, які хочуть спробувати модель DiffusionGemma “з коробки”, можуть зробити це вже зараз на системі RTX 5090 або DGX Spark. NVIDIA пропонує повноцінний та готовий до використання фреймворк для негайного тестування моделі.

NVIDIA забезпечує підтримку DiffusionGemma від DeepMind одразу після релізу для RTX та DGX, досягаючи 150 токенів/с з DGX Spark 3

Про автора: Хассан Муджтаба, за освітою інженер-програміст, а пристрасний ентузіаст ПК, є головним редактором апаратного розділу Wccftech. Маючи багаторічний досвід роботи в галузі, він спеціалізується на глибокому технічному аналізі архітектур ЦП та ГП наступного покоління, материнських плат та рішень для охолодження. Його робота включає не тільки оперативні новини про майбутні технології, але й всебічні практичні огляди та бенчмарки.

Слідкуйте за Wccftech на Google, щоб отримувати більше наших новин у своїх стрічках.

Пропозиція дня

NVIDIA забезпечує підтримку DiffusionGemma від DeepMind одразу після релізу для RTX та DGX, досягаючи 150 токенів/с з DGX Spark 4NVIDIA забезпечує підтримку DiffusionGemma від DeepMind одразу після релізу для RTX та DGX, досягаючи 150 токенів/с з DGX Spark 5

Читайте також

NVIDIA забезпечує підтримку DiffusionGemma від DeepMind одразу після релізу для RTX та DGX, досягаючи 150 токенів/с з DGX Spark 6

Голова MSI попереджає, що дефіцит пам’яті та відеокарт триватиме до 2026 року, але постачання ЦП покращиться до 3 кварталу

Хассан МуджтабаNVIDIA забезпечує підтримку DiffusionGemma від DeepMind одразу після релізу для RTX та DGX, досягаючи 150 токенів/с з DGX Spark 7

Unreal Engine 5 не заблокує гравців Phantom Blade Zero, оскільки розробник обіцяє оптимізацію для бюджетного обладнання та Steam Deck

Франческо Де МеоNVIDIA забезпечує підтримку DiffusionGemma від DeepMind одразу після релізу для RTX та DGX, досягаючи 150 токенів/с з DGX Spark 8

Final Fantasy VII Revelation дозволить досягти 99 рівня, насолоджуючись величезним ендгеймом гри та перемагаючи босів-зброї

Алессіо ПалумбоNVIDIA забезпечує підтримку DiffusionGemma від DeepMind одразу після релізу для RTX та DGX, досягаючи 150 токенів/с з DGX Spark 9

Persona 4 Revival, Fable, Final Fantasy VII Revelation та багато іншого зіткнуться у 2027 році — найзавантаженому році RPG

Алессіо Палумбо

Чи варто купувати? (Порада ІТ-Блогу): NVIDIA надає чудову підтримку новітньої моделі DiffusionGemma, інтегруючи її у свої потужні платформи RTX та DGX. Хоча ці рішення не належать до бюджетного сегмента, вони пропонують виняткову продуктивність та швидкість для професійних завдань та передових досліджень у галузі ШІ, що робить їх вигідною інвестицією для тих, хто потребує максимальної обчислювальної потужності.

За матеріалами: wccftech.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *