
NVIDIA оголошує про повноцінну підтримку відкритої моделі штучного інтелекту DiffusionGemma від Google DeepMind для всіх своїх лінійок продуктів RTX та DGX.
Google представляє свою новітню модель ШІ: DiffusionGemma — NVIDIA надає повну підтримку в родинах DGX та RTX
Модель DiffusionGemma – це відкрита модель, призначена для швидкої генерації тексту. З її запуском NVIDIA анонсує підтримку в лінійках RTX та DGX. Що ще краще, хоча DiffusionGemma швидка, оптимізації NVIDIA для цієї моделі та її апаратного забезпечення роблять її ще швидшою.
Вітаємо @GoogleDeepMind із запуском DiffusionGemma.
Модель генерує 256 токенів паралельно за крок, видаючи 150+ TPS на DGX Spark та 1000+ TPS на одному H100.
Ми підтримуємо її з першого дня за допомогою:
• BF16 та NVFP4 чекпойнтів на @huggingface🤗
• Безкоштовні… pic.twitter.com/0xqMXKvMQV— NVIDIA AI (@NVIDIAAI) June 10, 2026
Ось основні особливості моделі:
- Паралельна генерація: DiffusionGemma обробляє до 256 токенів за крок, замість того, щоб передбачати їх по одному.
- Побудована на базі Gemma 4: DiffusionGemma базується на Gemma 4, моделі “mixture-of-experts” із 26 мільярдами параметрів, яка активує лише 3,8 мільярда параметрів за крок, поєднуючи дифузійний “головний блок” з архітектурою Gemma 4 від Google.
- До 4 разів вища продуктивність: Цей приріст означає швидку генерацію тексту, яка зазвичай сповільнюється на локальному обладнанні для генерації одним користувачем.
- Відкрита та локальна: DiffusionGemma є відкритою моделлю з дозвільною ліцензією Apache 2.0 і працює повністю на RTX та DGX Spark — без хмари, без плати за токен — з підтримкою “нульового дня” в Hugging Face Transformers, vLLM та Unsloth.
| Назва моделі | DiffusionGemma |
| Підтримувані модальності | Текст, зображення |
| Загальна кількість параметрів | 25,2B |
| Активні параметри | 3,8B |
| Довжина контексту | До 256K токенів |
| Формат точності | BF16, NVFP4 |
Зі свого боку, NVIDIA пропонує підтримку “першого дня” для графічних процесорів GeForce RTX, платформ RTX PRO та систем DGX, від міні-ПК Spark до робочих станцій, оснащених чіпами дата-центр-класу. NVIDIA використовує свою тензорну архітектуру ядер та програмний стек CUDA, забезпечуючи надійну підтримку, яка не потребує додаткового налаштування.

NVIDIA також поділилася статистикою. Компанія стверджує, що її GPU H100 Tensor Core на DGX Stations забезпечують 1000 токенів/с (один GPU), системи DGX Spark – 150 токенів/с, а DGX Station пропонує найшвидший локальний інференс у своєму класі. Рішення забезпечують приблизно в 4 рази вищу продуктивність порівняно з еквівалентною авторегресивною моделлю.
- Локально на настільному персональному ШІ-суперкомп’ютері NVIDIA DGX Spark — з чіпом NVIDIA GB10 Grace Blackwell та 128 ГБ уніфікованої пам’яті — з попередньо встановленим програмним стеком NVIDIA AI, готовим для прототипування, тонкого налаштування та повністю локальних робочих процесів агентів.
- На робочих станціях NVIDIA RTX PRO 6000, надаючи розробникам, дослідникам та ШІ-фахівцям простір для локальної генерації з низькою затримкою та агентних циклів як частину професійного робочого процесу.
- На DGX Station, забезпечуючи найкращий у своєму класі високошвидкісний інференс до 800 токенів/сек для генерації тексту з низькою затримкою та агентних циклів з 748 ГБ когерентної пам’яті.
- На GPU GeForce RTX, з незабаром доступною підтримкою llama.cpp.
| Платформа | Найкраще підходить для | Ключові особливості | Початок роботи |
|---|---|---|---|
| NVIDIA DGX Spark | Персональний ШІ-суперкомп’ютер для локальної розробки ШІ, автономних агентів, досліджень ШІ та прототипування | NVIDIA GB10 Grace Blackwell Superchip, 128 ГБ уніфікованої пам’яті, 1 PFLOP обчислень ШІ FP4 та попередньо встановлений програмний стек NVIDIA AI для повністю локальних робочих процесів OpenClaw | Посібники DGX Spark для vLLM та Unsloth; посібники з розгортання; посібник з тонкого налаштування NVIDIA NeMo Automodel; посібник vLLM на DGX Spark |
| NVIDIA DGX Station | Настільний ШІ-суперкомп’ютер для створення, запуску та масштабування робочих навантажень ШІ | NVIDIA GB300 Grace Blackwell Ultra Superchip, програмний стек NVIDIA AI, 748 ГБ когерентної пам’яті, до 20 PFLOPS обчислень FP4 та підтримка моделей до 1T параметрів. Розробка передових ШІ, інференс та агенти за вашим столом. | Посібники DGX Station; посібник vLLM на DGX Station |
| NVIDIA RTX + NVIDIA RTX PRO | Настільні ШІ-додатки, розробка для Windows та локальний інференс | Оптимізована продуктивність локального інференсу в настільних комп’ютерах та робочих станціях для творців та професіоналів | NVIDIA GB300 Grace Blackwell Ultra Superchip, програмний стек NVIDIA AI, 748 ГБ когерентної пам’яті, до 20 PFLOPS обчислень FP4 та підтримка моделей до 1T параметрів. Розробка передових ШІ, інференс та агенти за вашим столом. |
Користувачі, які хочуть спробувати модель DiffusionGemma “з коробки”, можуть зробити це вже зараз на системі RTX 5090 або DGX Spark. NVIDIA пропонує повноцінний та готовий до використання фреймворк для негайного тестування моделі.

Про автора: Хассан Муджтаба, за освітою інженер-програміст, а пристрасний ентузіаст ПК, є головним редактором апаратного розділу Wccftech. Маючи багаторічний досвід роботи в галузі, він спеціалізується на глибокому технічному аналізі архітектур ЦП та ГП наступного покоління, материнських плат та рішень для охолодження. Його робота включає не тільки оперативні новини про майбутні технології, але й всебічні практичні огляди та бенчмарки.
Слідкуйте за Wccftech на Google, щоб отримувати більше наших новин у своїх стрічках.
Пропозиція дня


Читайте також

Голова MSI попереджає, що дефіцит пам’яті та відеокарт триватиме до 2026 року, але постачання ЦП покращиться до 3 кварталу
Хассан Муджтаба
Unreal Engine 5 не заблокує гравців Phantom Blade Zero, оскільки розробник обіцяє оптимізацію для бюджетного обладнання та Steam Deck
Франческо Де Мео
Final Fantasy VII Revelation дозволить досягти 99 рівня, насолоджуючись величезним ендгеймом гри та перемагаючи босів-зброї
Алессіо Палумбо
Persona 4 Revival, Fable, Final Fantasy VII Revelation та багато іншого зіткнуться у 2027 році — найзавантаженому році RPG
Алессіо Палумбо
Чи варто купувати? (Порада ІТ-Блогу): NVIDIA надає чудову підтримку новітньої моделі DiffusionGemma, інтегруючи її у свої потужні платформи RTX та DGX. Хоча ці рішення не належать до бюджетного сегмента, вони пропонують виняткову продуктивність та швидкість для професійних завдань та передових досліджень у галузі ШІ, що робить їх вигідною інвестицією для тих, хто потребує максимальної обчислювальної потужності.
За матеріалами: wccftech.com
