Microsoft представляє Surface RTX Spark Dev Box: потужність ШІ без хмарних витрат

Компанія Microsoft представила Surface RTX Spark Dev Box — компактний настільний комп’ютер, розроблений для того, щоб дозволити розробникам програмного забезпечення запускати великі моделі штучного інтелекту безпосередньо на своїх робочих місцях, уникаючи витрат на хмарні обчислення. Це рішення кидає виклик моделі ціноутворення за токени, яка домінувала в економіці галузі ШІ протягом останніх трьох з половиною років, відколи з’явився ChatGPT.

Пристрій, анонсований на Microsoft Build 2026, оснащений новим процесором Nvidia RTX Spark на архітектурі Blackwell та 128 гігабайтами уніфікованої пам’яті у компактному корпусі. Він забезпечує обчислювальну потужність у один петафлопс для завдань ШІ, за оцінками Nvidia. Це означає, що розробник може завантажувати, запускати та взаємодіяти з моделями ШІ, що перевищують 120 мільярдів параметрів, не здійснюючи жодного API-запиту до хмари.

“Ми вважаємо, що пристрої цього класу зможуть запускати моделі з приблизно 100 мільярдами параметрів”, — зазначив Паван Давулурі, виконавчий віце-президент Microsoft з питань Windows та пристроїв, під час прес-брифінгу перед заходом. Він наголосив, що сама по собі розмір моделі — це лише частина рівняння: “Розмір моделі — це одне, але щоб модель була ефективною, їй потрібно достатньо контексту, адже більша модель дозволяє оперувати більшим контекстом”. При 100 000 токенів контексту, зазначив він, лише кеш ключ-значення може займати 40-50 гігабайт пам’яті. Саме тому Microsoft та Nvidia розробили пристрій з 128 гігабайтами уніфікованої пам’яті, яка динамічно розподіляється між центральним та графічним процесорами.

Ця машина буде доступна пізніше цього року в Сполучених Штатах, продаватиметься ексклюзивно через Microsoft.com. Компанія не розкрила ціни.

Чому Microsoft робить ставку на фіксовані витрати, а не на хмарні лічильники для майбутнього ШІ

Surface RTX Spark Dev Box з’являється в час, коли економіка розробки ШІ стала предметом занепокоєння на рівні керівництва компаній. Великі та малі підприємства стикаються з непередбачувано зростаючими рахунками за хмарні GPU: кожен етап доналаштування (fine-tuning), кожен запит на виведення (inference), кожен циклічний агентний процес, що взаємодіє з передовими моделями, накопичує витрати. Для розробника, який швидко створює прототип — запускаючи ту саму модель десятки чи сотні разів на день — ці витрати швидко зростають.

Microsoft позиціонує Dev Box як спосіб знизити цей тиск. Ендрю Хілл, корпоративний віце-президент Surface, написав у блозі оголошення, що пристрій “змінює це рівняння”, дозволяючи розробникам “резервувати виклики передових моделей для справді передових завдань, а решту обробляти на власному обладнанні”. Пропозиція полягає не в застаріванні хмарних обчислень, а в тому, що значна частина роботи, яка наразі надсилається до віддалених центрів обробки даних, не потребує найсучасніших моделей і краще виконуватиметься на потужному локальному обладнанні з передбачуваними, фіксованими витратами.

Це значний стратегічний зсув для Microsoft, компанії, яка отримує десятки мільярдів доларів річного доходу від хмарних сервісів Azure. Продаючи обладнання, яке явно зменшує залежність клієнтів від хмари, Microsoft визнає зростаючу напругу в галузі: гранична вартість виведення ШІ у великих масштабах є нестійкою для багатьох команд, і ринок вимагає альтернатив. Ставка полягає в тому, що розробники, які створюють прототипи локально, все одно розгортатимуться в Azure, коли їм знадобиться масштабування — і володіння обома кінцями цього робочого процесу є більш цінним, ніж володіння лише хмарою.

Архітектура уніфікованої пам’яті на 128 ГБ, що робить локальний ШІ можливим

Технічна архітектура Dev Box відображає низку свідомих інженерних рішень, спрямованих на стабільну, а не пікову продуктивність — відмінність, яка має величезне значення для робочих навантажень ШІ, що можуть тривати годинами.

В основі системи лежить система-на-чіпі Nvidia RTX Spark, яка поєднує високоефективний центральний процесор на базі ARM з графічним процесором RTX покоління Blackwell. У традиційному ПК з Windows, як пояснив Давулурі під час брифінгу, така конфігурація вимагала б чотирьох окремих компонентів: процесора, дискретної відеокарти, виділеної відеопам’яті та оперативної пам’яті системи. RTX Spark об’єднує все це в один чіп, що працює з єдиним пулом уніфікованої пам’яті.

Це уніфіковане рішення є ключовим дизайнерським вибором. Традиційні ігрові ноутбуки з високопродуктивними GPU Nvidia мають максимум приблизно 24 гігабайти пам’яті, доступної для GPU. 128 гігабайт уніфікованої пам’яті Dev Box — доступні як для центрального, так і для графічного процесора через те, що Nvidia називає архітектурою доступу до уніфікованої пам’яті (Unified Memory Access) — дозволяє завантажувати моделі, які інакше вимагали б хмарних GPU-інстансів зі спеціальними конфігураціями високошвидкісної пам’яті.

Microsoft здійснила значну роботу на рівні операційної системи для використання цієї архітектури. Компанія впровадила нову логіку керування пам’яттю у Windows, яка підвищує межу обсягу системної пам’яті, до якої може звертатися GPU, запроваджує більш інтелектуальне виділення сторінок для спільних областей пам’яті та гарантує, що інтенсивні GPU-навантаження не позбавляють центральний процесор ресурсів, необхідних для багатозадачності. Планувальник Windows також був оптимізований для гетерогенної архітектури ядер RTX Spark, спрямовуючи складні завдання на високопродуктивні ядра, залишаючи енергоефективні ядра доступними для фонових процесів.

Як 3D-друк алюмінієвого корпусу подвоює його функцію як радіатора

Теплове проєктування також є свідомим. Dev Box працює в межах приблизно 100-ватного сталого теплового режиму — це скромно за стандартами настільних ПК, але важливо для пристрою, призначеного для безперервного запуску завдань тренування та виведення.

Алюмінієвий корпус сам по собі сконструйований для роботи як пасивний радіатор, а метод, який Microsoft використовувала для його виготовлення, є однією з найвражаючих деталей машини. Верхня панель виготовлена за допомогою металевого 3D-друку — процесу, який дозволяє створювати внутрішні геометрії, надто складні для традиційної ЧПК-обробки або лиття під тиском. Перфорації — це не прості наскрізні отвори; вони мають різні кути нахилу навколо внутрішнього вентилятора для оптимізації повітряного потоку від забору холодного повітря до розсіювання тепла. Під час прес-брифінгу Гаррі, промисловий дизайнер Surface, пояснив логіку: “Складність — це те, чого не могли б зробити інші виробники, як-от ЧПК чи будь-яке лиття, через складність форми”.

На запитання, чи не обмежуватиме 3D-друк масове виробництво, дизайнер визнав виклик, але припустив, що Microsoft розробила процес, достатньо надійний для масштабування. Результатом є машина, яка працює достатньо тихо для відкритого офісу, підтримуючи безперервні GPU-навантаження, які перевантажили б більшість традиційних настільних комп’ютерів подібного розміру. Для пристрою, який Microsoft очікує, що розробники залишатимуть працювати протягом ночі над завданнями доналаштування, тиха стабільна робота — це не розкіш, а необхідність.

Орієнтований на розробників набір, що усуває години конфігурації

Microsoft постачає Dev Box з Windows 11 Pro, попередньо налаштованою на рівні образу для розробки — деталь, яка може здатися незначною, але відображає зростаюче розуміння того, що досвід роботи з апаратним забезпеченням для розробників “з коробки” історично був поганим.

Машина завантажується з темною темою, спрощеною панеллю завдань, видаленими віджетами та увімкненим режимом “Не турбувати”. Режим розробника (Developer Mode) увімкнено. PowerShell 7 є оболонкою за замовчуванням. WSL 2 — Windows Subsystem for Linux — попередньо встановлено з налаштованим проходженням GPU та підтримкою CUDA. Visual Studio Code, GitHub Copilot, Git, Python та Node.js — все це встановлено та готове до використання.

“Ми сказали: ‘Гей, знаєте що, ми вас підтримуємо, ви хочете працювати швидко'”, — сказав інженер Microsoft, який демонстрував конфігурацію під час брифінгу. Філософія, пояснив він, полягає в тому, що розробники все одно встановили б усі ці інструменти — перешкодою були години налаштування та конфігурації, які стояли між розпакуванням машини та написанням першого рядка коду.

Dev Box також постачається з інтеграційними точками в екосистемі ШІ Microsoft: AI Toolkit для VS Code для конвертації та доналаштування моделей, Windows ML та Windows Copilot Runtime для локального виведення, а також Microsoft Foundry для підключення локальних прототипів до пайплайнів розгортання в хмарі. Для підприємств пристрій інтегрується з Entra ID та Intune для керування ідентифікацією та пристроями, а також включає архітектуру Secured-core PC, шифрування BitLocker та Microsoft Defender.

Чому Mac Mini від Apple може вже не бути справжнім конкурентом

Найбільш очевидним конкурентним порівнянням є Mac Mini від Apple, який домінував у категорії компактних настільних комп’ютерів і був широко прийнятий розробниками, яких приваблювала архітектура уніфікованої пам’яті та енергоефективність Apple Silicon.

Давулурі прямо прокоментував це порівняння під час брифінгу, заявивши, що Dev Box “належить до іншого класу продуктивності, ніж Mac Mini, навмисно”. Він відмовився надати конкретні бенчмарки, зазначивши, що детальні специфікації та цільові показники продуктивності будуть опубліковані ближче до осіннього запуску. Але архітектурна перевага, яку стверджує Microsoft, очевидна: тоді як поточний Mac Mini з M4 Pro має максимум 48 гігабайт уніфікованої пам’яті, а конфігурація M4 Max досягає 128 гігабайт, RTX Spark Dev Box поєднує свої 128 гігабайт з GPU класу Blackwell, який має принципово іншу обчислювальну модель на основі CUDA — таку, для якої вже оптимізована переважна більшість інструментів екосистеми ШІ/ML (PyTorch, TensorRT, llama.cpp, фреймворки Hugging Face).

Ця перевага екосистеми CUDA є надзвичайно важливою. Хоча фреймворк Metal від Apple досяг прогресу, переважна більшість фреймворків для навчання та виведення ШІ спочатку створюються та тестуються на стеку CUDA від Nvidia. Розробник, який запускає моделі на Dev Box, може використовувати той самий код, ті самі бібліотеки та ті самі робочі процеси, які він використовував би на хмарному GPU-інстансі — рівень портативності, який Apple Silicon наразі не може забезпечити.

Від ноутбука до суперкомп’ютера: трирівневий план Microsoft для локального апаратного забезпечення ШІ

Dev Box є частиною трирівневої апаратної стратегії, яку Microsoft представила на Build. Surface Laptop Ultra, анонсований кількома днями раніше на Computex, використовує той самий кремній RTX Spark у 15-дюймовому форм-факторі ноутбука для розробників та творців, яким потрібна портативність. На іншому кінці спектру — DGX Station для Windows, побудований на GB300 Grace Blackwell Ultra Superchip від Nvidia, — призначений для організацій, яким потрібно запускати моделі до одного трильйона параметрів на настільному системному блоці. Ця машина очікується в четвертому кварталі цього року.

Ці три пристрої відповідають багаторівневій моделі обчислень, яку Microsoft називає “нелічильним інтелектом” (unmetered intelligence): малі мовні моделі на пристрої (нове сімейство компанії Aion 1.0) обробляють легкі завдання з нульовою граничною вартістю; обладнання класу RTX Spark запускає моделі середнього рівня локально для більшості розробницьких завдань; а хмарні ресурси резервуються для справді масштабних передових завдань.

GitHub Copilot CLI отримує конкретну реалізацію цієї моделі з новою функцією під назвою /fleet, яка дозволяє хмарному основному агенту будувати план, оцінювати складність кожного завдання та спрямовувати відповідні підзавдання на локальну модель, що працює на апаратному забезпеченні розробника. Хмарний агент обробляє те, що вимагає передових можливостей; локальна модель обробляє те, що не вимагає. Результатом, теоретично, є нижча вартість без втрати якості.

Справжнє питання полягає в тому, чи може гібридний ШІ перейти від модного слова до бізнес-моделі

Чи виправдає себе ставка Microsoft, залежить від відповідей на питання, які займуть місяці. Як Dev Box покаже себе в реальних, тривалих навантаженнях? Якою буде його вартість? Як швидко екосистема відкритих моделей продовжуватиме створювати потужні моделі в діапазоні 70-120 мільярдів параметрів, які вмістяться в його обсязі пам’яті? І, можливо, найважливіше: чи приймуть корпоративні закупівельні відділи, навчені розглядати ШІ як статтю витрат у хмарі, капітальні витрати на настільне обладнання як альтернативу?

Однак стратегічну логіку важко відкинути. Протягом трьох років галузь ШІ керувалася неявним припущенням: серйозна робота зі штучного інтелекту відбувається в хмарі, а економіка цієї угоди — це просто витрати на ведення бізнесу. Microsoft, компанія, яка має всі стимули для підтримки цього припущення, тепер продає машину, яка його підриває. Це не протиріччя — це визнання того, що ринок змінюється, і що компанія, яка контролює локальне середовище розробника та хмару, до якої він розгортається, має більш стійку перевагу, ніж та, що контролює лише хмару.

Кожен долар, який розробник не витрачає на хмарне виведення, — це долар, який може фінансувати ще один експеримент, ще одну ітерацію, ще один прототип. Роками галузь ШІ говорила розробникам, що вони повинні орендувати свій інтелект за токенами. Microsoft тепер ставить інше питання: а що, якщо ви зможете просто купити його?

Прогноз ІТ-Блогу: У найближчі 1-2 роки ми побачимо подальше зростання ринку потужних локальних ШІ-пристроїв, що призведе до зниження залежності від хмарних API для рутинних завдань. Це стимулюватиме розробку більш досконалих моделей, оптимізованих для локального виконання, та посилить конкуренцію між постачальниками апаратного забезпечення та хмарних сервісів.

За матеріалами: venturebeat.com