Gemini від Google: працює на одному сервері без доступу до мережі та зникає при вимкненні живлення

Gemini від Google: працює на одному сервері без доступу до мережі та зникає при вимкненні живлення 1

Компанія Cirrascale Cloud Services оголосила про розширення співпраці з Google Cloud, надаючи доступ до моделі Gemini на власних серверах через Google Distributed Cloud. Це робить Cirrascale першим провайдером “нео-хмари”, який пропонує найсучаснішу модель штучного інтелекту від Google як повністю приватний, ізольований апаратний комплекс. Ця ініціатива, анонсована напередодні Google Cloud Next 2026 у Лас-Вегасі, вирішує нагальну проблему, що стоїть перед регульованими галузями з моменту вибухового зростання генеративного ШІ: як отримати доступ до передових моделей ШІ, не втрачаючи контролю над власними даними.

Рішення передбачає інтеграцію Gemini в апаратний комплекс, сертифікований Google та виготовлений Dell, який оснащено вісьмома графічними процесорами NVIDIA і захищений технологіями конфіденційних обчислень. Підприємства та державні установи зможуть розгорнути цю систему у власних дата-центрах Cirrascale або на власній інфраструктурі, повністю ізольованою від Інтернету та хмарної інфраструктури Google. Продукт доступний для попереднього перегляду негайно, а загальний запуск очікується у червні або липні.

В ексклюзивному інтерв’ю для VentureBeat перед анонсом, Дейв Дріггерс, генеральний директор Cirrascale Cloud Services, описав це розгортання як “наступний крок у партнерстві” та “можливість запропонувати їхню найважливішу модель – Gemini”. Він наголосив на тому, що клієнти отримають “повну версію Gemini, без жодних обмежень”, яка буде доступна в приватному середовищі, гарантуючи безпеку даних, вхідних та вихідних запитів.

Цей крок свідчить про поглиблення трансформації на ринку корпоративного ШІ, де найпотужніші моделі мігрують з хмарних дата-центрів до власних серверних стійок клієнтів, що є фактичним відходом від хмарної парадигми, яка домінувала протягом останнього десятиліття.

Неможливий компроміс, що тримав банки та уряди осторонь від ШІ

Роками організації у фінансовому секторі, охороні здоров’я, обороні та державному управлінні стояли перед дилемою: або отримувати доступ до найпотужніших моделей ШІ через публічні хмарні API, викриваючи конфіденційні дані на сторонній інфраструктурі, або задовольнятися менш потужними моделями з відкритим вихідним кодом, які вони могли розміщувати самостійно. Нова пропозиція Cirrascale покликана усунути цей компроміс.

Дріггерс пояснив, як проблема довіри ескалювалася поетапно. Спочатку компанії занепокоїлися передачею своїх пропрієтарних даних гіперскейлерам. Потім прийшло глибше усвідомлення: “Вони почали розуміти: “Чорт забирай, коли користувачі вводять дані, вони розкривають приватну інформацію – і вихідні дані теж приватні”. А потім гіперскейлери заявили: “Ваші запити та відповіді? Це наша власність. Нам це потрібно, щоб відповісти на ваше запитання”. Саме тоді, на його думку, попит на повністю приватний ШІ став неможливо ігнорувати.

На відміну від Google Distributed Cloud, яку Google вже пропонує як розширення власної локальної хмари, розгортання Cirrascale розміщує саму модель — разом з її вагами — поза межами інфраструктури Google. “Google не володіє цим обладнанням. Ми або клієнт володіємо обладнанням”, – зазначив Дріггерс. “Це повністю поза сферою впливу Google”.

Дріггерс провів чітку межу між цією пропозицією та тим, що пропонують конкуренти. Відповідаючи на запитання про локальні розгортання Microsoft Azure з моделями OpenAI та AWS Outposts, він був відвертий: “Це зовсім інше. Тут розгортається справжня модель локально, поза межами їхньої хмари. Це не спрощена версія. Це реальна модель”.

Відключи кабель – і модель зникне: як конфіденційні обчислення зберігають коштовність Google

Технічна основа цього розгортання демонструє, наскільки серйозно Google та Cirrascale ставляться до питань безпеки. Модель Gemini повністю зберігається в оперативній пам’яті, а не на постійних носіях. “Щойно вимкнеться живлення, модель зникне”, – пояснив Дріггерс. Сесії користувачів працюють через кеші, які автоматично очищаються після завершення сесії. “Вхідні дані користувачів, після завершення сесії, зникають. Їх можна зберегти, але за замовчуванням вони видаляються”, – додав він.

Ймовірно, найвражаючою функцією безпеки є те, що відбувається при спробі втручання в апаратний комплекс. Дріггерс описав механізм, який фактично робить машину непрацездатною: “Ви робите будь-що, що суперечить принципам конфіденційних обчислень, і все зникає. Машина не тільки вимикається, і модель зникає, але й встановлюється маркер, що свідчить про порушення конфіденційності. Ця машина повинна повернутися до нас, до Dell або до Google”. Він охарактеризував апаратний комплекс як пристрій, який “самознищується”, якщо щось йде не так.

Такий рівень захисту відображає занепокоєння Google щодо випуску ваг їхньої флагманської моделі в середовища, які він не контролює. Апаратний комплекс фактично є сховищем: модель працює всередині нього, але ніхто – навіть клієнт – не може витягти або перевірити ваги. Конфіденційна обчислювальна оболонка гарантує, що навіть фізичне володіння обладнанням не надає доступу до інтелектуальної власності моделі.

Коли Google випускає нову версію Gemini, апаратний комплекс потребує перепідключення – але лише короткочасно і через приватний канал. “Він повинен бути перепідключений до Google для завантаження нової моделі. Але це може відбуватися через приватне з’єднання”, – зазначив Дріггерс. Для найбільш чутливих до безпеки клієнтів, які ніколи не можуть дозволити своїй машині підключатися до зовнішньої мережі, Cirrascale пропонує фізичну заміну: “Сервер буде відключено, очищено, всі дані видалено, гарантовано видалено, і новий сервер буде доставлено з новою версією моделі”.

Від Уолл-стріт до лабораторій розробки ліків: прискорення гонитви за “повітряно-ізольованим” ШІ

Дріггерс виділив три основні рушійні сили попиту: довіра, безпека та гарантована продуктивність. Фінансові установи очолюють список. “У них є регуляторні вимоги, які забороняють мати щось поза їхнім контролем. Вони повинні визначати, де все знаходиться. Це має бути “повітряно-ізольоване” рішення”, – зазначив Дріггерс. Мінімальний розмір розгортання – один сервер з вісьмома GPU – робить продукт доступним, на відміну від власних приватних рішень Google. Розгортання Gemini на базі TPU-інфраструктури Google, як зазначив Дріггерс, вимагає набагато більших інвестицій. “Якщо ви хочете отримати приватний екземпляр від Google, вони вимагають значно більшого, тому що для створення чогось приватного для вас Google вимагає величезний обсяг ресурсів. Тут ми можемо зробити це, починаючи з однієї машини”.

Окрім фінансів, Дріггерс згадав розробку ліків, медичні дані, державні дослідження та будь-який бізнес, що обробляє персональну інформацію. Він також відзначив зростаючу важливість суверенітету даних. “Як щодо вашого бізнесу, який працює за межами Сполучених Штатів, і тепер у вас є закони про суверенітет даних у місцях, де GCP відсутній? Ми можемо надати приватний Gemini у цих менших країнах, звідки дані не можуть виїжджати”.

Державний сектор є ще однією великою цільовою аудиторією. Cirrascale запустила спеціальний відділ Government Services у березні як частину своєї попередньої співпраці з Google Public Sector у рамках ініціативи GPAR (Google Public Sector Program for Accelerated Research). Ця програма надає вищим навчальним закладам та дослідницьким установам доступ до інструментів ШІ, таких як AlphaFold, AI Co-Scientist та Gemini Enterprise for Education. Сьогоднішній анонс розширює цю співпрацю від рівня дослідницьких інструментів до самої моделі.

Гарантія продуктивності є третьою опорою. Дріггерс зазначив, що передові моделі, доступні через публічні API, мають нестабільний час відгуку, що є проблемою для критично важливих бізнес-додатків. Приватне розгортання усуває цю мінливість. Cirrascale надає програмне забезпечення для управління поверхнею апаратного комплексу Gemini, що дозволяє адміністраторам пріоритизувати користувачів, розподіляти токени за ролями, регулювати розмір контекстного вікна та балансувати навантаження між кількома апаратними комплексами та регіонами. “Ваші головні науковці або програмісти можуть потребувати дуже великих контекстних вікон та пріоритету, особливо, можливо, з дев’ятої до п’ятої”, – пояснив Дріггерс, – “але в інший час вони хочуть ділитися досвідом Gemini з ширшою групою людей”. Він також зазначив, що агентні робочі навантаження ШІ, які можуть працювати цілодобово, виграють від можливості використання невикористаної потужності в непікові години – гнучкість планування, яку важко підтримати в публічних хмарних розгортаннях.

Ліцензії на місця, оплата за токенами та тариф “все включено”: модель, побудована для гнучкості підприємства

Модель ціноутворення відображає ширшу філософію Cirrascale – задовольняти потреби клієнтів там, де вони знаходяться. Дріггерс описав кілька варіантів використання: ліцензування за місцем (з рівнями Enterprise та Standard), оплата за токенами та фіксована плата “все включено” за апаратний комплекс. Мінімальне зобов’язання – один виділений сервер; апаратні комплекси не спільно використовуються між клієнтами за жодних умов. “Ми підемо назустріч клієнту, з тим, до чого він звик”, – сказав Дріггерс. “Якщо вони зараз використовують ліцензію за місцем, ми створимо для них ліцензію за місцем”.

Клієнти також можуть вибрати придбання обладнання повністю, продовжуючи використовувати Gemini як керовану послугу – угода, яку Cirrascale пропонує з початку своєї діяльності в епоху ШІ. Дріггерс зазначив, що OpenAI є клієнтом з 2016 або 2017 року, і в рамках цієї співпраці OpenAI придбала власні GPU, а Cirrascale “взяла ці GPU, інтегрувала їх у наші сервери, системи зберігання даних та мережеве обладнання, а потім представила це як хмарну послугу для них, щоб їм не довелося нічим керувати”.

Ця гнучка модель власності особливо актуальна для університетів та дослідницьких інститутів, що фінансуються державою, де мандати часто вимагають певного поєднання капітальних витрат, операційних витрат та інвестицій у персонал. “Багато державних коштів вимагають суміші CapEx, OPEX та розвитку зайнятості”, – сказав Дріггерс. “Тому ми це теж дозволяємо”.

Всередині нео-хмари, яка створила перший у світі сервер з вісьмома GPU – і отримала найбільшу модель ШІ від Google

Анонс Cirrascale з’являється в період вибухового зростання сектору нео-хмар – спеціалізованих провайдерів хмарних рішень для ШІ, що знаходяться між гіперскейлерами та традиційними хостинговими компаніями. Ринок нео-хмар, за прогнозами Mordor Intelligence, досягне 35,22 мільярда доларів у 2026 році, демонструючи середньорічний темп зростання 46,37%. Провідні провайдери нео-хмар включають CoreWeave, Crusoe Cloud, Lambda, Nebius та Vultr, і ці компанії спеціалізуються на GPU-як-послузі для робочих навантажень ШІ та високопродуктивних обчислень.

Однак Cirrascale займає іншу нішу в цій зростаючій категорії. У той час як такі компанії, як CoreWeave, зосереджуються переважно на наданні необроблених GPU-обчислень у великих масштабах – CoreWeave має портфель замовлень на 55,6 мільярда доларів – Cirrascale позиціонує себе навколо приватного ШІ, керованих послуг та довгострокових зобов’язань, а не еластичних обчислень за вимогою. Дріггерс описав компанію як “не місце для роботи за вимогою”, а радше як провайдера, що фокусується на “довгострокових робочих навантаженнях, де ми насправді конкуруємо з тими, хто робить це локально”.

Історія компанії підтверджує це твердження. Cirrascale веде своє коріння від компанії-виробника, яка “розробила перший у світі сервер з вісьмома GPU у 2012 році, перш ніж хтось подумав, що вам коли-небудь знадобиться вісім GPU в одному корпусі”, як зазначив Дріггерс. Близько восьми років тому компанія переорієнтувалася на чисті хмарні послуги і з тих пір зібрала клієнтську базу, яка включає Allen Institute for AI, який у серпні 2025 року обрав Cirrascale як провайдера керованих послуг для ініціативи з відкритого ШІ вартістю 152 мільйони доларів, фінансованої Національним науковим фондом та NVIDIA. Раніше цього місяця Cirrascale оголосила про тристоронній альянс з Rafay Systems та Cisco для надання комплексних корпоративних рішень ШІ, що поєднують платформу інференсу Cirrascale, оркестрацію GPU від Rafay та мережеве та обчислювальне обладнання Cisco.

Ера приватного ШІ настає швидше, ніж очікувалося

Партнерство з Gemini є найгучнішим кроком на сьогодні – і воно відповідає ширшій тенденції в галузі. Прагнення вивести передовий ШІ з публічної хмари на приватну інфраструктуру більше не є нішевим попитом. Галузеві аналітики прогнозують, що до 2027 року 40% тренування та інференсу моделей ШІ відбуватиметься поза середовищами публічної хмари. Цей прогноз пояснює, чому Google готовий дозволити своїй флагманській моделі працювати на обладнанні, яким він не володіє, у дата-центрах, якими він не керує, під управлінням компанії з Сан-Дієго. Альтернатива – спостерігати, як регульовані підприємства обирають моделі з відкритим вихідним кодом або Azure OpenAI Service від Microsoft – очевидно, є гіршим результатом.

Анонс також має значні наслідки для конкурентної позиції Google. Microsoft побудувала свою стратегію корпоративного ШІ навколо Azure OpenAI Service та свого глибокого партнерства з OpenAI, тоді як AWS інвестувала в Amazon Bedrock та власні локальні рішення через Outposts. Google Cloud Platform все ще відстає від обох конкурентів за часткою ринку, хоча дохід від хмарних послуг у четвертому кварталі зріс на 48% рік до року. Надання можливості Gemini працювати на сторонній інфраструктурі через партнерів, таких як Cirrascale, розширює її поверхню дистрибуції саме в тих сегментах – уряд, фінанси, охорона здоров’я – де Microsoft та Amazon історично мали переваги. Для Cirrascale партнерство надає можливість чітко диференціюватися на ринку, де більшість нео-хмар змагаються за доступність GPU та ціну.

Дріггерс очікує швидкого зростання у другій половині 2026 року. “Це буде божевілля до кінця цього року”, – сказав він. “Великі банки нарешті зроблять подібні речі, тому що вони можуть їх забезпечити. Вони можуть робити це глобально. Великі дослідницькі інститути з лабораторіями по всьому світу робитимуть такі речі”. Він прогнозує, що інші розробники передових моделей незабаром запропонують подібні рішення, і не вважає Gemini кінцем історії. “Ми справді віримо, що підприємства чекали на приватний ШІ, не лише Gemini, але й усілякий приватний ШІ”, – сказав Дріггерс.

Це, мабуть, найважливіше речення. Протягом трьох років революція ШІ визначалася простим компромісом: надсилайте свої дані в хмару і отримуйте інтелект у відповідь. Ставка Cirrascale – і, що все більше, Google – полягає в тому, що найбільші клієнти світу втомилися від таких умов. Найпотужніший ШІ на планеті тепер доступний в одному заблокованому корпусі, який може стояти в банківському сховищі, університетському підвалі або державному закладі в країні, де Google не має дата-центру. Хмара, як виявилося, нарешті готова спуститися на землю.

Прогноз ІТ-Блогу: Ця інтеграція Gemini в ізольовані локальні системи є значним кроком до безпечного розгортання ШІ у критично важливих галузях. Очікується, що подібні гібридні рішення, що поєднують потужність передових мовних моделей із суворими вимогами до конфіденційності даних, стануть нормою для великих підприємств і урядів, стимулюючи розвиток спеціалізованого обладнання та програмного забезпечення для “повітряно-ізольованого” ШІ.

Оригінал статті: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *