
Протягом трьох років історія штучного інтелекту (ШІ) від Microsoft була нерозривно пов’язана з OpenAI. Це партнерство, закріплене сукупними інвестиціями, що перевищують 13 мільярдів доларів, надало Microsoft ранній доступ до найпередовіших моделей ШІ, вивівши її продукти Copilot на корпоративний рівень і додавши сотні мільярдів доларів до ринкової капіталізації компанії. Для зовнішнього світу стратегія ШІ від Microsoft *була* OpenAI.
Мустафа Сулейман прагне змінити цей наратив.
В ексклюзивному інтерв’ю для VentureBeat під час Microsoft Build 2026, генеральний директор Microsoft AI розкрив, що зміна в контракті з OpenAI приблизно шість місяців тому надала його підрозділу формальну можливість прагнути до того, що він відкрито називає “суперінтелектом” — використовуючи власні дослідницькі ресурси Microsoft, власні конвеєри даних і власні спеціалізовані чіпи.
“Ми були формально звільнені від нашого контракту з OpenAI близько шести місяців тому, щоб мати змогу прагнути до суперінтелекту”, — сказав Сулейман. “Тож це дуже ранні етапи”.
Ця заява, зроблена спокійно за лаштунками заходу, є найчіткішим сигналом про стратегічний поворотний момент, що розгортається всередині найціннішої публічної компанії світу. Microsoft не відмовляється від OpenAI. Але вона будує щось паралельно з цим — і, зрештою, щось, що може існувати цілком самостійно.
Перше сімейство моделей від Microsoft самостійно сигналізує про новий рівень амбіцій у сфері ШІ
Найбільш відчутним доказом цієї зміни стало представлення нового сімейства з семи моделей ШІ, розроблених повністю власними силами команди AI Superintelligence від Microsoft. Ці моделі охоплюють сфери міркування, генерації коду, створення зображень, транскрипції та синтезу голосу. Моделі, що випускаються під родинною назвою “MAI”, є найамбіційнішим власним релізом ШІ від Microsoft на сьогоднішній день. Флагманська модель, MAI-Thinking-1, є моделлю міркування з 35 мільярдами активних параметрів. Microsoft стверджує, що вона відповідає провідним моделям свого класу за ключовими показниками програмної інженерії та демонструє просунуті математичні міркування. Сулейман неодноразово наголошував на одному моменті: модель була навчена з нуля на чистих, комерційно ліцензованих даних, без дистиляції з передових моделей третіх сторін. Це пряма, хоч і неявна, протилежність поширеній у галузі практиці використання вихідних даних конкурентів для навчання дешевших альтернатив. “Ми тренуємо наші моделі міркування з нуля”, — написав Сулейман у супровідній публікації в блозі. “Ми не дистилюємо з інших лабораторій і не покладаємося на неліцензовані або непрозорі дані”. Решта сімейства доповнює мультимодальне портфоліо, розроблене для корпоративного впровадження: MAI-Code-1-Flash, легка модель кодування, створена спеціально для GitHub Copilot і VS Code; MAI-Image-2.5, що підтримує як генерацію зображень за текстовим описом, так і редагування зображень; MAI-Transcribe-1.5, яка, за заявами Microsoft, є найточнішою моделлю транскрипції, що працює 43 мовами; і MAI-Voice-2, багатомовна система генерації мови. Усі моделі доступні через Microsoft Foundry, інфраструктуру компанії для розміщення та розгортання моделей. Вперше розробники можуть самостійно налаштовувати ваги моделей через сторонні платформи, включаючи OpenRouter, Fireworks і Baseten. Проте Сулейман чітко дав зрозуміти в інтерв’ю, що ці сім моделей є лише доказом концепції, а не завершеним продуктом. Справжній проєкт — це сама лабораторія. “Наше завдання — переконатися, що, дивлячись на 2030 рік і далі, ми матимемо можливість не просто купувати моделі у третіх сторін, а й створювати найпередовіші, найкращі моделі у світі”, — сказав він. “Це довгий перехід”.
Що означає “звільнення” від OpenAI для майбутнього ШІ від Microsoft
Щоб зрозуміти, що Сулейман має на увазі під “звільненням”, потрібно розібратися в унікальній договірній архітектурі, яка роками керувала зусиллями Microsoft у сфері ШІ. Коли Microsoft почала інвестувати мільярди в OpenAI у 2019 році, партнерство включало специфічну домовленість: OpenAI мала створювати передові моделі, а Microsoft мала виступати ексклюзивним хмарним провайдером, інтегруючи ці моделі у свої продукти та перепродаючи їх через Azure. Ця угода надала Microsoft надзвичайну комерційну перевагу — доступ до найсучаснішого ШІ у світі без необхідності його створення — але також створила залежність. Microsoft було прямо заборонено займатися власними дослідженнями в галузі загального штучного інтелекту (AGI), а угода навіть обмежувала розмір моделей, які компанія могла тренувати, не дозволяючи створювати системи, що перевищують певний поріг обчислювальної потужності, виміряний у FLOPS. Ця домовленість була офіційно переглянута. Як повідомляли Fortune та Axios у листопаді, переглянута угода з OpenAI зняла ці обмеження, відкривши шлях для Сулеймана до запуску команди MAI Superintelligence та реалізації того, що він називає “гуманістичним суперінтелектом”. Результатом, за словами Сулеймана на той час, стало “найкраще з обох світів, де ми вільні прагнути до власного суперінтелекту, а також тісно співпрацювати з ними”. До моменту його інтерв’ю з VentureBeat на Build 2026, приблизно через шість місяців після офіційного початку цієї роботи над самозабезпеченням, Microsoft вже почала випускати власні моделі, включно з MAI-Image-2-Efficient, легкою моделлю генерації зображень, випущеною в квітні. Але сім моделей MAI, анонсованих на Build, є найамбіційнішим релізом команди на сьогодні: повне мультимодальне сімейство, що охоплює міркування, кодування, генерацію зображень, транскрипцію та голос. Навіть так, Сулейман не розглядає цей зсув як розрив з OpenAI. Він описує поточну позицію Microsoft як стан достатку, а не дефіциту. “Немає нагальної потреби заповнювати прогалину протягом трьох чи шести місяців”, — сказав він. “У нас є OpenAI, у нас є Anthropic, у нас є тисячі моделей у Foundry. Отже, у нас вже є величезна кількість опцій”. Це формулювання красномовне. Просування Microsoft до власних передових моделей зумовлене не кризою у відносинах з OpenAI, а стратегічним розрахунком: оскільки ШІ стає найбільш значущим технологічним шаром в корпоративних обчисленнях, компанія не може дозволити собі залежати виключно від партнерів у фундаментальних можливостях. “Протягом наступних п’яти років ми повинні мати можливість створювати передові моделі на межі можливостей”, — сказав Сулейман. “Це наша місія”.
Сулейман стверджує, що зсув від чат-ботів до автономних ШІ-агентів уже почався
Якщо сім моделей MAI представляють технічні амбіції, то нова функція під назвою Frontier Tuning представляє комерційну логіку. Анонсована разом із моделями на Build, Frontier Tuning дозволяє корпоративним клієнтам налаштовувати моделі MAI, використовуючи власні пропрієтарні дані, робочі процеси та термінологію галузі, все в межах їхньої власної безпечної зони відповідності. Система використовує середовища навчання з підкріпленням — те, що Microsoft називає “тренувальними майданчиками для ШІ”, — які дозволяють агентам навчатися безпосередньо на реальних робочих завданнях, не впливаючи на виробничі системи. Результати, якими поділилася Microsoft, вражають. Модель MAI, налаштована для Excel, нібито відповідає продуктивності GPT 5.4, працюючи до десяти разів ефективніше. Ранні корпоративні користувачі бачать подібні досягнення: коли модель MAI була налаштована відповідно до суворих стандартів однієї неназваної організації, вона досягла найвищого показника перемог серед усіх протестованих моделей приблизно за десяту частину вартості. Сулейман представив Frontier Tuning як частину ширшого еволюційного етапу — переходу від інтелекту до дії. “Ми фактично вийшли за межі простого спілкування”, — сказав він VentureBeat. “Тепер ми переходимо до дії”. Він запропонував нову концепцію для осмислення цього прогресу: перехід від IQ (фактичного інтелекту) до EQ (емоційного інтелекту, або здатності дотримуватися вказівок щодо тону та стилю) до того, що він називає AQ — “коефіцієнт дій”. Майбутні ШІ-агенти, за словами Сулеймана, не просто відповідатимуть на запитання. Вони будуть входити в корпоративне програмне забезпечення, навігувати складними багатозастосувальні робочі процеси та виконувати завдання в Excel, Word, Teams, Jira, Adobe InDesign та системах управління взаємовідносинами з клієнтами — так само, як це робить людина-співробітник. “Ви повинні мати можливість прийти в перший день і майже надати облікові дані новому ШІ-агенту”, — сказав він. “Модель повинна мати можливість переміщатися між усіма цими різними середовищами, і це насправді велика сила Microsoft”. Анонси Build 2026 підтвердили це конкретними продуктовими рішеннями. Microsoft Scout, перший агент “Autopilot” компанії, працює як постійно активний фоновий помічник, побудований на основі відкритого коду OpenClaw. Він працює під власним керованим ідентифікатором у Microsoft Entra, тому його дії є аудитованими та відстежуваними. Windows 365 для агентів надає ШІ-агентам власні керовані Cloud PC, що дозволяє їм безпосередньо взаємодіяти з додатками та браузерами в корпоративному середовищі. А платформа Foundry отримала значні оновлення, включаючи розміщені агенти з холодним стартом менше 100 мс, новий Microsoft Agent Framework та можливість публікації в один клік у Teams та Microsoft 365 Copilot.
Чому Microsoft вважає корпоративні дані новим рубежем для тренування ШІ
Сулейман також пояснив, чому, на його думку, позиція Microsoft є унікально стійкою — і цей аргумент менше стосується архітектури моделей, а більше того, де насправді відбувається робота. “Ми ніби ‘пропилососили’ всі очевидні пули навчальних даних”, — сказав він, маючи на увазі ранню гонитву галузі за поглинанням відкритого Інтернету. “На наступному етапі ми насправді хочемо надати ці агенти компаніям для навчання на їхніх конкретних завданнях з використанням даних, які вони мають у своїх великих робочих процесах”. Це твердження є тонким, але важливим. Перша хвиля генеративного ШІ тренувалася на загальнодоступному тексті — книгах, веб-сайтах, постах на Reddit, репозиторіях коду. Ці дані наразі переважно вичерпані, і їх використання все частіше оскаржується в суді. Наступна хвиля, стверджує Сулейман, буде тренуватися на специфічних для підприємств даних: внутрішніх робочих процесах, слідах прийняття рішень та інституційних знаннях, які визначають, як функціонують реальні організації. Microsoft, яка обслуговує 493 компанії зі списку Fortune 500 через Azure, за словами Сулеймана, вже вбудована в ці робочі процеси через Microsoft 365, Teams, Dynamics 365 та ширшу екосистему Azure. Frontier Tuning є механізмом, який перетворює цю позиційну перевагу на продуктивність моделей. “Люди недооцінюють, що це буде наступний домен”, — сказав Сулейман. Початковий список партнерів для Frontier Tuning відображає амбіції: Mayo Clinic, де Microsoft спільно створює передову модель ШІ для охорони здоров’я, використовуючи деідентифіковані клінічні дані; EY, яка налаштовує агент з податкового консультування для розгортання серед 75 000 фахівців у всьому світі; Land O’Lakes, де Frontier Tuning забезпечив те, що науковий співробітник з розробки продуктів компанії назвав “значним покращенням обґрунтованих результатів та відповідності стилю”; і Pearson, яка використовує налаштовані моделі для надання відгуків, узгоджених з наукою про навчання, у своєму продукті Communication Coach. Партнерство з Mayo Clinic може бути найзначнішим. Microsoft та Mayo Clinic співпрацюють над створенням передової моделі, специфічної для охорони здоров’я, яка поєднує клінічний досвід Mayo та довгострокові пацієнтські знання з можливостями ШІ від Microsoft. Модель буде належати Mayo Clinic і спочатку розгорнута в середовищі Mayo, перш ніж стане доступною для інших організацій через Foundry.
Власні чіпи ШІ Microsoft та закупівля GPU показують масштаб її обчислювальних переваг
Ніщо з цього не працюватиме без інфраструктури обчислювальних потужностей промислового масштабу, і Сулейман був незвично відвертим щодо апаратних витрат, що лежать в основі стратегії Microsoft. “Ми є найбільшим покупцем GPU на планеті”, — сказав він. “Ми найбільший покупець GB200 та GB300 у світі”. Microsoft продовжуватиме купувати прискорювачі Nvidia “ще багато років”, — сказав Сулейман. Але компанія одночасно створює власні спеціалізовані чіпи. Maia 200, прискорювач ШІ другого покоління від Microsoft, вже працює у виробничих середовищах у дата-центрах в Айові та Аризоні, з планами розгортання в Італії, Австралії та Південній Кореї. За даними Microsoft, Maia 200 забезпечує найкраще співвідношення токенів на долар на ват у парку компанії. Сулейман деталізував економіку в інтерв’ю: Maia 200 на 30% ефективніший за витратами, ніж Nvidia GB200, сказав він. І коли Microsoft спільно оптимізує власні моделі MAI для роботи на апаратному забезпеченні Maia, компанія досягає додаткового 1,4-кратного підвищення продуктивності на ват. “У майбутні роки буде дешевше створювати на моделях MAI з Maia 200 і Maia 300 всередині Azure”, — сказав він. Це твердження, якщо воно виявиться правильним у масштабі, матиме глибокі наслідки для конкурентного ландшафту. Це означає, що Microsoft не просто купує свій шлях до домінування в ШІ через Nvidia; вона будує вертикально інтегрований стек, в якому її власні моделі, що працюють на її власних чіпах, у її власному хмарному середовищі, налаштовані на даних її клієнтів, можуть запропонувати продуктивність та характеристики вартості, які не може відтворити жоден конкурент.
Сулейман відкидає ідею про те, що моделі ШІ стають товаром
Сулейман також різко відкинув один із найпопулярніших наративів у Кремнієвій долині: що моделі ШІ швидко стають товаром. “Багато хто каже, що моделі стають товаром”, — сказав він. “Я не думаю, що це правда”. Його аргумент ґрунтується на тому, що він називає “якісними токенами” — твердженні, що склад, кураторство, ліцензування та дедуплікація навчальних даних мають щонайменше таке ж значення, як і необроблений масштаб. Нові моделі MAI від Microsoft, сказав він, тренувалися на суміші попереднього навчання, що складалася приблизно з 50% високоякісного коду, а решта походила з комерційно ліцензованих та ретельно відібраних джерел. Результатом, стверджував він, є чітка “лінія походження” моделей, оптимізованих для кодування, міркування та агентної поведінки — фундаментально відмінна від моделей, оптимізованих для споживчого чату, культурного контенту або багатомовної широти. “Ми побачимо дуже чіткі лінії походження, які відображатимуть різні навчальні цілі різних компаній”, — сказав він. “Якісні токени важливіші за грубу силу масштабу”. Це стратегічно важливий аргумент для Microsoft. Якщо моделі є товаром — якщо будь-яка лабораторія може досягти передових результатів за місяці, використовуючи дешевші обчислення та дистильовані навчальні дані — тоді рівень моделей перетворюється на гонку на виживання, і мільярди інвестицій Microsoft у обчислювальні потужності не дають довгострокової переваги. Але якщо якість моделі є функцією дисципліни даних, глибини досліджень та інституційної терплячості, тоді підхід до побудови лабораторії, якого дотримується Сулейман, стає справжнім конкурентним ровом. Він використав конкретну метафору для опису цього підходу, запозичену з теорії оптимізації: “машина для сходження на гору”. Ця фраза описує систему, яка постійно вдосконалюється — цикл за циклом — шляхом використання більших обчислювальних потужностей, кращих даних та точнішої оцінки. “Мета тут — побудувати те, що ми називаємо “машиною для сходження на гору”, — написав він у своєму блозі. “Організація, яка може безперервно вдосконалюватися, цикл за циклом”. Ця метафора показова, оскільки вона описує процес, а не пункт призначення. Сулейман не обіцяє, що Microsoft створить найкращу модель у світі наступного кварталу. Він стверджує, що Microsoft будує *систему* — дослідницьку культуру, конвеєри даних, спільно оптимізоване апаратне забезпечення, інфраструктуру оцінки — яка з роками буде створювати все кращі моделі.
П’ятирічний план Microsoft стати самодостатньою супердержавою в галузі ШІ
Стратегічна картина, що випливає з коментарів Сулеймана — і з повного масштабу анонсів Build 2026 — це компанія, яка готується до майбутнього, де можливості ШІ генеруються внутрішньо, у масштабі, на кожному рівні стека, а не орендуються у партнера. Microsoft все ще потребує OpenAI. Партнерство продовжує підтримувати Copilot, сервіси Azure AI та інфраструктуру ChatGPT. Сулейман визнав це, описуючи портфоліо постачальників моделей Microsoft як джерело сили, а не проблему, яку потрібно вирішувати. Але напрямок руху безпомилковий. Маючи власні передові моделі, власні спеціалізовані чіпи, власні середовища навчання з підкріпленням для корпоративного налаштування та власну інфраструктуру автономних агентів, Microsoft створює паралельний шлях — який до 2030 року може зробити компанію повністю самодостатньою лабораторією передового ШІ, інтегрованою в найбільшу в світі платформу корпоративного програмного забезпечення. “Наша кінцева мета — те, що ми називаємо Гуманістичним Суперінтелектом”, — написав Сулейман у своєму блозі. “Це означає передові системи ШІ, розроблені для служіння людям та організаціям, а не їх заміни”. Чи досяжна ця мета — або навіть чітко визначена — залишається одним із великих відкритих питань у технологіях. І Сулейман висловив більше впевненості, ніж обережності, коли його запитали про траєкторію прогресу. “Я справді думаю, що ми стоїмо на верхівці айсберга”, — сказав він. “Моделі набагато потужніші, ніж ми знаємо, як з них отримати інтелект”. Але впевненість і виконання — це різні речі. Створення передової лабораторії — це не анонс; це десятирічне зобов’язання, яке вимагає збереження елітних дослідників, дотримання наукової строгості під комерційним тиском та досягнення результатів, які виправдовують приголомшливі капітальні витрати. Google навчився цьому з DeepMind — яку Сулейман сам заснував у 2010 році, перш ніж приєднатися до Microsoft — і навіть ця лабораторія, широко визнана однією з найкращих у світі, роками долала напругу між чистими дослідженнями та доставкою продукту. Сулейман, здавалося, усвідомлював це протиріччя. “Якщо поспішати, можна все зіпсувати”, — сказав він. На наклейці на його ноутбуці написано: “Терпіння та терміновість”. Це парадокс, який Microsoft тепер має п’ять років — і кілька сотень мільярдів доларів — щоб вирішити.
Прогноз ІТ-Блогу: Microsoft, ймовірно, зосередиться на інтеграції своїх нових моделей MAI з існуючими продуктами, такими як Windows та Office, створюючи більш інтелектуальні та персоналізовані користувацькі інтерфейси. Цей крок може призвести до зростання попиту на власні обчислювальні потужності компанії та прискорити розробку спеціалізованих ШІ-чіпів, зменшуючи залежність від сторонніх постачальників.
Дізнатися більше на: venturebeat.com
