
Наприкінці минулого року Google ненадовго захопила лідерство серед найпотужніших ШІ-моделей світу, випустивши Gemini 3 Pro. Проте вже за кілька тижнів їх випередили OpenAI та Anthropic, які представили власні нові розробки, що є звичною картиною у надзвичайно конкурентній гонці штучного інтелекту.
Тепер Google повертається, аби знову посісти трон, презентувавши оновлену версію своєї флагманської моделі: Gemini 3.1 Pro. Її позиціонують як більш інтелектуальну основу для завдань, де простих відповідей недостатньо, орієнтуючись на наукові, дослідницькі та інженерні робочі процеси, що вимагають глибокого планування та синтезу.
Вже зараз оцінки від незалежної компанії Artificial Analysis свідчать, що Gemini 3.1 Pro від Google знову вирвалася вперед і є найпотужнішою та найефективнішою ШІ-моделлю у світі.
Суттєвий прогрес у базовому логічному мисленні
Найбільш значним досягненням Gemini 3.1 Pro є її продуктивність у складних логічних тестах. Зокрема, модель продемонструвала підтверджений результат у 77,1% на тесті ARC-AGI-2.
Цей специфічний бенчмарк розроблений для оцінки здатності моделі вирішувати абсолютно нові логічні патерни, які вона не зустрічала під час тренування.
Цей результат більш ніж удвічі перевищує показники логічного мислення попередньої моделі Gemini 3 Pro.

Окрім абстрактної логіки, внутрішні тести демонструють високу конкурентоспроможність 3.1 Pro у спеціалізованих галузях:
-
Наукові знання: Модель показала результат 94,3% на тесті GPQA Diamond.
-
Програмування: Досягнуто рейтингу Elo 2887 на LiveCodeBench Pro та 80,6% на SWE-Bench Verified.
-
Мультимодальне розуміння: Результат 92,6% на тесті MMMLU.
Ці технічні досягнення є не просто поступовими поліпшеннями; вони відображають удосконалення у тому, як модель обробляє “мисленнєві” токени та завдання з довгою часовою перспективою, забезпечуючи надійнішу основу для розробників, що створюють автономних агентів.
Покращене кодування “вайбу” та 3D-синтез
Google демонструє корисність моделі через “застосований інтелект”, зміщуючи фокус з чат-інтерфейсів на функціональні результати.
Однією з найвизначніших можливостей є генерація анімованих SVG з “вайб-кодуванням” безпосередньо з текстових запитів. Оскільки ці файли є кодовими, а не піксельними, вони залишаються масштабованими та мають надзвичайно малий розмір порівняно з традиційним відео. Це забезпечує значно детальніші, презентабельні та професійніші візуалізації для вебсайтів, презентацій та інших корпоративних застосувань.
Серед інших продемонстрованих застосувань:
-
Синтез складних систем: Модель успішно налаштувала публічний потік телеметрії для створення живого аерокосмічного дашборда, що візуалізує орбіту Міжнародної космічної станції.
-
Інтерактивний дизайн: В одній з демонстрацій 3.1 Pro згенерувала складне 3D-мерехтіння шпаків, яким користувачі можуть керувати за допомогою відстеження рук, доповнене генеративною аудіо-партією.
-
Креативне кодування: Модель переклала атмосферні теми роману Емілі Бронте “Грозовий перевал” у функціональний сучасний вебдизайн, демонструючи здатність аналізувати тон і стиль, а не лише буквальний текст.
Вплив на бізнес та реакція спільноти
Корпоративні партнери вже почали інтегрувати попередню версію 3.1 Pro, відзначаючи помітні покращення у надійності та ефективності.
Владислав Танков, директор з ШІ в JetBrains, зазначив 15% зростання якості порівняно з попередніми версіями, заявивши, що модель “сильніша, швидша… і ефективніша, потребуючи менше вихідних токенів”. Інші відгуки з індустрії включають:
-
Databricks: Технічний директор Ханьлінь Тан повідомив, що модель досягла “найкращих у своєму класі результатів” на OfficeQA, тесті для обґрунтованого аналізу табличних та неструктурованих даних.
-
Cartwheel: Співзасновник Ендрю Карр підкреслив “суттєво покращене розуміння 3D-трансформацій” моделлю, зазначивши, що вона вирішила давні проблеми з порядком обертання в конвеєрах 3D-анімації.
-
Hostinger Horizons: Керівник продукту Дайніус Каволіунас відзначив, що модель розуміє “вайб” запиту, перетворюючи наміри на стилістично точний код для нерозробників.
Ціноутворення, ліцензування та доступність
Для розробників найбільш вражаючим аспектом випуску 3.1 Pro є співвідношення “міркування до долара”. Коли Gemini 3 Pro вийшла на ринок, її ціна становила $2.00 за 1 мільйон вхідних токенів для стандартних запитів. Gemini 3.1 Pro зберігає цю ж структуру ціноутворення, фактично пропонуючи значне підвищення продуктивності без додаткових витрат для користувачів API.
-
Ціна за вхідні дані: $2.00 за 1 млн токенів для запитів до 200 тис.; $4.00 за 1 млн токенів для запитів понад 200 тис.
-
Ціна за вихідні дані: $12.00 за 1 млн токенів для запитів до 200 тис.; $18.00 за 1 млн токенів для запитів понад 200 тис.
-
Кешування контексту: Білінг від $0.20 до $0.40 за 1 млн токенів залежно від розміру запиту, плюс плата за зберігання $4.50 за 1 млн токенів на годину.
-
Обґрунтування пошуку: 5 000 запитів на місяць безкоштовно, далі – $14 за 1 000 пошукових запитів.
Для споживачів модель поступово впроваджується в застосунку Gemini та NotebookLM з вищими лімітами для передплатників Google AI Pro та Ultra.
Наслідки ліцензування
Як пропрієтарна модель, що пропонується через Vertex Studio в Google Cloud та Gemini API, 3.1 Pro дотримується стандартної моделі комерційного SaaS (Software as a Service), а не ліцензії з відкритим кодом.
Для корпоративних користувачів це забезпечує “обґрунтовані міркування” в межах периметра безпеки Vertex AI, дозволяючи компаніям впевнено працювати з власними даними.
Статус “Preview” дозволяє Google вдосконалювати безпеку та продуктивність моделі перед загальною доступністю, що є типовою практикою при розгортанні критично важливих ШІ-систем.
Подвоюючи зусилля у сфері базового мислення та спеціалізованих тестів, таких як ARC-AGI-2, Google сигналізує, що наступний етап гонки ШІ виграють моделі, які здатні осмислювати проблему, а не просто передбачати наступне слово.
Порада від ІТ-Блог:
Оновлена модель Gemini 3.1 Pro від Google – це справжній прорив для професіоналів, які працюють з науковими дослідженнями, інженерією та складним програмуванням. Суттєве покращення логічного мислення та мультимодальних можливостей робить її незамінним інструментом для вирішення найскладніших завдань. А головне – покращення продуктивності відбулося без збільшення вартості, що робить її надзвичайно привабливою для бізнесу та розробників.
За даними порталу: venturebeat.com
