
Шлях від лабораторної гіпотези до полиці аптеки — це один із найскладніших марафонів сучасної індустрії, що зазвичай триває від 10 до 15 років і вимагає мільярдних інвестицій.
Прогрес часто стримується не лише прихованими таємницями біології, але й «фрагментованими та складними для масштабування» робочими процесами, які змушують дослідників вручну перемикатися між обладнанням для експериментального дизайну, програмним забезпеченням та базами даних.
Однак OpenAI випускає нову спеціалізовану модель GPT-Rosalind, покликану прискорити цей процес, зробити його ефективнішим, легшим і, в ідеалі, продуктивнішим. Названа на честь піонерки хімії Розалінд Франклін, чия робота була життєво важливою для відкриття структури ДНК (і чий внесок часто недооцінювався порівняно з її колегами-чоловіками Джеймсом Ватсоном і Френсісом Кріком), ця нова модель, що використовує передові можливості обробки інформації, створена спеціально для того, щоб виступати як шар спеціалізованого інтелекту для досліджень у галузі наук про життя.
Переводячи роль штучного інтелекту з помічника загального призначення на «розумного» партнера, специфічного для певної галузі, OpenAI сигналізує про довгострокове зобов’язання щодо відкриттів у біології та хімії.
Що пропонує GPT-Rosalind
GPT-Rosalind — це не просто інструмент для швидшого створення тексту; він розроблений для синтезу доказів, генерації біологічних гіпотез та планування експериментів — завдань, які традиційно вимагали років експертного людського синтезу.
По суті, GPT-Rosalind є першою в новому ряду моделей, оптимізованих для наукових робочих процесів. Якщо попередні версії GPT демонстрували видатні результати у загальних мовних завданнях, ця модель пройшла додаткове доопрацювання для глибшого розуміння в галузях геноміки, інженерії білків та хімії.
Для перевірки своїх можливостей OpenAI протестував модель на кількох галузевих бенчмарках. На BixBench, метриці для реального аналізу даних та біоінформатики, GPT-Rosalind продемонстрував провідну продуктивність серед моделей з опублікованими результатами.
У більш детальному тестуванні через LABBench2 модель перевершила GPT-5.4 у шести з одинадцяти завдань, причому найсуттєвіше покращення спостерігалося у CloningQA — завданні, що вимагає комплексного проектування реагентів для протоколів молекулярного клонування.
Найбільш вражаючий сигнал продуктивності моделі надійшов від партнерства з Dyno Therapeutics. Під час оцінки з використанням неопублікованих, «незабруднених» послідовностей РНК, GPT-Rosalind було поставлено завдання передбачення та генерації послідовності для функціонального аналізу.
За результатами прямої оцінки в середовищі Codex, роботи моделі увійшли до топ-95% за завданнями прогнозування та досягли 84% за генерацією послідовностей, перевищивши результати людських експертів.
Такий рівень експертизи свідчить про те, що модель може слугувати висококваліфікованим співробітником, здатним ідентифікувати «шаблони, релевантні для експертів», які часто залишаються непоміченими для загальних моделей.
Новий робочий процес у лабораторії
OpenAI випускає не просто модель, а екосистему, призначену для інтеграції з інструментами, якими вже користуються науковці. Центральним елементом цього є новий плагін для наукових досліджень у галузі наук про життя для Codex, доступний на GitHub.
Наукові дослідження відомі своєю ізольованістю. Один проєкт може вимагати від дослідника консультації з базою даних білкових структур, пошуку в 20-річних клінічних публікаціях, а потім використання окремого інструменту для маніпуляції послідовностями. Новий плагін діє як «рівень оркестрації», забезпечуючи єдину точку відліку для цих багатоетапних запитів.
-
Набір навичок: Пакет включає модульні навички для біохімії, генетики людини, функціональної геноміки та клінічних доказів.
-
Зв’язність: Він підключає моделі до понад 50 загальнодоступних мультиомних баз даних та джерел літератури.
-
Ефективність: Цей підхід націлений на «довгострокові, інструментально-інтенсивні наукові робочі процеси», дозволяючи дослідникам автоматизувати повторювані завдання, такі як пошук білкових структур та послідовностей.
Обмежений та контрольований доступ
З огляду на потенційну потужність моделі, здатної до редизайну біологічних структур, OpenAI відмовляється від широкого випуску «відкритим кодом» або загальнодоступного релізу на користь програми «Довірений доступ».
Модель запускається як дослідницька попередня версія спеціально для кваліфікованих корпоративних клієнтів у Сполучених Штатах. Цей обмежений розгортання базується на трьох основних принципах: корисне використання, сильне управління та контрольований доступ.
Організації, які запитують доступ, повинні пройти кваліфікацію та перевірку безпеки, щоб переконатися, що вони проводять легітимні дослідження з чіткою суспільною користю.
На відміну від моделей загального призначення, GPT-Rosalind розроблявся з підвищеними корпоративними засобами контролю безпеки. Для кінцевого користувача це означає:
-
Обмежений доступ: Використання обмежено затвердженими користувачами в захищених, добре керованих середовищах.
-
Управління: Організації-учасниці повинні підтримувати суворі засоби запобігання зловживанням та погодитися зі специфічними умовами попереднього перегляду досліджень у галузі наук про життя.
-
Вартість: На етапі попереднього перегляду модель не споживатиме наявні кредити чи токени, що дозволить дослідникам експериментувати без негайних бюджетних обмежень (за умови дотримання заходів захисту від зловживань).
Теплий прийом від перших галузевих партнерів
Анонс отримав значну підтримку від партнерів OpenAI з фармацевтичного та технологічного секторів.
Шон Брюйх, віце-президент з ШІ та даних в Amgen, зазначив, що співпраця дозволяє компанії застосовувати передові інструменти таким чином, що може «прискорити доставку ліків пацієнтам». Вплив відчувається також у спеціалізованій технологічній інфраструктурі, яка підтримує лабораторії:
-
NVIDIA: Кімберлі Пауелл, віце-президент з охорони здоров’я та наук про життя, описала злиття предметного міркування та прискорених обчислень як спосіб «стиснути роки традиційних досліджень і розробок у негайні, дієві наукові висновки».
-
Moderna: Генеральний директор Стефан Бансель підкреслив здатність моделі «аналізувати складні біологічні докази» для допомоги командам у перетворенні висновків на експериментальні робочі процеси.
-
The Allen Institute: Головний технічний директор Енді Хікл наголосив, що GPT-Rosalind виділяється тим, що робить ручні кроки — як-от пошук та узгодження даних — більш «послідовними та повторюваними в автономному робочому процесі».
Це спирається на відчутні результати, яких OpenAI вже досяг у цій галузі, зокрема співпраця з Ginkgo Bioworks, де моделі ШІ допомогли скоротити витрати на виробництво білків на 40%.
Що далі для Розалінд та OpenAI у галузі наук про життя?
Місія OpenAI з GPT-Rosalind полягає у скороченні розриву між «перспективною науковою ідеєю» та фактичними «доказами, експериментами та рішеннями», необхідними для медичного прогресу.
Співпрацюючи з такими установами, як Національна лабораторія Лос-Аламоса, для дослідження каталітичного дизайну на основі ШІ та модифікації біологічних структур, компанія позиціонує GPT-Rosalind не просто як інструмент, а як «спроможного партнера у відкриттях».
Оскільки сфера наук про життя стає дедалі більш насиченою даними, перехід до спеціалізованих «розумних» моделей, подібних до Rosalind, може стати стандартом для навігації «величезними просторами пошуку» в біології та хімії.
Прогноз ІТ-Блогу: З появою GPT-Rosalind очікується значне прискорення наукових відкриттів у галузі біології та медицини, потенційно скорочуючи час розробки нових ліків та терапій. У наступні 1-2 роки ми побачимо інтеграцію подібних спеціалізованих моделей у стандартні лабораторні робочі процеси, що призведе до появи нових стартапів, зосереджених на вирішенні конкретних наукових завдань за допомогою ШІ.
Інформація підготовлена на основі матеріалів: venturebeat.com
