MacBook M4: ентузіаст обійшов обмеження Apple та розблокував навчання ШІ

MacBook M4: ентузіаст обійшов обмеження Apple та розблокував навчання ШІ 1

Розблокування повного потенціалу Neural Engine

Розробник Ісмаїл Соджал успішно обійшов програмні обмеження Apple, які стосуються навчання моделей штучного інтелекту на нейронному процесорі (ANE) чіпів M4. Хоча ANE в новітніх процесорах Apple, таких як M4, призначений для прискорення операцій ШІ, компанія обмежує його функціональність лише виконанням вже навчених моделей (inference), а не самим процесом навчання. Соджал, застосувавши методи зворотного інжинірингу та розробивши власне програмне забезпечення, зміг запустити повноцінне навчання нейронних мереж безпосередньо на ANE.

Інноваційний підхід до навчання ШІ

Для обходу стандартних фреймворків Apple, таких як CoreML та Metal, розробник створив власний програмний пакет, що працює з проміжною мовою для моделей (Model Intermediate Language, MIL). Цей підхід дозволяє напряму взаємодіяти з апаратними можливостями нейронного процесора. Важливою особливістю його рішення є відмова від запису даних на накопичувач під час навчання. Весь процес відбувається виключно в оперативній пам’яті, що забезпечує вищу швидкість та стабільність роботи. Система також має функцію самостійного перезапуску та досягнення контрольних точок, що гарантує безперебійний і тривалий процес навчання.

Як зазначає сам Ісмаїл Соджал у своєму повідомленні: “Apple приховала 15,8 TFLOPS потужності штучного інтелекту в кожному M4 Mac та iPhone. Вони дозволяють використовувати нейронний рушій лише для логічного висновку. Здійснив зворотну розробку своїх власних API та запустив повне навчання зворотного поширення та трансформації безпосередньо на ANE [Apple Neural Engine], без CoreML, без Metal, без GPU”.

Значення для розробників та майбутнє ШІ

Офіційно Apple заявляє про продуктивність ANE до 38 TOPS, однак ця потужність призначена лише для завдань логічного висновку. Експеримент Соджала демонструє, що реальний потенціал процесора значно вищий. Це відкриває нові горизонти для розробників, дозволяючи їм ефективніше використовувати апаратне забезпечення Apple для ширшого спектра завдань ШІ, а також зменшувати залежність від хмарних сервісів та пов’язаних з цим витрат. Комп’ютери Apple вже набирають популярності як пристрої для локального запуску моделей ШІ, і це відкриття може суттєво посилити їхню привабливість для інженерів та дослідників у галузі штучного інтелекту.

Читайте також: Ентузіаст зібрав недорогий “суперкомп’ютер” для LLM з 1 трлн параметрів

Вердикт ІТ-Блогу: Революційне досягнення для розробників ШІ, які прагнуть максимально використати потужності локальних пристроїв Apple для навчання моделей.

Дізнатися більше на: mezha.ua

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *