NVIDIA STEAL поможет ИИ лучше определять границы у объектов реального мира

Исследователи из NVIDIA, Университета Торонто и Института по изучению искусственного интеллекта Vector в Торонто разработали метод для более точного обнаружения границ, отделяющих одни объекты на изображениях от других. Эта технология может улучшить работу существующих моделей компьютерного зрения и помочь маркировать данные для обучения систем искусственного интеллекта. Например, в экспериментах, проведённых исследователями, STEAL (Semantically Thinned Edge Alignment Learning) позволяет повысить точность одной из современных моделей прогнозирования семантических границ CASENet на 4 %. При этом стоит отметить, что более точное распознавание границ у объектов может иметь приложение для самых разных задач компьютерного зрения, начиная от стандартных по обнаружению и классификации до генерации изображений и трёхмерного моделирования.

Исследователи из NVIDIA, Университета Торонто и Института Vector разработали модель, которая может помочь существующим системам машинного зрения с определением границ реальных объектов и их классификацией

STEAL обнаруживает границы объектов в пикселях при помощи метода, который исследователи называют «активным выравниванием». Как фреймворк он может применяться для улучшения существующих свёрточных нейронных сетей и моделей машинного зрения. Также учёные считают, что их разработка может помочь другим исследователям более эффективно маркировать или аннотировать данные для обучения их нейронных сетей. Чтобы доказать это, метод STEAL был использован для уточнения Cityscapes, набора визуальных данных в рамках городской среды, впервые представленного на конференции Computer Vision and Pattern Recognition (CVPR) в 2016 году, при этом удалось добиться увеличения точности сегментации в отдельных категориях до 1,2 %.

Пример работы STEAL в динамике

«Мы обнаружили, что наши результаты по предсказанию границ у объектов значительно лучше, чем те, которые по последним данным, демонстрирует модель DeepLab-v3, и это при использовании гораздо более лёгкой архитектуры», — пишут авторы исследования.

Научная работа «Дьявол в границах: изучение семантических границ в зашумлённых аннотациях» будет представлена в устной презентации на этой неделе на конференции CVPR 2019 в Лонг-Бич, Калифорния. Помимо неё десятки других исследовательских работ, многие из которых написаны исследователями из NVIDIA Research, будут представлены в выступлениях на конференции, сообщает компания NVIDIA в своём блоге.

Исходный код STEAL доступен для всех желающих на платформе GitHub.

Источник: