NVIDIA представили новую технологию на базе искусственного интеллекта — DIB-R, которая умеет превращать 2D-изображения в 3D-модели.
Название платформы расшифровывается следующим образом: дифференцируемый рендер на основе интерполяции (differentiable interpolation-based renderer). По словам разработчиков, они обучали нейронную сеть DIB-R на нескольких наборах данных: среди них были изображения птиц, из которых создали 3D-модели, готовые 3D-модели в разных ракурсах и так далее.
NVIDIA заявляют, что после обучения DIB-R, которое занимает около двух дней на Tesla V100, платформа преобразует фотографию менее, чем за 100 миллисекунд. За основу берется полигональная сфера, которую нейронная сеть подгоняет под форму реального объекта с фотографии.
Новая технология может быть полезна в сфере робототехники. Для того, чтобы автономный робот правильно взаимодействовал с окружением, он должен воспринимать окружающие предметы с учетом глубины пространства. Другая область применения — создание 3D-моделей из видеопотока.
Разработчики расскажут о разработке в деталях на конференции в области машинного обучения NeurIPS, которая проходит сейчас в Канаде.
Adobe также используют машинное обучение в новом Photoshop.