- BrainTools - https://www.braintools.ru -
Исследователи ML-подразделения Apple представили [1] модель машинного обучения [2] LiTo, которая восстанавливает 3D-объекты по одной фотографии и сохраняет сложные визуальные эффекты, включая блики, отражения и изменения внешнего вида материала под разными углами.

Авторы работы отмечают, что большинство нейросетей для генерации 3D-моделей нацелены на точную передачу геометрии. Даже если модель умеет создавать текстуры, то она работает только с «плоскими» цветами поверхности и плохо понимает, как меняется внешний вид объекта в зависимости от освещения и угла обзора.
Эту проблему решает нейросеть LiTo. Модель машинного обучения кодирует в латентном пространстве сразу геометрию и то, как меняется внешний вид объекта. Нейросеть сначала обучили генерировать 3D-объекты, а после, с помощью сжатия случайных выборок светового поля поверхности в компактный набор латентных векторов — восстанавливать визуальные эффекты.

Работу LiTo сравнили с нейросетью TRELLIS. Apple отмечает, что LiTo генерирует более качественные 3D-объекты с высоким уровнем точности относительно входного изображения. Нейросеть планируют использовать для создания ассетов и более быстрого переноса реальных объектов в цифровые 3D-модели.

Автор: daniilshat
Источник [3]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/27430
URLs in this post:
[1] представили: https://apple.github.io/ml-lito/
[2] обучения: http://www.braintools.ru/article/5125
[3] Источник: https://habr.com/ru/news/1012462/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1012462
Нажмите здесь для печати.