Apple представила нейросеть LiTo: она генерирует 3D-объекты с реалистичными бликами и отражениями по одной фотографии

Исследователи ML-подразделения Apple представили ^[1] модель машинного обучения ^[2] LiTo, которая восстанавливает 3D-объекты по одной фотографии и сохраняет сложные визуальные эффекты, включая блики, отражения и изменения внешнего вида материала под разными углами.

Авторы работы отмечают, что большинство нейросетей для генерации 3D-моделей нацелены на точную передачу геометрии. Даже если модель умеет создавать текстуры, то она работает только с «плоскими» цветами поверхности и плохо понимает, как меняется внешний вид объекта в зависимости от освещения и угла обзора.

Эту проблему решает нейросеть LiTo. Модель машинного обучения кодирует в латентном пространстве сразу геометрию и то, как меняется внешний вид объекта. Нейросеть сначала обучили генерировать 3D-объекты, а после, с помощью сжатия случайных выборок светового поля поверхности в компактный набор латентных векторов — восстанавливать визуальные эффекты.

Apple представила нейросеть LiTo: она генерирует 3D-объекты с реалистичными бликами и отражениями по одной фотографии - 2

Работу LiTo сравнили с нейросетью TRELLIS. Apple отмечает, что LiTo генерирует более качественные 3D-объекты с высоким уровнем точности относительно входного изображения. Нейросеть планируют использовать для создания ассетов и более быстрого переноса реальных объектов в цифровые 3D-модели.

Apple представила нейросеть LiTo: она генерирует 3D-объекты с реалистичными бликами и отражениями по одной фотографии - 3

Автор: daniilshat

Источник ^[3]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/27430

URLs in this post:

[1] представили: https://apple.github.io/ml-lito/

[2] обучения: http://www.braintools.ru/article/5125

[3] Источник: https://habr.com/ru/news/1012462/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1012462

Нажмите здесь для печати.