- BrainTools - https://www.braintools.ru -
Современные модели компьютерного зрения [1] с фокусом на человека (Human-centric CV) требуют миллиардов параметров, гигантских датасетов и дорогостоящего инференса. Но можно ли добиться такой же точности, не тратя миллионы?

Исследователи показали: модели можно обучать только на синтетических данных высокого качества — и при этом достигать тех же результатов. Microsoft представили DAViD — open-source фреймворк, позволяющий создавать цифровых людей с точной геометрией лиц и текстурами.
Проект демонстрирует, как синтетические датасеты могут быть эффективно использованы для решения различных задач компьютерного зрения. В частности, они позволяют определять расстояние до объектов на фотографии или в видео (Depth Prediction), вычислять ориентацию поверхностей (Normal Estimation), сегментировать фон и людей на фото и видео (Background & Human Segmentation).
Синтетические данные обеспечивают пиксельную точность разметки, что делает их идеальными для обучения [2] моделей. Они предлагают почти бесконечное разнообразие сцен, ракурсов, освещения и поз, что позволяет создавать более универсальные и адаптивные алгоритмы. Благодаря этому, модели, обученные на таких данных, прекрасно масштабируются для использования как с нуля, так и для дообучения на специфических задачах.
Microsoft выложила всё это в опенсорс. Теперь разработчики могут использовать 300 000 сэмплов, предобученные модели и исходный код фреймворка для создания собственных решений.
Делегируйте часть рутинных задач вместе с BotHub [8]! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [9] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: mefdayy
Источник [10]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/17717
URLs in this post:
[1] зрения: http://www.braintools.ru/article/6238
[2] обучения: http://www.braintools.ru/article/5125
[3] Проект: https://microsoft.github.io/DAViD/
[4]
: https://microsoft.github.io/DAViD/%EF%BF%BC
[5] Статья: https://arxiv.org/abs/2507.15365
[6]
: https://arxiv.org/abs/2507.15365%EF%BF%BC
[7] Github: https://github.com/microsoft/DAViD
[8] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=MICROSOFT_AGAIN_PROVES_THE_POWER_OF_SYNTHETIC_DATA_FOR_COMPUTER_VISION_TASKS
[9] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[10] Источник: https://habr.com/ru/companies/bothub/news/931616/?utm_source=habrahabr&utm_medium=rss&utm_campaign=931616
Нажмите здесь для печати.