- BrainTools - https://www.braintools.ru -

ByteDance представила Depth Anything 3 [1] (DA3) – новую мультимодальную модель, способную предсказывать пространственно-согласованную геометрию по одному или нескольким изображениям без необходимости знать параметры камеры. Главная особенность DA3 – радикальное упрощение архитектуры: единый трансформер использует унифицированное представление depth-ray, что позволяет одной модели одновременно решать задачи оценки глубины, определения позы камеры и генерации 3D-гауссианов для новых ракурсов.

В тестах DA3 превосходит предыдущие версии по точности и устойчивости, обеспечивая улучшенное качество 3D-визуализации для приложений в AR/VR, дизайне и робототехнике.

Команда также опубликовала веса модели, инструментарий CLI и WebUI на Gradio, что делает модель доступной для исследователей и разработчиков. Такой подход значительно ускоряет работу с 3D-контентом и снижает требования к вычислительным ресурсам.
Делегируйте часть рутинных задач вместе с BotHub! [2] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [3] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn
Источник [4]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/22054
URLs in this post:
[1] Depth Anything 3: https://depth-anything-3.github.io/
[2] BotHub!: https://bothub.chat/?utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_source=contentmarketing&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_medium=habr&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_campaign=news&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_content=DATABRICKS%20CO-FOUNDER%20URGES%20THE%20U.S.%20TO%20ADOPT%20OPEN-SOURCE%20AI%20TO%20OUTCOMPETE%20CHINA
[3] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[4] Источник: https://habr.com/ru/companies/bothub/news/967572/?utm_source=habrahabr&utm_medium=rss&utm_campaign=967572
Нажмите здесь для печати.