Оптимизация Trellis: запускаем генерацию 3D моделей на GPU с 8ГБ памяти
Привет, Хабр! Я оптимизировал Trellis — мощный AI-инструмент для генерации 3D моделей из изображений, и хочу поделиться тем, как удалось снизить требования к видеопамяти с 16GB до 8GB, сохранив качество генерации.Что такое Trellis и почему это важноTrellis — модель для генерации 3D-ассетов, разработанная Microsoft Research, способная создавать трёхмерные объекты из изображений. Её ключевая особенность — универсальный Structured LATent (SLAT) формат, за счет которого можно генерировать различные выходные форматы: от Radiance Fields и 3D Gaussians до полноценных мешей.
Анализ обработки признаков в YOLO NAS S при помощи CAM
Методы объяснения моделей — практичный инструмент для понимания модели, оценки её точности и стабильности. Однако, часто можно столкнуться с ситуацией, когда фреймворк, в котором метод реализован, просто не "дружит" с реализацией модели. В этом туториале хочу подробно показать CAM (class activation map) для объяснения моделей зрения. Почему CAM?Class Activation Maps (CAM) — базовый инструмент для визуализации того, какие области изображения наиболее важны для модели при принятии решения. Он позволяет понять:Какие признаки извлекает модель на разных слоях свертки;
Как я программирую при помощи больших языковых моделей
От переводчика.Я решил предложить вам перевод этого объёмистого и довольно сложного текста, так как в течение последнего года немало слышал серьёзных успехах больших языковых моделей (БЯМ) в обработке программного кода - в куда большей степени, чем при коммуникации на естественном языке. Например, мой давний знакомый и собеседник Виктор Георгиевич Сиротин @visirokмного пишет в своей Telegram-группе "Материализация идей
Миллион человек воспользовались новой версией Робота Макса
Министерство цифрового развития, связи и массовых коммуникаций РФ заявило, что уже месяц Робот Макс в тестовом режиме консультирует пользователей с помощью генеративного искусственного интеллекта (ИИ). По словам министерства, помощник отвечает на сложные вопросы о работе портала «Госуслуги» и создаёт пошаговые инструкции под конкретные запросы. Новую версию цифрового помощника установил 1 млн человек. Почти 70% из них продолжают ей пользоваться.
50 исследований на тему нейросетей, которые помогут вам стать ИИ-инженером от бога
В этом дайджесте мы собрали 50 знаковых научных работ в области ИИ за последние годы. Подборка охватывает десять ключевых направлений разработки нейросетей: от промтинга и проектирования бенчмарков до файнтюнинга и компьютерного зрения.
Open-source альтернативы Operator от OpenAI
Ну вот, буквально позавчера я написал статью про Browser Use, и уже на следующий день OpenAI объявил о выпуске Operator - ИИ-агента, который может работать в браузере вместо вас.Мало того, что OpenAI открыто манипулируют данными, не включая Browser Use в свой бенчмарк (потому что Browser Use лучше Operator - 89% против 87% в тестах Web Voyager), так ещё и работа идет в браузере на удаленном сервере (уже дико по отношению к приватности), то ещё и скрины всего, что происходит OpenAI будут хранить 3 месяца.
Новая функция Citations от Anthropic направлена на сокращение ошибок AI
В своем объявлении, которое возможно было приурочено к тому, чтобы отвлечь внимание от Operator компании OpenAI , компания Anthropic Thursday представила новую функцию для своего API для разработчиков под названием Citations , которая позволяет разработчикам "привязывать" ответы из семейств искусственного интеллекта Claude к исходным документам, таким как электронные письма.
OpenAI планирует хранить чаты и скриншоты клиентов ИИ-агента Operator до 90 суток ради безопасности
OpenAI сообщила, что может и собирается хранить чаты и связанные с ними скриншоты клиентов, которые используют ИИ‑агента Operator
Один год вместе с LLM в кибербезопасности: как ИИ менял индустрию
В 2024 году большие языковые модели (LLM) кардинально изменили многие сферы, включая кибербезопасность. LLM научились не только помогать в поиске уязвимостей, но и предлагать их исправления. От симуляции атак и анализа уязвимостей до создания правил детектирования — LLM постепенно становятся незаменимым инструментом для разработчиков и специалистов по безопасной разработке.Меня зовут Денис Макрушин, и в Yandex Infrastructure в команде SourceCraft

