Реализуем компьютерное зрение на практике
На тему компьютерного зрения есть множество различных публикаций, которые в основном рассказывают о применении этой технологии в разных отраслях. Однако, зачастую публикации содержат лишь общую информацию о том, что реализовано и для каких задач, но при этом отсутствует описание того, как это можно сделать.В нашей статье мы поговорим о том, как можно реализовать на Python навигационную систему на основе машинного зрения для автономных транспортных средств, проанализировать медицинские изображения и выполнить генерацию новых изображений из набора данных уже существующих.
Визуально-языковые модели: следующий шаг эволюции LLM
Ранее мы разбирали методы самосупервизируемого обучения в компьютерном зрении, которые преобразуют изображения и видео в информативные векторные представления (эмбеддинги). Несмотря на их мощь, такие представления обычно требуют дообучения последующих моделей под конкретные задачи. В отличие от этого, большие языковые модели (LLM) блестяще справляются с zero-shot- и few-shot-задачами без какого-либо дообучения. Мы хотим добиться таких же возможностей для визуальных данных.
Центральный университет представил новый способ защиты прав на модели компьютерного зрения
Исследователи Центрального университета нашли новый способ защиты прав на модели компьютерного зрения. Разработанный метод позволяет блокировать нелегальное использование моделей компьютерного зрения и идентифицировать их без переобучения и дополнительных вычислений. По мнению специалистов университета, это может решить проблему пиратства и защиты авторских прав в эпоху искусственного интеллекта.
Компилируем Python так, чтобы он работал везде
Это история о том, как написать компилятор Python, генерирующий оптимизированные ядра и при этом позволяющий сохранить простоту кода.Предисловие
Предопределённые векторы для обучения нейросетей с экономией памяти
Одна из базовых функций систем машинного зрения состоит в классификации объектов. Для решения этой задачи традиционно применяются методы обучения с учителем (SL). Эти методы обеспечивают высокую точность, но при этом размер нейросетевой модели увеличивается с увеличением количества классов. Такая особенность ограничивает применимость SL в тех случаях, когда число классов слишком велико или заранее неизвестно.Эксперт отдела перспективных исследований компании «Криптонит» Никита Габдуллин предложил
Гречневая нейронка. Попытка закрыть национальный гештальт
Привет! В качестве некоторого подытога в изучении нейронок (CV), да и попросту из интереса, я хотел решить одну задачу, но не срослось. Поэтому я стал думать и обнаружил прямо под рукой подходящую задачку. Это гречка. Она содержит чёрные штуки (и не только), которые, если их не убрать, могут повредить зубы. В общем, что у нас получилось?
Nano Banana Pro — почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах
20 ноября состоялся официальный
Сила оттенков серого: компьютерное зрение с нуля
В обсуждениях компьютерного зрения обычно речь идёт об OpenCV или нейронных сетях глубокого обучения наподобие YOLO
Как мы ускорили работу с исполнительной документацией с помощью ИИ
Привет, Хабр! Меня зовут Всеволод Зайковский, я заместитель руководителя проекта в «Газпром ЦПС».Есть рутинные задачи, которые отнимают много времени и трудовых ресурсов. В проектах, с которыми работала компания, такой задачей была каталогизация исполнительной документации. Кто не знает, что это такое, тому очень в жизни повезло

