Визуально-языковые модели: следующий шаг эволюции LLM
Ранее мы разбирали методы самосупервизируемого обучения в компьютерном зрении, которые преобразуют изображения и видео в информативные векторные представления (эмбеддинги). Несмотря на их мощь, такие представления обычно требуют дообучения последующих моделей под конкретные задачи. В отличие от этого, большие языковые модели (LLM) блестяще справляются с zero-shot- и few-shot-задачами без какого-либо дообучения. Мы хотим добиться таких же возможностей для визуальных данных.
Центральный университет представил новый способ защиты прав на модели компьютерного зрения
Исследователи Центрального университета нашли новый способ защиты прав на модели компьютерного зрения. Разработанный метод позволяет блокировать нелегальное использование моделей компьютерного зрения и идентифицировать их без переобучения и дополнительных вычислений. По мнению специалистов университета, это может решить проблему пиратства и защиты авторских прав в эпоху искусственного интеллекта.
Компилируем Python так, чтобы он работал везде
Это история о том, как написать компилятор Python, генерирующий оптимизированные ядра и при этом позволяющий сохранить простоту кода.Предисловие
Предопределённые векторы для обучения нейросетей с экономией памяти
Одна из базовых функций систем машинного зрения состоит в классификации объектов. Для решения этой задачи традиционно применяются методы обучения с учителем (SL). Эти методы обеспечивают высокую точность, но при этом размер нейросетевой модели увеличивается с увеличением количества классов. Такая особенность ограничивает применимость SL в тех случаях, когда число классов слишком велико или заранее неизвестно.Эксперт отдела перспективных исследований компании «Криптонит» Никита Габдуллин предложил
Гречневая нейронка. Попытка закрыть национальный гештальт
Привет! В качестве некоторого подытога в изучении нейронок (CV), да и попросту из интереса, я хотел решить одну задачу, но не срослось. Поэтому я стал думать и обнаружил прямо под рукой подходящую задачку. Это гречка. Она содержит чёрные штуки (и не только), которые, если их не убрать, могут повредить зубы. В общем, что у нас получилось?
Nano Banana Pro — почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах
20 ноября состоялся официальный
Сила оттенков серого: компьютерное зрение с нуля
В обсуждениях компьютерного зрения обычно речь идёт об OpenCV или нейронных сетях глубокого обучения наподобие YOLO
Как мы ускорили работу с исполнительной документацией с помощью ИИ
Привет, Хабр! Меня зовут Всеволод Зайковский, я заместитель руководителя проекта в «Газпром ЦПС».Есть рутинные задачи, которые отнимают много времени и трудовых ресурсов. В проектах, с которыми работала компания, такой задачей была каталогизация исполнительной документации. Кто не знает, что это такое, тому очень в жизни повезло
Если в кране нет воды… значит сработали моллюски
В Варшаве судьбу водопровода решают восемь моллюсков. Не инженеры, не лаборанты с пробирками, не автоматические анализаторы за миллионы злотых, а обычные речные беззубки размером с ладонь, выловленные в чистых водоемах. Они сидят в проточных резервуарах на главной насосной станции, фильтруют воду и... всё. Пока створки раковин открыты - два миллиона человек получают воду из кранов. Стоит моллюскам почуять что-то неладное и захлопнуться - подача автоматически блокируется по всему городу.

