компьютерное зрение. - страница 8

Сказ о том, как мы приложение для падел-тенниса создавали

ЗачинКак‑то раз двое ML‑щиков решили соединить свою любовь к компьютерному зрению и ракеточным видам спорта. Так родилась идея сделать систему видеоаналитики для падел‑тенниса.Падел — это игра на стыке большого тенниса и сквоша. От сквоша падел взял стеклянные стены вокруг корта, а от большого тенниса — почти всё остальное, за исключением того, что всегда играют 2 на 2 и «подача мяча» (момент, с которого начинается каждый розыгрыш) выполняется снизу, а в большем теннисе сверху.Пример того, как выглядит розыгрыш в падел-теннисе: ссылка.

продолжить чтение

От аэратора до антидронов: 10 технологических стартапов Архипелага 2025

продолжить чтение

OpenCV. Начало

В прошедшем июне исполнилось 25 лет первому релизу OpenCV. Господи, как летит время! Кажется, только вчера мы писали первые строчки. А уже четверть века с тех пор прошло. Самое время вспомнить, как все начиналось. Я не ставил себе целью рассказать в этой статье полную историю OpenCV — есть замечательная книга Гари,

продолжить чтение

Microsoft снова доказывает силу синтетических данных для задач компьютерного зрения

Современные модели компьютерного зрения с фокусом на человека (Human-centric CV) требуют миллиардов параметров, гигантских датасетов и дорогостоящего инференса. Но можно ли добиться такой же точности, не тратя миллионы?

продолжить чтение

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально. 

продолжить чтение

RealSense выходит из состава Intel, чтобы масштабировать свою технологию стереоскопической визуализации

Спустя 14 лет работы в составе крупной корпорации Intel, занимающейся производством полупроводников, компания RealSense начинает свою деятельность как независимый игрок на рынке.

продолжить чтение

Как мы строили KidFolio — цифровую платформу для родителей и детских садов

Мы — Даврон Ихматуллаев и Михаил Назаров — выпускники онлайн-магистратуры «Науки о данных» Центра «Пуск» МФТИ. В рамках дипломной работы и студенческого стартап-проекта мы разработали KidFolio — цифровую платформу, которая автоматически отправляет родителям персонализированные фото- и видеоотчеты из детского сада, используя технологии компьютерного зрения (CV) и мультимодальных языковых моделей (VLM).В этой статье расскажем, как мы делали из идеи продукт:от гипотезы и интервью с воспитателями до запуска MVP в виде телеграм-бота;как дообучали модели распознавания лиц под детский домен;

продолжить чтение

Как студент MIT ускорил реставрацию картин с помощью ИИ и полимерных масок

Реставрация старых картин — процесс, требующий и художественного чутья, и усидчивости. На восстановление одного полотна уходят месяцы и даже годы. Алекс Качкин, аспирант Массачусетского технологического института (MIT), предложил метод, который использует искусственный интеллект и полимерные маски для быстрого и обратимого восстановления поврежденных произведений искусства. Его разработка, описанная в журнале Nature, обещает вернуть к жизни тысячи картин, спрятанных в запасниках музеев.

продолжить чтение

Компьютерное зрение для начинающих

Тема компьютерного зрения наряду с искусственным интеллектом в последние годы стала очень популярной. Сегодня компьютерное зрение — это динамичная и быстро развивающаяся область, постоянно расширяющая границы того, что могут видеть и понимать машины.Однако, зачастую многие публикации посвященные computer vision являются достаточно сложными для тех, кто только погружается в данную тему.

продолжить чтение

Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

"Распознать бы этого шакала"

продолжить чтение