Как свёрточные нейронные сети видят мир
Привет, Хабр! Меня зовут Яна Вольнова, я ex-разработчик систем распознавания образов, а сейчас преподаю глубокое машинное обучение в МГТУ им. Н.Э. Баумана и пишу курсы для Яндекс Практикума, например, «Инженер по глубокому обучению нейросетей» и «Компьютерное зрение — CV»
OCR всё прочитал, но ничего не понял: как мы научили систему разбирать транспортные накладные
Материал подготовлен для будущих студентов курса «Компьютерное зрение».Каждый день склады обрабатывают тысячи транспортных наклеек. FedEx, UPS, DHL, USPS, региональные перевозчики — у каждого свой макет, свои размеры шрифтов и расположение полей. На наклейке FedEx номер отслеживания может находиться наверху, а на наклейке DHL — посередине. Обратный адрес у одного перевозчика выровнен по левому краю, у другого — по центру.
Я научил виртуальную камеру быть оператором: как устроен алгоритм face tracking для Shorts-Reels
В предыдущей статье
Как я построил «аниме-завод»: систему, которая сама превращает эпизоды в YouTube Shorts
Привет, Хабр!
От вет-ИИ для коров до имперского глянца: хардкорный MLOps на бесплатных GPU
Введение. Контекст как катализаторВ начале 2026 года ленты новостей принесли тревожные сообщения из Сибири: массовые вспышки опасных заболеваний у КРС (крупного рогатого скота) привели к необходимости вынужденного забоя тысяч голов. Для многих фермеров это означало потерю бизнеса и средств к существованию.Мы задались вопросом: может ли доступный Computer Vision стать первой линией обороны? Инструментом, который позволит фермеру в отдаленном районе провести первичный скрининг (триаж) животного с помощью обычного смартфона и вовремя вызвать ветеринара, не дожидаясь начала эпидемии.Так родился проект AI-Vet-Scanner
Робот с видеонаблюдением и отслеживанием объекта
Отслеживание маркера роботомВведениеДанный проект, является логическим продолжением развития темы "Солнечный трекер на Arduino".
Как мы пытались научить ИИ судить поединки по кендо
Я с командой на соревнованиях по кендоВсем привет! Меня зовут Иван. Многие знают меня по ИТ, сейчас я руковожу НИИ Крокодил и занимаюсь прикладным ИИ. Параллельно уже много лет практикую кендо и являюсь президентом Федерации кендо в Удмуртии.
SmileFace. Когда нейросеть улыбается тебе в ответ
Исходники открыты на GitHub: github.com/konstantinkozhin/SmileFaceОт идеи до смеха в коридореКо Дню программиста в университете нужно было сделать интерактивный стенд — что-то весёлое, но с технологическим смыслом. Квиз или чат-бот казались скучными, хотелось чего-то с человеческим лицом — буквально.Я вспомнил о библиотеках, которые умеют распознавать эмоции по видео, и подумал: а что, если превратить это в игру?Так появилась идея SmileFace
Как искать различия на изображениях в визуальном тестировании ПО с помощью ИИ
Ключевые выводыОбнаружение различий между двумя изображениями — важная задача в визуальной автоматизации тестирования, когда скриншот нужно сравнить с предыдущей версией или эталонным дизайном.Генеративный ИИ на базе мультимодальных языковых моделей отлично распознаёт и объясняет содержимое изображения, но способен выявлять различия лишь в тех аспектах, на которых он был явно обучен.Эта задача обычно решается с помощью сверточной нейронной сети (CNN), сравнивающей небольшие фрагменты изображений (область 9×9 пикселей) вместо отдельных пикселей.

