Робот с видеонаблюдением и отслеживанием объекта
Отслеживание маркера роботомВведениеДанный проект, является логическим продолжением развития темы "Солнечный трекер на Arduino".
Как мы пытались научить ИИ судить поединки по кендо
Я с командой на соревнованиях по кендоВсем привет! Меня зовут Иван. Многие знают меня по ИТ, сейчас я руковожу НИИ Крокодил и занимаюсь прикладным ИИ. Параллельно уже много лет практикую кендо и являюсь президентом Федерации кендо в Удмуртии.
SmileFace. Когда нейросеть улыбается тебе в ответ
Исходники открыты на GitHub: github.com/konstantinkozhin/SmileFaceОт идеи до смеха в коридореКо Дню программиста в университете нужно было сделать интерактивный стенд — что-то весёлое, но с технологическим смыслом. Квиз или чат-бот казались скучными, хотелось чего-то с человеческим лицом — буквально.Я вспомнил о библиотеках, которые умеют распознавать эмоции по видео, и подумал: а что, если превратить это в игру?Так появилась идея SmileFace
Как искать различия на изображениях в визуальном тестировании ПО с помощью ИИ
Ключевые выводыОбнаружение различий между двумя изображениями — важная задача в визуальной автоматизации тестирования, когда скриншот нужно сравнить с предыдущей версией или эталонным дизайном.Генеративный ИИ на базе мультимодальных языковых моделей отлично распознаёт и объясняет содержимое изображения, но способен выявлять различия лишь в тех аспектах, на которых он был явно обучен.Эта задача обычно решается с помощью сверточной нейронной сети (CNN), сравнивающей небольшие фрагменты изображений (область 9×9 пикселей) вместо отдельных пикселей.
Визуальное тестирование с ИИ: сравнение скриншотов без ложных срабатываний
Ключевые выводыОбнаружение различий между двумя изображениями — важная задача в визуальной автоматизации тестирования, когда скриншот нужно сравнить с предыдущей версией или эталонным дизайном.Генеративный ИИ на базе мультимодальных языковых моделей отлично распознаёт и объясняет содержимое изображения, но способен выявлять различия лишь в тех аспектах, на которых он был явно обучен.Эта задача обычно решается с помощью сверточной нейронной сети (CNN), сравнивающей небольшие фрагменты изображений (область 9×9 пикселей) вместо отдельных пикселей.
Оптимизация функций компьютерного зрения (библиотека OpenCV) для RISC-V
OpenCV — популярная библиотека, включающая множество алгоритмов компьютерного зрения и функций для них. Оптимизация их под RISC-V — большая и интересная задача, которой в рамках Зимней школы RISC-V YADRO сезона 2024–2025 занимались студенты Университета Лобачевского (ННГУ). В этой статье они подробно расскажут о своей работе.
Определение положения объектов на изображении: как найти пространственные координаты объекта, используя OpenCV
Привет, Хабр!Меня зовут Брискиндов Леонид, я школьник, участник соревнований и олимпиад по робототехнике и программированию. Нередко для решения задач таких олимпиад предоставляется доступ к единственной камере, снимающей тестовое поле, на котором расположены роботы. Таким образом появляется задача определения положения объектов в пространстве по изображению, полученному с камеры. В данной статье мы и разберём, как решать такую задачу, используя библиотеку OpenCV.
OpenCV. Начало
В прошедшем июне исполнилось 25 лет первому релизу OpenCV. Господи, как летит время! Кажется, только вчера мы писали первые строчки. А уже четверть века с тех пор прошло. Самое время вспомнить, как все начиналось. Я не ставил себе целью рассказать в этой статье полную историю OpenCV — есть замечательная книга Гари,
Как приручить AI-пиксель-арт
За последние пару лет генеративные нейросети стали волшебной кисточкой для всего: концепт-артов, иконок, иллюстраций, обложек, аватаров, спрайтов… Особенно - пиксель-арта. В Midjourney, Stable Diffusion, Dall-E, Image-1 и в других моделях можно просто вбить: “Pixel art goose with goggles in the style of SNES”
Как мы оживили DPED: собираем датасет для обучения модели
Привет, Хабр! Сегодня с вами команда регионального научно-образовательного центра «Искусственный интеллект и анализ больших данных» при НГТУ им. Р. Е. Алексеева. Продолжаем рассказывать о нашей работе по возрождению и улучшению DPED (Deep Photo Enhancement Dataset). Это открытый проект исследователей из ETH Zurich, который включает датасет парных изображений и нейросетевую модель для повышения качества мобильных фотографий до уровня DSLR. В нашем случае мы хотим довести снимки с планшета YADRO KVADRA_T до качества полупрофессиональной камеры Sony Alpha ILCE 6600.

