cv.

Кэширование и трекинг. Как YOLO экономит время и нервы

Случалось мне работать с CV: запускаешь сорокаминутное видео, YOLO честно находит людей, машины, собак. На двадцатой минуте падает сеть или, что хуже, камера наблюдения выходит из строя. Перезапускаешь. Модель снова смотрит те же кадры,

продолжить чтение

Оставлено в

OCR всё прочитал, но ничего не понял: как мы научили систему разбирать транспортные накладные

Материал подготовлен для будущих студентов курса «Компьютерное зрение».Каждый день склады обрабатывают тысячи транспортных наклеек. FedEx, UPS, DHL, USPS, региональные перевозчики — у каждого свой макет, свои размеры шрифтов и расположение полей. На наклейке FedEx номер отслеживания может находиться наверху, а на наклейке DHL — посередине. Обратный адрес у одного перевозчика выровнен по левому краю, у другого — по центру.

продолжить чтение

Оставлено в

Как я выбираю моменты для Shorts: почему LLM + транскрипт почти всегда дают мусор

Это третья статья про мой "аниме завод" — систему, которая автоматически превращает длинные эпизоды в Shorts.Если хотите полный контекст, вот предыдущие части:

продолжить чтение

Оставлено в

Как мы автоматизировали модерацию карточек товаров с помощью Computer Vision в Wildberries

Привет! Я Дмитрий Колесников, Team Lead DS-команды «Платформа модерации» в Wildberries & Russ. В этой статье по мотивам моего доклада на HighLoad расскажу, как у нас получилось превратить сотни Computer Vision моделей в единый масштабируемый пайплайн, который ежедневно обрабатывает 15 млн карточек товаров (50+ млн изображений и 500K видео).Что еще будет в статье?Computer Vision‑архитектура системы модерации Wildberries: как мы унифицировали модели через TensorRT и DALI, перешли к шаблонной архитектуре «общий бэкбон - легкие головы» и построили ансамбль в Triton, чтобы снизить нагрузку и ускорить деплой.

продолжить чтение

Оставлено в

Data, ML, CV и NLP: как освоить актуальные для рынка специальности вместе с фундаментальной базой

Привет, это команда Яндекс Практикума. Сегодня поговорим про то, как погружаться в профессии DE, ML, CV, NLP так, чтобы с одной стороны, получить основательный теоретический фундамент, а с другой — освоить навыки, которых ждут работодатели. Очевидный спойлер: нужно прокачивать теоретическую базу и параллельно много практиковаться — про практику отдельно расскажем на примере учебного проекта в онлайн-магистратуре НИЯУ МИФИ в партнёрстве с Яндекс Практикумом

продолжить чтение

Оставлено в

Как уместить опыт в одностраничный PDF

И такое бываетЧто-то пошло не так

продолжить чтение

Оставлено в

MADrive: новый метод генерации сенсорных данных для автономного транспорта

Привет, Хабр! Меня зовут Виктор Юрченко, я руковожу командой симуляции сенсоров в автономном транспорте Яндекса. Основная задача, которая стоит перед нашей командой, — искать способы делать симуляции ближе к реальности в части сенсорных данных. И недавно сотрудники команды совместно с исследовательским отделом Яндекса разработали собственный метод для симуляции изображений в проездах — MADrive (Memory-Augmented Driving Scene Modeling).

продолжить чтение

Оставлено в

Как мы построили систему видеоаналитики на open source и довели её до продакшена

продолжить чтение

Оставлено в

Как ML помогает сортировать титановую губку

В МАИ прошёл кейс-чемпионат AI Challenge: Engineering. Студенческие команды, в том числе по направлениям подготовки ТОП ИТ, решали прикладные задачи от промышленных партнёров. Один из кейсов был посвящён автоматизации сортировки титановой губки на производственной линии. Оказывается чтобы получить титан, который широко применяется в авиастроении, нужно сперва хорошо прохлорировать титановую руду и, не вдаваясь в технические подробности, получить эту самую титановую губку. Кому интересно, можно кратко посмотреть тут.

продолжить чтение

Оставлено в

Как искусственный интеллект судит спортивные поединки

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

cv.

Кэширование и трекинг. Как YOLO экономит время и нервы

OCR всё прочитал, но ничего не понял: как мы научили систему разбирать транспортные накладные

Как я выбираю моменты для Shorts: почему LLM + транскрипт почти всегда дают мусор

Как мы автоматизировали модерацию карточек товаров с помощью Computer Vision в Wildberries

Data, ML, CV и NLP: как освоить актуальные для рынка специальности вместе с фундаментальной базой

Как уместить опыт в одностраничный PDF

MADrive: новый метод генерации сенсорных данных для автономного транспорта

Как мы построили систему видеоаналитики на open source и довели её до продакшена

Как ML помогает сортировать титановую губку

Как искусственный интеллект судит спортивные поединки

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

cv.