Предопределённые векторы для обучения нейросетей с экономией памяти
Одна из базовых функций систем машинного зрения состоит в классификации объектов. Для решения этой задачи традиционно применяются методы обучения с учителем (SL). Эти методы обеспечивают высокую точность, но при этом размер нейросетевой модели увеличивается с увеличением количества классов. Такая особенность ограничивает применимость SL в тех случаях, когда число классов слишком велико или заранее неизвестно.Эксперт отдела перспективных исследований компании «Криптонит» Никита Габдуллин предложил
Пять лет спустя: почему мы всё переписали с нуля
Как мы наступили на те же граблиПять лет назад на Хабре мы писали о Web Camera Pro
SmileFace. Когда нейросеть улыбается тебе в ответ
Исходники открыты на GitHub: github.com/konstantinkozhin/SmileFaceОт идеи до смеха в коридореКо Дню программиста в университете нужно было сделать интерактивный стенд — что-то весёлое, но с технологическим смыслом. Квиз или чат-бот казались скучными, хотелось чего-то с человеческим лицом — буквально.Я вспомнил о библиотеках, которые умеют распознавать эмоции по видео, и подумал: а что, если превратить это в игру?Так появилась идея SmileFace
Как я распознавание лиц к Yandex Disk-у прикручивал
"Крошка сын к отцу пришел и спросила кроха..."Ну не сын на самом деле, а дочка, но пришла и спросила: "Паааап, у подруги тут ДР, вытащи мне из фотоархива все фото где мы с ней вместе". Да легко!Но тут выяснилось, что и не так то легко. Дело в том, что еще в 22-ом году, по понятным причинам, я перенес фотоархив с Google Photos, где распознавание лиц было уже тогда, на Яндекс Диск, где его нет до сих пор.
Как мы строили KidFolio — цифровую платформу для родителей и детских садов
Мы — Даврон Ихматуллаев и Михаил Назаров — выпускники онлайн-магистратуры «Науки о данных» Центра «Пуск» МФТИ. В рамках дипломной работы и студенческого стартап-проекта мы разработали KidFolio — цифровую платформу, которая автоматически отправляет родителям персонализированные фото- и видеоотчеты из детского сада, используя технологии компьютерного зрения (CV) и мультимодальных языковых моделей (VLM).В этой статье расскажем, как мы делали из идеи продукт:от гипотезы и интервью с воспитателями до запуска MVP в виде телеграм-бота;как дообучали модели распознавания лиц под детский домен;
Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением
"Распознать бы этого шакала"
ИИ открыл двери для массовой прослушки населения
Шпионаж (прослушка) и наблюдение (слежка) — это разные, но связанные вещи. Если нанять частного детектива для прослушки, то он может спрятать несколько жучков в доме, машине — и в итоге получит отчёт с записями разговоров объекта. Если же ему поручили работу по наблюдению, то содержание отчёта будет другим: куда ходил человек, с кем разговаривал, что покупал, что делал. До появления интернета установить за кем-то наблюдение было дорого и долго. Нужно было вручную следить за человеком, отмечая, куда он ходит, с кем разговаривает, что покупает, что делает и что читает. Но этот старый мир навсегда ушёл в прошлое. Теперь наши телефоны отслеживают местоположение, банковские карты регистрируют покупки, приложения отслеживают, с кем мы разговариваем и что читаем. Компьютеры собирают данные обо всех наших действиях, и по мере удешевления хранения и обработки эти данные всё чаще сохраняются и используются. То, что было индивидуальной работой, сейчас стало массовым. Слежка за людьми стала бизнес-моделью для интернет-компаний, и у нас нет разумного способа отказаться от неё.
Сложность биометрической идентификации монозиготных близнецов
Представьте зал суда. Прокурор с гордостью представляет неопровержимые, как ему кажется, доказательства: отпечаток пальца, запись с камеры наблюдения, ДНК-экспертизу. Всё сходится идеально, виновность очевидна. И тут адвокат, заявляет: «Ваши доказательства подходят и к его брату-близнецу». В зале повисает тишина, судья хмурится. Технологии, на разработку которых были потрачены миллионы, оказываются недостаточно надёжными.

