распознавание изображений.

Используем фотограмметрию для распознавания и геолокации объекта

В статье будет описан способ, как можно использовать фотограмметрию для определения координат подвижных и статичных объектов с летательных аппаратов. Практическое применение данного метода пока что затруднено по причинам, которые будут указаны ниже.Задача: В системе координат, для которой известны GPS координаты (обозначена на рисунке красным цветом) определить расстояние и вектор направления для объекта, обозначенным на рисунке желтым крестиком. Затем, соответственно определить GPS координаты этого объекта.

продолжить чтение

Оставлено в

Как ускорить распознавание объектов нейросетями среди множества классов, не жертвуя памятью и точностью

Эксперты российской ИТ-компании «Криптонит» Никита Габдуллин и Илья Андросов разработали принципиально новый метод организации скрытого пространства нейросетей. В ряде сценариев он позволяет снизить требования к памяти GPU и существенно ускорить классификацию объектов нейронными сетями. Вместо того, чтобы мириться с ростом вычислительных затрат и требований к памяти по мере увеличения числа классов, авторы призывают отказаться от классификационного слоя и случайного распределения классов в скрытом пространстве нейросети.Ограничения классификаторов на примере компьютерного зрения

продолжить чтение

Оставлено в

На Reddit показали автоматическую водяную турель с ИИ для отпугивания голубей

продолжить чтение

Оставлено в

Дипфейки бьют по кошелькам: Smart Engines представила «Шерлока 3о» против мошенничества со сгенерированными документами

Smart Engines представила первое комплексное решение для выявления дипфейков документов — «Шерлок 3о». Система детектирует поддельные изображения, созданные с помощью современных генеративных моделей, включая NanoBanana, ChatGPT, Grok, Qwen, Midjourney, Stable Diffusion, Flux и еще 20 других. Технология ориентирована на компании, которые обязаны проводить идентификацию клиентов и противодействовать мошенничеству в соответствии с регуляторными требованиями. Обновленное решение проверяет документы на подлинность по 600 признакам и используется в банках и МФО — организациях, наиболее подверженных подобным атакам.

продолжить чтение

Оставлено в

Распознавание изображений локальными LLM

Читая HABR, наткнулся на статью про мышление больших моделей и их способности распознавания изображений. И у меня возникла идея небольшого теста одной имеющейся у меня модели LLM, которая умеет распозновать фото, а именно llama4:16x17b НО запущенной полностью локально. Весит эта модель 67 гигабайт, если интересно на чем она была запущена отвечу в комментариях.На написание статьи меня подвинул один из комментариев - "а как интересно нейросеть распознает разные типы животных"

продолжить чтение

Оставлено в

Razer представила концепт наушников с камерами

Компания Razer презентовала Project Motoko — концепт накладных наушников, оснащённых двумя камерами. По мнению производителя игровой периферии, они могут стать альтернативой умным очкам с ИИ.

продолжить чтение

Оставлено в

Предопределённые векторы для обучения нейросетей с экономией памяти

Одна из базовых функций систем машинного зрения состоит в классификации объектов. Для решения этой задачи традиционно применяются методы обучения с учителем (SL). Эти методы обеспечивают высокую точность, но при этом размер нейросетевой модели увеличивается с увеличением количества классов. Такая особенность ограничивает применимость SL в тех случаях, когда число классов слишком велико или заранее неизвестно.Эксперт отдела перспективных исследований компании «Криптонит» Никита Габдуллин предложил

продолжить чтение

Оставлено в

Сила оттенков серого: компьютерное зрение с нуля

В обсуждениях компьютерного зрения обычно речь идёт об OpenCV или нейронных сетях глубокого обучения наподобие YOLO

продолжить чтение

Оставлено в

Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.

продолжить чтение

Оставлено в

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

распознавание изображений.

Используем фотограмметрию для распознавания и геолокации объекта

Как ускорить распознавание объектов нейросетями среди множества классов, не жертвуя памятью и точностью

На Reddit показали автоматическую водяную турель с ИИ для отпугивания голубей

Дипфейки бьют по кошелькам: Smart Engines представила «Шерлока 3о» против мошенничества со сгенерированными документами

Распознавание изображений локальными LLM

Razer представила концепт наушников с камерами

Предопределённые векторы для обучения нейросетей с экономией памяти

Сила оттенков серого: компьютерное зрение с нуля

Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

распознавание изображений.