Используем фотограмметрию для распознавания и геолокации объекта
В статье будет описан способ, как можно использовать фотограмметрию для определения координат подвижных и статичных объектов с летательных аппаратов. Практическое применение данного метода пока что затруднено по причинам, которые будут указаны ниже.Задача: В системе координат, для которой известны GPS координаты (обозначена на рисунке красным цветом) определить расстояние и вектор направления для объекта, обозначенным на рисунке желтым крестиком. Затем, соответственно определить GPS координаты этого объекта.
Как ускорить распознавание объектов нейросетями среди множества классов, не жертвуя памятью и точностью
Эксперты российской ИТ-компании «Криптонит» Никита Габдуллин и Илья Андросов разработали принципиально новый метод организации скрытого пространства нейросетей. В ряде сценариев он позволяет снизить требования к памяти GPU и существенно ускорить классификацию объектов нейронными сетями. Вместо того, чтобы мириться с ростом вычислительных затрат и требований к памяти по мере увеличения числа классов, авторы призывают отказаться от классификационного слоя и случайного распределения классов в скрытом пространстве нейросети.Ограничения классификаторов на примере компьютерного зрения
Дипфейки бьют по кошелькам: Smart Engines представила «Шерлока 3о» против мошенничества со сгенерированными документами
Smart Engines представила первое комплексное решение для выявления дипфейков документов — «Шерлок 3о». Система детектирует поддельные изображения, созданные с помощью современных генеративных моделей, включая NanoBanana, ChatGPT, Grok, Qwen, Midjourney, Stable Diffusion, Flux и еще 20 других. Технология ориентирована на компании, которые обязаны проводить идентификацию клиентов и противодействовать мошенничеству в соответствии с регуляторными требованиями. Обновленное решение проверяет документы на подлинность по 600 признакам и используется в банках и МФО — организациях, наиболее подверженных подобным атакам.
Распознавание изображений локальными LLM
Читая HABR, наткнулся на статью про мышление больших моделей и их способности распознавания изображений. И у меня возникла идея небольшого теста одной имеющейся у меня модели LLM, которая умеет распозновать фото, а именно llama4:16x17b НО запущенной полностью локально. Весит эта модель 67 гигабайт, если интересно на чем она была запущена отвечу в комментариях.На написание статьи меня подвинул один из комментариев - "а как интересно нейросеть распознает разные типы животных"
Razer представила концепт наушников с камерами
Компания Razer презентовала Project Motoko — концепт накладных наушников, оснащённых двумя камерами. По мнению производителя игровой периферии, они могут стать альтернативой умным очкам с ИИ.
Предопределённые векторы для обучения нейросетей с экономией памяти
Одна из базовых функций систем машинного зрения состоит в классификации объектов. Для решения этой задачи традиционно применяются методы обучения с учителем (SL). Эти методы обеспечивают высокую точность, но при этом размер нейросетевой модели увеличивается с увеличением количества классов. Такая особенность ограничивает применимость SL в тех случаях, когда число классов слишком велико или заранее неизвестно.Эксперт отдела перспективных исследований компании «Криптонит» Никита Габдуллин предложил
Сила оттенков серого: компьютерное зрение с нуля
В обсуждениях компьютерного зрения обычно речь идёт об OpenCV или нейронных сетях глубокого обучения наподобие YOLO
Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V
Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.

