Распознавание изображений локальными LLM
Читая HABR, наткнулся на статью про мышление больших моделей и их способности распознавания изображений. И у меня возникла идея небольшого теста одной имеющейся у меня модели LLM, которая умеет распозновать фото, а именно llama4:16x17b НО запущенной полностью локально. Весит эта модель 67 гигабайт, если интересно на чем она была запущена отвечу в комментариях.На написание статьи меня подвинул один из комментариев - "а как интересно нейросеть распознает разные типы животных"
Razer представила концепт наушников с камерами
Компания Razer презентовала Project Motoko — концепт накладных наушников, оснащённых двумя камерами. По мнению производителя игровой периферии, они могут стать альтернативой умным очкам с ИИ.
Предопределённые векторы для обучения нейросетей с экономией памяти
Одна из базовых функций систем машинного зрения состоит в классификации объектов. Для решения этой задачи традиционно применяются методы обучения с учителем (SL). Эти методы обеспечивают высокую точность, но при этом размер нейросетевой модели увеличивается с увеличением количества классов. Такая особенность ограничивает применимость SL в тех случаях, когда число классов слишком велико или заранее неизвестно.Эксперт отдела перспективных исследований компании «Криптонит» Никита Габдуллин предложил
Сила оттенков серого: компьютерное зрение с нуля
В обсуждениях компьютерного зрения обычно речь идёт об OpenCV или нейронных сетях глубокого обучения наподобие YOLO
Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V
Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.
Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото
Привет, Хабр!
HandReader и Znaki — лучшая архитектура и самый большой набор данных для распознавания русского дактиля
Всем привет! Ранее мы уже писали о нашем наборе данных Bukva — первом наборе данных для распознавания русского дактильного языка в изоляции, который содержит более 3 700 видеороликов, разделённых на 33 класса, каждый из которых соответствует одной букве русского алфавита.Эта статья посвящена распознаванию непрерывного дактильного языка. Мы расскажем о наших моделях, которые добиваются наилучших результатов на наборах данных непрерывного американского дактильного языка ChicagoFSWild и ChicagoFSWild+
Китайские компании отключили функции распознавания изображений в чат-ботах на время национального экзамена гаокао
Alibaba, Tencent, ByteDance и другие китайские компании отключили функции распознавания изображений в своих чат-ботах на базе искусственного интеллекта во время сдачи национального экзамена гаокао, который ежегодно проводят 7-8 июня. Таким образом местные компании и чиновники борются со списыванием.
Автоматизация без кода: как FastML справляется с документами за несколько кликов
Привет, Хабр!В этом посте хотим рассказать, как технология FastML (о самой разработке уже рассказывали здесь

