cnn.

Часть 3: Архитектура нейросети для распознавания голосовых команд

Дорогие читатели!Продолжаю серию статей о моём дипломном проекте «Голосовое управление Умным домом». В Части 1 я рассказал о концепции и видении проекта, в Части 2 — о проектировании пользовательского опыта. В этой части я подробно разберу архитектуру нейронной сети, которая лежит в основе системы распознавания голосовых команд.Это техническая часть серии, где я покажу код, объясню выбор архитектуры и расскажу о технических решениях, которые позволили достичь точности 94.55% на проверочной выборке.

продолжить чтение

Оставлено в

TAPe + ML: универсальная архитектура компьютерного зрения вместо патчей и «сырых» пикселей

Пять лет назад я начал работать с или в проекте Comexp Research Lab - научно-исследовательской компании, в которой тогда было два человека (считая меня). На самом деле исследованиями компания в своей области занимается примерно 15 лет, просто именно на последние пять лет (и особенно на последние полтора года) пришлась самая интенсивность разработок и открытий.

продолжить чтение

Оставлено в

Аугментация данных для повышения точности классификации вредоносного ПО с использованием модели CNN

Актуальность исследованияСовременные компьютерные атаки становятся все более сложными и изощренными, создавая серьезную угрозу информационной безопасности как для крупных организаций, так и для обычных пользователей устройств, подключенных к глобальной сети. Вредоносное программное обеспечение (ВПО) эволюционирует, используя сложные методы сокрытия и мутации кода, что затрудняет его выявление антивирусными программами и системами защиты.

продолжить чтение

Оставлено в

Как искать различия на изображениях в визуальном тестировании ПО с помощью ИИ

Ключевые выводыОбнаружение различий между двумя изображениями — важная задача в визуальной автоматизации тестирования, когда скриншот нужно сравнить с предыдущей версией или эталонным дизайном.Генеративный ИИ на базе мультимодальных языковых моделей отлично распознаёт и объясняет содержимое изображения, но способен выявлять различия лишь в тех аспектах, на которых он был явно обучен.Эта задача обычно решается с помощью сверточной нейронной сети (CNN), сравнивающей небольшие фрагменты изображений (область 9×9 пикселей) вместо отдельных пикселей.

продолжить чтение

Оставлено в

Визуальное тестирование с ИИ: сравнение скриншотов без ложных срабатываний

продолжить чтение

Оставлено в

ИИ в 3 фазы… снижение рисков, экономия времени и помощь человеку. Но …— нужно дать пользу уже на первом шаге

«В крупных компаниях ИИ не продается как технология. Он продается как снижение рисков, экономия времени и помощь человеку. Но чтобы его купили — нужно дать пользу уже на первом шаге. Вот как мы сделали это без бюджета, без команды и с одними только идеями»1. Введение: Не про ИИ. Про то, как заставить бизнес поверить в измененияПривет, Хабр!Меня зовут Алексей. Я руковожу направлением искусственного интеллекта в федеральном холдинге. Моя задача — не «внедрить нейросеть», а сделать так, чтобы люди перестали бояться изменений.Раньше сотрудникам требовалось 40–60 минут, чтобы создать документ выбраковки:

продолжить чтение

Оставлено в

Методы интерпретации на основе вмешательства в CV: RISE implementation

Привет, друзья! Добро пожаловать в новый туториал из серии практических материалов по explanable AI (интерпретируемости моделей). Он посвящен методу интерпретации на основе вмешательства — RISE. В этом материале разобрана теоретическая постановка метода, подчеркнуты красивые математические идеи и переходы, и, конечно, реализован код для практики. Приглашаю к чтению! Ноутбук к туториалу доступен на гитхаб. ВведениеМетоды интерпретации на основе вмешательства основаны на идее ответа на вопрос: на вопрос:

продолжить чтение

Оставлено в

Vision Transformers: всё, что вам нужно — это внимание

Vision Transformers: всё, что вам нужно — это вниманиеСтатья о революционной архитектуре, которая изменила подход к компьютерному зрениюАннотацияС появлением статьи "Attention Is All You Need" закончилось доминирование рекуррентных нейронных сетей (Recurrent Neural Network — RNN). Поскольку трансформеры показывают лучшие результаты на практике по сравнению с RNN, давайте разберёмся, что они собой представляют и как работают в области компьютерного зрения.Краткая история искусственного интеллекта: от истоков до наших дней

продолжить чтение

Оставлено в

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально.

продолжить чтение

Оставлено в

ZX Spectrum проходит тест Тьюринга: учим 8-битный процессор решать CAPTCHA

Или как я потратила выходные на доказательство временного парадокса: Z80 1976 года решает CAPTCHA 2010-х в 2025 годуВступлениеПредставьте: вы открываете сундук и находите пыльный ZX Spectrum. «В музей Яндекса», — думаете вы. А что если я скажу, что эта железка с 48 килобайтами памяти может с 95.5% точностью распознавать рукописные цифры и проходить те самые CAPTCHA-тесты «Я не робот» из 2010-х?Более того: технически она могла это делать с момента выпуска в 1982 году. <cut />Временной парадокс в трёх актах1976: Рождение героя

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

cnn.

Часть 3: Архитектура нейросети для распознавания голосовых команд

TAPe + ML: универсальная архитектура компьютерного зрения вместо патчей и «сырых» пикселей

Аугментация данных для повышения точности классификации вредоносного ПО с использованием модели CNN

Как искать различия на изображениях в визуальном тестировании ПО с помощью ИИ

Визуальное тестирование с ИИ: сравнение скриншотов без ложных срабатываний

ИИ в 3 фазы… снижение рисков, экономия времени и помощь человеку. Но …— нужно дать пользу уже на первом шаге

Методы интерпретации на основе вмешательства в CV: RISE implementation

Vision Transformers: всё, что вам нужно — это внимание

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

ZX Spectrum проходит тест Тьюринга: учим 8-битный процессор решать CAPTCHA

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

cnn.