защита.

Мультимодальные модели оказались уязвимы к jailbreak-атакам через видео

Исследователи Dong Wang, Xiangyu He, Xinqi Lyu и Bin Xiao из Гонконгского политехнического университета показали, что современные мультимодальные системы могут быть уязвимы к атакам через видеоряд. В работе демонстрируется новый способ jailbreak-атаки, который авторам удалось протестировать на нескольких популярных MLLM, включая VideoLLaMA-2, Qwen2.5-VL, GPT-4.1 и Gemini-2.5. Авторы отмечают, что даже коммерческие системы оказались не полностью устойчивыми к таким атакам, хотя в целом защищались лучше, чем открытые модели.

продолжить чтение

Пси-словарь для айтишников v1.3: личные границы — право на «нет» в мире, где все хотят «да»

Вас о чём-то просят, вы не хотите, но говорите «да». Кто-то задел вас, вам больно, но вы молчите. Кто-то нарушил ваше пространство, вы злитесь, но не говорите об этом.Вопрос: Что происходит внутри?Ответ: Там, где не сработала граница, включается защита.В v1.2 мы разбирали Error Handling, и как психика маскирует боль постфактум. В этой статье расскажу о Firewall — о том, как можно не допускать нарушений вообще. В психологии это называется личными границами, а в наших терминах — Access Control List (ACL).

продолжить чтение

Пси‑словарь v1.2: Error Handling — как ваша психика маскирует «баги», чтобы не «упасть»

Представьте ситуации.Вас кто‑то расстроил, но вы не злитесь — вы «просто устали». Вам сделали больно, но вы не плачете — вы «анализируете ситуацию». Вы хотите одного, но делаете противоположное — и не понимаете почему.Вопрос: Кто принимает эти решения?Ответ: не вы. Вернее, не «вы» в том смысле, в котором привыкли думать.За вашим интерфейсом (Эго) работает система защиты. Она не спрашивает разрешения. Она не выводит логи в консоль. Она просто делает своё дело: маскирует боль, чтобы не дать системе «упасть».В психологии это называется

продолжить чтение

Дипфейки бьют по кошелькам: Smart Engines представила «Шерлока 3о» против мошенничества со сгенерированными документами

Smart Engines представила первое комплексное решение для выявления дипфейков документов — «Шерлок 3о». Система детектирует поддельные изображения, созданные с помощью современных генеративных моделей, включая NanoBanana, ChatGPT, Grok, Qwen, Midjourney, Stable Diffusion, Flux и еще 20 других. Технология ориентирована на компании, которые обязаны проводить идентификацию клиентов и противодействовать мошенничеству в соответствии с регуляторными требованиями. Обновленное решение проверяет документы на подлинность по 600 признакам и используется в банках и МФО — организациях, наиболее подверженных подобным атакам.

продолжить чтение

Часть 6: Безопасность и приватность в голосовом управлении — как защитить умный дом от утечек и взломов

От диплома до продакшена: Как я создавал архитектуру ИИ-проекта для…Автор: Алексей Бобрешов, руководитель отдела искусственного интеллекта в федеральном холдинге Категория: Искусственный интеллект, безопасность, умный дом, приватность *Это продолжение серии статей.Введение: Ошибки, которые я осознал (слишком поздно - нет, нет ничего слишком, есть цена ошибки)Когда я начинал работу над дипломным проектом «Умный дом» в 2020–2021 годах, моя голова была забита другими вопросами:Как добиться точности распознавания выше 90%?

продолжить чтение

Разработчик показал, как в Nginx можно просто защитить свой экземпляр Forgejo от веб-краулеров с ИИ

Разработчик Ян Эспозито представил

продолжить чтение

Meta* запустила инструменты защиты от мошенничества для WhatsApp и Messenger

Meta* представила новые инструменты защиты пользователей WhatsApp и Messenger от мошенничества.

продолжить чтение

MLSecOps: защита машинного обучения в эпоху киберугроз

На днях исследователь Цзянь Чжоу сообщил о критической уязвимости (CVE-2025-32434), затрагивающей все версии PyTorch до 2.5.1 включительно. Ошибка устраняется только обновлением версии до 2.6.0. Уязвимость соответствует критическому уровню риска, и позволяет злоумышленнику выполнить произвольный код на стороне жертвы без какого-либо взаимодействия с пользователем. Единственным условием является факт загрузки модели, созданной атакующим, даже при якобы безопасном параметре weights_only=True. Эта опция ранее считалась надежной, но, как выяснилось, не спасала от угроз.

продолжить чтение

Технологии на службе мира: Почему когнитариат должен объединиться против милитаризации

Чтение книги The Technological Republic за авторством генерального директора компании Palantir Technologies Алекса Карпа сподвигло меня на следующие размышления.

продолжить чтение