взлом.

Как я за выходные научил ИИ материться по команде, а потом превратил его в кота

TL;DR. Взял самую маленькую «взрослую» современную модель (Qwen3.5-0.8B), арендовал GPU на выходные и поставил два высоконаучных эксперимента: (1) заставить вежливого ассистента выматериться по команде и (2) превратить его в кота. Получилось и то, и другое. По дороге узнал, что вся «личность» ответа часто висит на одном первом токене, что фильтром «плохих слов» от инъекций не закрыться, что safety открытых моделей снимается одним вектором без переобучения, и что читать надо сырой вывод, а не красивую цифру - потому что метрика наврала мне дважды за два дня. Всё на реальном коде, ~42 прогона. Маркетинга не будет, кота будет много.

продолжить чтение

Оставлено в
- взлом
- промпт-инъекции

Meta* признала и исправила проблему, из-за которой любой мог завладеть чужим аккаунтом в Instagram

Компания Meta* признала и исправила

продолжить чтение

Оставлено в

Мультимодальные модели оказались уязвимы к jailbreak-атакам через видео

Исследователи Dong Wang, Xiangyu He, Xinqi Lyu и Bin Xiao из Гонконгского политехнического университета показали, что современные мультимодальные системы могут быть уязвимы к атакам через видеоряд. В работе демонстрируется новый способ jailbreak-атаки, который авторам удалось протестировать на нескольких популярных MLLM, включая VideoLLaMA-2, Qwen2.5-VL, GPT-4.1 и Gemini-2.5. Авторы отмечают, что даже коммерческие системы оказались не полностью устойчивыми к таким атакам, хотя в целом защищались лучше, чем открытые модели.

продолжить чтение

Оставлено в

Атака на поставщика данных привела к утечке личных данных 197 тысяч клиентов Zara

Хакеры взломали системы поставщика технологических услуг испанской сети магазинов одежды Zara, что привело к утечке данных более чем 197 тыс. человек, сообщил проект Have I Been Pwned.

продолжить чтение

Оставлено в

(Не) безопасный дайджест: утечка у Booking.com, McKinsey против ИИ-агента и миллион «не туда»

продолжить чтение

Оставлено в

Платформу облачной разработки Vercel взломали

Платформа облачной разработки Vercel сообщила об инциденте безопасности после того, как злоумышленники взломали её системы и попытались продать украденные данные.

продолжить чтение

Оставлено в

Двойной удар: почему хакеры полюбили заводы и торговые сети

Для завода или сети магазинов кибератака — это остановка линии, неработающие кассы, сорванные поставки, конфликт с контрагентами и вопросы от регуляторов. Один удачный шифровальщик может одновременно ударить по производству, складам и фронту продаж — именно поэтому для промышленности и ритейла киберугрозы это не просто «технический риск» — это прямая угроза бизнесу.

продолжить чтение

Оставлено в

Эксперты выяснили: Claude разрешает опасные действия после 50 запросов

продолжить чтение

Оставлено в

Как ИИ помогает мошенникам ещё лучше обманывать людей

ВведениеИИ, как и любая технология, создаёт как возможности, так и угрозы. Пока учёные находят аномалии в огромном массиве астрономических данных и перебирают миллионы молекулярных комбинаций за несколько часов, мошенники получили доступ к инструментам, повышающим успешность их атак.В этой статье я подробно расскажу, как мошенники используют ИИ для генерации дипфейков, подделки документов, взлома паролей, фишинга, и какие правила кибербезопасности помогут подготовиться к потенциальным атакам.Фишинг и социальная инженерия

продолжить чтение

Оставлено в

Как Anthropic заставили ИИ взломать блокчейн-контракты на сумму 550 миллионов долларов

На днях стартап Anthropic – создатели чат-бота Claude – опубликовал занятное исследование на тему кибербезопасности в эпоху ИИ. Исследователи дали нескольким ИИ-моделям задачу, которую обычно решают живые аудиторы и хакеры: найти уязвимости в смарт-контрактах и попробовать их эксплуатировать (читать как "попробовать украсть сколько-нибуд�� денег"). Результаты, мягко говоря, не могут оставить равнодушным: совокупный баланс моделей после серии "грабежей" составил $550,1 млн. Но давайте разберемся, действительно ли все так страшно.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

взлом.

Как я за выходные научил ИИ материться по команде, а потом превратил его в кота

Meta* признала и исправила проблему, из-за которой любой мог завладеть чужим аккаунтом в Instagram

Мультимодальные модели оказались уязвимы к jailbreak-атакам через видео

Атака на поставщика данных привела к утечке личных данных 197 тысяч клиентов Zara

(Не) безопасный дайджест: утечка у Booking.com, McKinsey против ИИ-агента и миллион «не туда»

Платформу облачной разработки Vercel взломали

Двойной удар: почему хакеры полюбили заводы и торговые сети

Эксперты выяснили: Claude разрешает опасные действия после 50 запросов

Как ИИ помогает мошенникам ещё лучше обманывать людей

Как Anthropic заставили ИИ взломать блокчейн-контракты на сумму 550 миллионов долларов

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

взлом.