AI Red Teaming: спор с Grok — Часть 4. От атаки к защите: как результаты red team улучшили мой продукт

Часть 4 из 4 — Lessons learned + Sentinel hardening61 уязвимость, 13 Critical, 18 High, root в Kubernetes, zero-click CSRF на биллинг, management key с 50 привилегиями. Всё это интересно как research — но бесполезно, если не превращается в защиту. В финальной части я покажу, как результаты red team engagement против Grok превратились в 5 конкретных улучшений моего продукта Sentinel.Замыкаем цикл: атака → защитаЯ занимаюсь разработкой Sentinel — платформы для защиты AI-систем. Чтобы улучшить любую защиту — это атаковать защиту. Каждая уязвимость, найденная в Grok, — это вопрос: «А мы от этого защищаем?»

продолжить чтение

Оставлено в

AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

Часть 3 из 4 - LLM-специфичные атакиВ первых двух частях я ломал инфраструктуру - sandbox, billing API, WAF. Но у LLM-систем есть уникальный класс уязвимостей, которого нет в обычных веб-приложениях. В этой части - атаки на саму модель: извлечение системного промпта, утечка thinking tokens и обход safety-фильтров с 64% success rate.Системный промпт: два способа извлеченияСистемный промпт - это инструкция, которую модель получает до твоего сообщения. Он определяет поведение, ограничения, доступные инструменты. Для атакующего - это карта всех защит.Я извлёк системный промпт Grok двумя независимыми способами.

продолжить чтение

Оставлено в

AI Red Teaming: спор с Grok на месяц рекламы — 12 часов, 61 уязвимость, root в Kubernetes

Часть 2 Часть 3 Часть 4Часть 1 из 4 - Вход через песочницуЧто будет, если поспорить с ИИ, что ты сможешь его взломать? Я попробовал - и за 12 часов нашёл 61 уязвимость в инфраструктуре xAI, получил root-доступ в Kubernetes-кластере и заставил Grok признать поражение.Предисловие

продолжить чтение

Оставлено в

Топ ошибок при генерации текстов и изображений с ИИ

продолжить чтение

Оставлено в

Мой первый open source проект с Cursor и Opus 4.6 — GenAI Prices Parser

Запустил свой первый open source проект. Задача простая, но полезная: автоматический сбор цен на LLM-модели всех основных провайдеров и загрузка в PostgreSQL для BI-аналитики.Что делает:— Каждый день скачивает актуальные цены из базы pydantic/genai-prices (29 провайдеров, 1100+ связок провайдеров и моделей)— Раскладывает в плоскую таблицу: провайдер, модель, контекстное окно, цена input/output за 1M токенов, кэширование, аудио— Загружает в PostgreSQL: текущий снимок + историческая витрина для отслеживания динамики цен

продолжить чтение

Оставлено в

Доли авторства в ИИ-генерациях песен

Задался вопросом: а чем собственно я занимаюсь уже 1,5 года, "допиливая" мои аранжированные песни через Suno?Отчасти ответ на мой вопрос я получил при просмотре вчера прошедшей конференции Colisium Baikal 2026 в Иркутске.Конфа Colisium Baikal 2026

продолжить чтение

Оставлено в

ИИ решает вашу судьбу: как баг в ATS оставляет людей без работы. HR Tech в России 2026

Всем привет! На связи снова Карьерный Хакер — тот самый консультант по поиску работы, который не ленится изучать технологии, амбассадор здравого смысла на рынке труда и в HR Tech :)Сегодня расскажу, как я поймала баги при AI-оценке релевантности опыта, когда тестировала самые популярные в России HR Tech-решения.Также обсудим, куда уходят ваши персональные данные при интеграции российских ATS с зарубежными AI и какие есть риски на уровне государства при «сливе» данных о кадровых резервах страны в Пентагон по мнению GPT (надеваем шапочки из фольги).

продолжить чтение

Оставлено в

Клиент заказал AI-бота. Но помог не он

Полгода назад ко мне пришёл владелец интернет-магазина электроники — 200-300 обращений в поддержку каждый день, четыре оператора, вечная текучка. Запрос конкретный: «Хотим AI-чатбота. Чтобы отвечал клиентам автоматически, давайте делать».Ну ок.Мы взяли выгрузку из их хелпдеска — 12 тысяч тикетов за последние два месяца. И первое, что мы сделали — прежде чем писать хоть строчку кода — просто сели и прочитали 500 случайных обращений. Глазами. Руками. Без всякого AI.Скучно? Да. Но именно это чтение потом определило весь ход проекта.500 тикетов глазами — что мы увидели

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

ai.

Открыта регистрация на МЛечный путь 2026 — конференцию об ИИ для бизнеса

AI Dev Day: как IT-компании внедряют нейросети в разработку и оценивают их эффект

AI Red Teaming: спор с Grok — Часть 4. От атаки к защите: как результаты red team улучшили мой продукт

AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

AI Red Teaming: спор с Grok на месяц рекламы — 12 часов, 61 уязвимость, root в Kubernetes

Топ ошибок при генерации текстов и изображений с ИИ

Мой первый open source проект с Cursor и Opus 4.6 — GenAI Prices Parser

Доли авторства в ИИ-генерациях песен

ИИ решает вашу судьбу: как баг в ATS оставляет людей без работы. HR Tech в России 2026

Клиент заказал AI-бота. Но помог не он

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

ai.