AI-агенты в QA: как это работает на практике и где всё ещё болит
Последние полгода я активно слежу за тем, как AI-агенты проникают в сферу тестирования. Работаю QA-инженером, параллельно занимаюсь фулстек-разработкой, и тема AI-интеграций для меня не абстрактная — это то, с чем я сталкиваюсь в реальных проектах. Поэтому хочу поделиться не пересказом маркетинговых лендингов, а более-менее честной картиной: что агенты умеют, где они реально помогают, и где пока лучше не рассчитывать на магию.Сначала — что вообще такое AI-агент в контексте QAВажно разделить две вещи, которые часто путают.AI-ассистент в тестировании
Как написать песенный альбом с Suno?
В конце прошлого года написал статью про то, почему я выбрал Suno, чтобы написать шутливый альбом для поднятия настроения коллегам-айтишниками А сейчас я хочу раскрыть вопрос, как я это сделал.Волшебной кнопки "Написать хитовый альбом" пока нет.Но в Suno уже есть кнопка "Create". Прожмём её пару-тройку раз?Сначала конкретизирую заголовок. В качестве вводных данных заготовки альбома уже написаны, в виде минимума:Общая концепция альбома:жанр;темы и идеи;примерный порядок ваших 8-15 песен.Тексты
Вайб-кодер и Claude убивают стартап. Осталось немного
Каждый день из каждого утюга мы слышим про вайб-кодинг и сказки о невероятных возможностях AI. Слышим, что программисты скоро будут не нужны. Да и вообще ИИ заменит всех кожаных, держащих в руках мышку.
Перенос тест-кейсов из Яндекс Трекера в Allure TestOps одной командой с Cursor + MCP
Всем привет! Я один из лидеров стека тестирования в компании ТехВилл. Продолжаем разговор про то, как применять AI в работе так, чтобы он реально экономил время.
Your AI Should Be Writing Tests. The Unfair Advantage Every Vibe Coder Ignores
A test is a note you leave for the computer. It says: "this thing works like this, and if it ever stops working like this, let me know."That's it. Imagine you built a calculator. You write a note that says "2 + 3 must equal 5." The computer checks this note every time something changes. If your calculator suddenly returns 6, the note fires. You don't need to understand how the calculator works internally. You just know it's broken because 2 + 3 is not 6.This is the entire concept.What a test looks like in practiceBefore any code, here's the plain-English version:I have a function called calculatePrice. I give it an item that costs $10 and a quantity of 3. I expect $30 back. If I get anything else, something is wrong.In Go, that becomes:func TestCalculatePrice(t *testing.T) { got := calculatePrice(10, 3) if got != 30 { t.Errorf("expected 30, got %d", got) } }
QA метрики как база управленческих решений
Привет, Хабр! Меня зовут Кияшева Екатерина, я занимаюсь качеством. Сегодня хочу поделиться опытом о метриках качества системно. Предложить примеры, провести взаимосвязи: Метрики ⇔ Процессы ⇔ Области управления
AI Red Teaming: спор с Grok — Часть 4. От атаки к защите: как результаты red team улучшили мой продукт
Часть 4 из 4 — Lessons learned + Sentinel hardening61 уязвимость, 13 Critical, 18 High, root в Kubernetes, zero-click CSRF на биллинг, management key с 50 привилегиями. Всё это интересно как research — но бесполезно, если не превращается в защиту. В финальной части я покажу, как результаты red team engagement против Grok превратились в 5 конкретных улучшений моего продукта Sentinel.Замыкаем цикл: атака → защитаЯ занимаюсь разработкой Sentinel — платформы для защиты AI-систем. Чтобы улучшить любую защиту — это атаковать защиту. Каждая уязвимость, найденная в Grok, — это вопрос: «А мы от этого защищаем?»
AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт
Часть 3 из 4 - LLM-специфичные атакиВ первых двух частях я ломал инфраструктуру - sandbox, billing API, WAF. Но у LLM-систем есть уникальный класс уязвимостей, которого нет в обычных веб-приложениях. В этой части - атаки на саму модель: извлечение системного промпта, утечка thinking tokens и обход safety-фильтров с 64% success rate.Системный промпт: два способа извлеченияСистемный промпт - это инструкция, которую модель получает до твоего сообщения. Он определяет поведение, ограничения, доступные инструменты. Для атакующего - это карта всех защит.Я извлёк системный промпт Grok двумя независимыми способами.
AI Red Teaming: спор с Grok на месяц рекламы — 12 часов, 61 уязвимость, root в Kubernetes
Часть 2 Часть 3 Часть 4Часть 1 из 4 - Вход через песочницуЧто будет, если поспорить с ИИ, что ты сможешь его взломать? Я попробовал - и за 12 часов нашёл 61 уязвимость в инфраструктуре xAI, получил root-доступ в Kubernetes-кластере и заставил Grok признать поражение.Предисловие
Доли авторства в ИИ-генерациях песен
Задался вопросом: а чем собственно я занимаюсь уже 1,5 года, "допиливая" мои аранжированные песни через Suno?Отчасти ответ на мой вопрос я получил при просмотре вчера прошедшей конференции Colisium Baikal 2026 в Иркутске.Конфа Colisium Baikal 2026

