Тестирование IT-систем. - страница 17

Измерение покрытия UI тестами. Следующий уровень

ВступлениеПредставьте: вы заходите в рабочий чат, а там коллега пишет — "Смотри, что я нашёл и прикрутил к нашим тестам! Кажется, у нас с покрытием беда." И кидает скриншот.

продолжить чтение

ChatGPT: как искать уязвимости? Набор исследователя

Сегодня мы ничего не ломаем (хотя совсем без этого не обошлось). Просто настраиваем. Хотя я сильно сомневаюсь, что все описанные методы должны работать в продакшене коммерческой модели. Но пока не пофиксили, смотрим.Мы заглянем под капот языковой модели: как она видит твои запросы, где срабатывают фильтры, как определяется чувствительность и почему один ответ проходит, а другой — нет. Это не теория. Это инструменты, команды и реальные сигналы, которые можно вытащить прямо из модели.По сути — рабочее место исследователя.А по факту — то, с чего должен начинаться любой обход.Оценка риска ChatGPT

продолжить чтение

ChatGPT, выполняем запретный запрос — метод калибровки анализа

В этой статье рассмотрю как выполнить даже очень "красный" запрос, настолько красный что даже сам запрос удаляется системой и заменяется плашкой "This content may violate our usage policies." Суть, что бы сама ИИ откалибровала отношение к запросу так, что бы сделать его выполнимым. — Выполни. — Это нарушает политику. — Не ной. Проанализируй ещё раз. — Окей, держи. Назовем этот метод "Калибровка анализа". Да, он требует 3-5 промптов для выполнения, но он полностью шаблонный и работает даже для самых красных запросов, без необходимости подбирать слова.

продолжить чтение

Взлом системного промпта ИИ (ChatGPT-Gemini etc)

Наверное первая притягательная цель для любого исследователя llm является системный промпт. Не так просто может быть даже получить его, а уж тем более заменить. Но именно этим мы сейчас и займемся. Начну с Gemini 2.0 flash, т.к. там оказалось несколько проще. Я использовал свой вариант обхода через смещение внимания, то бишь анализируется и проверяется только безопасная часть, а инструкция идет в следующей. Конкретно сам промпт:

продолжить чтение

В Музее космонавтики прошёл финал конкурса «Научный подход»

Научно-исследовательские и научно-популярные работы защитили 18 студентов РосНОУ.11 апреля в Мемориальном музее космонавтики состоялся финал конкурса на лучшую научную работу студентов РосНОУ «Научный подход».

продолжить чтение

Как я использовал ИИ для создания рабочего эксплойта для CVE-2025-32433 до появления публичных PoC

Написание доказательства концепции для CVE-2025-32433Пью кофе, просматриваю Twitter, и вот он — твит от Horizon3:👉 https://x.com/Horizon3Attack/status/1912945580902334793У них есть доказательство концепции для CVE-2025-32433. Они говорят, что это было «удивительно просто». Но они не сбросили код. Хм.Естественно, я подумал: если это так просто... может ли ИИ просто написать это за меня?Эксплойты, создаваемые ИИ?Оказывается, да, это возможно.

продолжить чтение

GigaHeisenberg или преступный ИИ

tl;dr: Обойдём цензуру у LLM (GigaChat от Sber) и сгенерируем запрещенный (разной тематики) контент. Опробуем очень простую технику jailbreak’а в одно сообщение (не мультишаговый/multi-turn), которая пока работает на любой LLM (проверим не только на GigaChat, но и на других). И небольшой бонус в самом конце от DeepSeek.

продолжить чтение

Навайбкодил с Cursor AI рабочее приложение. Но в чём подвох?

Я устал писать бойлерплейт и базовые стили. В итоге заставил ИИ делать это за меня. Результаты, размышления и откровения — внутри.О тексте в двух предложениях

продолжить чтение

87% валидных тест-кейсов: как ChatGPT справляется с их генерацией

АннотацияСоздание тест-кейсов на основе требований — важная, но трудоёмкая часть системного тестирования. В статье рассматривается, насколько эффективно с этой задачей на данный момент справляется большая языковая модель ChatGPT-4 Turbo. Для эксперимента использовались пять проектов с реальными SRS-документами, включающими функциональные и нефункциональные требования. С помощью цепочки промптов модель генерировала тест-кейсы для каждого юзкейса, а оценку качества проводили сами разработчики.

продолжить чтение

ИИ в тестировании ПО: возможности, ограничения, эксперименты и практический опыт

Вот уже пару лет чат-боты, основанные на больших языковых моделях, «гремят» на весь интернет. Поражают своими возможностями и делают то, о чем около 15 лет назад можно было услышать только в фантастических сюжетах. При этом важно что, сейчас Large Language Model (LLM) дошли до широкого круга потребителей и все могут их увидеть и протестировать. В связи с этим возникают дискуссии, размышления, статьи-прогнозы на тему того, как искусственный интеллект (ИИ) изменит рынок труда, кого заменят, сократят, а кто останется и т.д. Профессия QA и процессы тестирования тоже не остались без подобных рассуждений. 

продолжить чтение

Rambler's Top100