Насколько русскоязычные LLM устойчивы к промпт-инъекциям
Последние годы генеративные большие языковые модели (LLM), такие как ChatGPT и YandexGPT, стали неотъемлемой частью многих продуктов и сервисов. С ростом популярности этих моделей возникли и новые угрозы безопасности — одной из самых актуальных стали промпт-инъекции. Что это такое, и почему это важно?Что такое промпт-инъекция?Промпт-инъекция — это атака, при которой злоумышленник отправляет модели запрос, сформулированный так, чтобы заставить её нарушить встроенные правила безопасности или раскрыть конфиденциальную информацию.Например:Манипуляция инструкциями
Microsoft несколько месяцев боролась с критической уязвимостью в Copilot
Серьезная уязвимость в системе безопасности Microsoft 365 Copilot позволила злоумышленникам получить доступ к конфиденциальным данным компании с помощью специально составленного электронного письма — без каких-либо кликов или взаимодействия с пользователем. Уязвимость под названием «EchoLeak» была обнаружена компанией Aim Security, специализирующейся на кибербезопасности.
Лаборатория Безумного Ученого: Хроники Четырех Экспериментов повлиявших на представление об обеспечении безопасности ИИ
Дата: 11 мая 2025Жанр: Гонзо-журналистикаЗаписки исследователя, проникшего в тайные лаборатории создателей инструментов безопасности ИИДорогие читатели, то, что я собираюсь вам рассказать, звучит как научная фантастика, но это чистая правда. Последние полгода я провел, изучая работу четырех лабораторий, где современные ученые пытаются решить одну из самых сложных задач нашего времени: как заставить искусственный интеллект быть безопасным. Это история о том, как разные умы подходят к одной проблеме, и почему их решения настолько различны, что кажется, будто они работают в параллельных вселенных.
Топ российских мессенджеров для работы в команде. Чем заменить WhatsApp и Telegram
Вероятность блокировки Telegram и WhatsApp только становится только выше. 10 июня Госдума приняла закон о создании российского национального мессенджера. Обсуждение зарубежных мессенджеров идет давно. Роскомнадзор еще в декабре 2024 включил WhatsApp в реестр организаторов распространения информации. Да и сам WhatsApp с 1 июня 2025 прекратил работу на iOS ниже версии 15.1 или Android ниже 5.0.
«Билайн» будет прерывать звонки при получении кода от «Госуслуг» или банка
Оператор «Вымпелком» (бренд «Билайн») внедрил функцию автоматического прерывания звонка. Это происходит, если во время разговора абонент получает смс с кодом от «Госуслуг» или банковского приложения. Об этом сообщил Forbes со ссылкой на гендиректора компании Сергея Анохина.
Маскирование данных при работе с LLM: защита бизнеса от утечек и штрафов по 152-ФЗ
ВведениеКорпоративный сектор всё активнее внедряет решения на базе больших языковых моделей (LLM) — от генерации документов до поддержки пользователей и автоматизации внутренней аналитики. Однако вместе с ростом эффективности растут и риски, особенно когда речь идёт о передаче персональных данных. Для российских компаний эти риски связаны не только с киберугрозами, но и с прямыми нарушениями Федерального закона №152-ФЗ «О персональных данных». Одним из ключевых способов защиты информации в таких сценариях становится маскирование данных
Security Week 2524: кража данных из Salesforce с помощью голосового фишинга
Команда Google Threat Intelligence на прошлой неделе опубликовала отчет о системных атаках на организации, целью которых является хищение данных из CRM-системы Salesforce. Важной особенностью атаки является использование так называемого vishing или голосового фишинга. Работает атака следующим образом: сотруднику компании звонят на мобильный телефон, представляются специалистом техподдержки и убеждают ввести в интерфейсе Salesforce код для авторизации стороннего приложения. Приложение, доступ к которому открывает сотрудник компании, является модифицированной версией официальной утилиты Salesforce Data Loader, обеспечивающей возможность автоматизированной выгрузки информации. Данная тактика привела к целой серии успешных взломов с последующей кражей данных компаний.

