безопасность. - страница 10

Персональные AI-ассистенты или как открыть любому человеку свою почту и календарь

Всем привет! На связи Юрий Шабалин, управляющий директор Стингрей. И сегодня у нас тема не про мобильные приложения, а, пожалуй, самая трендовая — про AI-ассистентов.

продолжить чтение

Иллюзия приватности — как мы доверились ИИ без оглядки

Кажется, ещё вчера искусственный интеллект был чем-то из фильмов и фантазий. А сегодня - он везде: в чатах, в рабочих инструментах, в личных помощниках. Мы удивительно легко впустили его в свою жизнь - с интересом, с восхищением, с доверием.Мы отправляем в ИИ-сервисы документы, пароли, переписки, исходный код. Мы делимся внутренними обсуждениями, стратегиями, личными вопросами. Как только видим громкую новость о появлении очередной программы или сервиса который должен упростить нам жизнь - бежим его ставить и без оглядки даем доступы до всего что новоустановленный тул может дотянуться. 

продолжить чтение

Ситуативные галлюцинации или системная проблема всех LLM?

Одна из ключевых тем безопасности в области ИИ снова оказалась в центре внимания после выявления двух системных методов обхода защитных механизмов в популярных генеративных сервисах.

продолжить чтение

Современные уязвимости современных LLM-агентов

Привет, Хабр!

продолжить чтение

Gemini 2.5 Flash от Google показала худшие результаты по безопасности

Согласно внутреннему сравнительному анализу компании, недавно выпущенная модель искусственного интеллекта Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница. В 

продолжить чтение

Как мы запускали мониторинг-пилот для Новатэка: испытание холодом, логистикой и бюрократией

Многие из вас хотели бы реализовать какую-то часть компьютерных игр в реальности: системы прокачки, уровни репутации, борьба добра со злом — не зря же мы проходим через геймификацию всего на свете.Моей же страстью были стратегии. Сплю и вижу, как управляю огромными армиями, выстраиваю цепочки снабжения и контролирую ситуацию с высоты птичьего полёта. Именно эта мысль и легла в основу моего проекта.

продолжить чтение

GigaHeisenberg или преступный ИИ

tl;dr: Обойдём цензуру у LLM (GigaChat от Sber) и сгенерируем запрещенный (разной тематики) контент. Опробуем очень простую технику jailbreak’а в одно сообщение (не мультишаговый/multi-turn), которая пока работает на любой LLM (проверим не только на GigaChat, но и на других). И небольшой бонус в самом конце от DeepSeek.

продолжить чтение

Журналисты Wall Street Journal уличили цифровых компаньонов Meta¹ в непристойном поведении

Wall Street Journal Расследование Wall Street Journal выявило, что цифровые компаньоны Meta легко втягиваются в эротические ролевые игры. Репортёры издания обращают внимание как на ботов, которые отыгрывают готовых на откровенные беседы несовершеннолетних, так и на доступность эротических ролевых игр для реальных детей.

продолжить чтение

Что не так с MCP (Model Context Protocol)?

Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые считаю стоят внимания. В основном про AI, изменение процессов, тренды и продуктовое видение.У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.Сегодняшний перевод — Everything Wrong with MCP

продолжить чтение

Жесткий контроль над ИИ агентами как инструмент для массовой слежки

Критика и предложения по статье IDs for AI Systems. Уже в ближайшем будущем сеть будет наполнена ИИ агентами

продолжить чтение