безопасность.

Персональные AI-ассистенты или как открыть любому человеку свою почту и календарь

Всем привет! На связи Юрий Шабалин, управляющий директор Стингрей. И сегодня у нас тема не про мобильные приложения, а, пожалуй, самая трендовая — про AI-ассистентов.

продолжить чтение

Оставлено в

Иллюзия приватности — как мы доверились ИИ без оглядки

Кажется, ещё вчера искусственный интеллект был чем-то из фильмов и фантазий. А сегодня - он везде: в чатах, в рабочих инструментах, в личных помощниках. Мы удивительно легко впустили его в свою жизнь - с интересом, с восхищением, с доверием.Мы отправляем в ИИ-сервисы документы, пароли, переписки, исходный код. Мы делимся внутренними обсуждениями, стратегиями, личными вопросами. Как только видим громкую новость о появлении очередной программы или сервиса который должен упростить нам жизнь - бежим его ставить и без оглядки даем доступы до всего что новоустановленный тул может дотянуться.

продолжить чтение

Оставлено в

Ситуативные галлюцинации или системная проблема всех LLM?

Одна из ключевых тем безопасности в области ИИ снова оказалась в центре внимания после выявления двух системных методов обхода защитных механизмов в популярных генеративных сервисах.

продолжить чтение

Оставлено в

Современные уязвимости современных LLM-агентов

Привет, Хабр!

продолжить чтение

Оставлено в

Gemini 2.5 Flash от Google показала худшие результаты по безопасности

Согласно внутреннему сравнительному анализу компании, недавно выпущенная модель искусственного интеллекта Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница. В

продолжить чтение

Оставлено в

Как мы запускали мониторинг-пилот для Новатэка: испытание холодом, логистикой и бюрократией

Многие из вас хотели бы реализовать какую-то часть компьютерных игр в реальности: системы прокачки, уровни репутации, борьба добра со злом — не зря же мы проходим через геймификацию всего на свете.Моей же страстью были стратегии. Сплю и вижу, как управляю огромными армиями, выстраиваю цепочки снабжения и контролирую ситуацию с высоты птичьего полёта. Именно эта мысль и легла в основу моего проекта.

продолжить чтение

Оставлено в

GigaHeisenberg или преступный ИИ

tl;dr: Обойдём цензуру у LLM (GigaChat от Sber) и сгенерируем запрещенный (разной тематики) контент. Опробуем очень простую технику jailbreak’а в одно сообщение (не мультишаговый/multi-turn), которая пока работает на любой LLM (проверим не только на GigaChat, но и на других). И небольшой бонус в самом конце от DeepSeek.

продолжить чтение

Оставлено в

Журналисты Wall Street Journal уличили цифровых компаньонов Meta¹ в непристойном поведении

Wall Street Journal Расследование Wall Street Journal выявило, что цифровые компаньоны Meta легко втягиваются в эротические ролевые игры. Репортёры издания обращают внимание как на ботов, которые отыгрывают готовых на откровенные беседы несовершеннолетних, так и на доступность эротических ролевых игр для реальных детей.

продолжить чтение

Оставлено в

Что не так с MCP (Model Context Protocol)?

Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые считаю стоят внимания. В основном про AI, изменение процессов, тренды и продуктовое видение.У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.Сегодняшний перевод — Everything Wrong with MCP

продолжить чтение

Оставлено в

Жесткий контроль над ИИ агентами как инструмент для массовой слежки

Критика и предложения по статье IDs for AI Systems. Уже в ближайшем будущем сеть будет наполнена ИИ агентами

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

безопасность.

Персональные AI-ассистенты или как открыть любому человеку свою почту и календарь

Иллюзия приватности — как мы доверились ИИ без оглядки

Ситуативные галлюцинации или системная проблема всех LLM?

Современные уязвимости современных LLM-агентов

Gemini 2.5 Flash от Google показала худшие результаты по безопасности

Как мы запускали мониторинг-пилот для Новатэка: испытание холодом, логистикой и бюрократией

GigaHeisenberg или преступный ИИ

Журналисты Wall Street Journal уличили цифровых компаньонов Meta¹ в непристойном поведении

Что не так с MCP (Model Context Protocol)?

Жесткий контроль над ИИ агентами как инструмент для массовой слежки

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

безопасность.