безопасность. - страница 7

Ситуативные галлюцинации или системная проблема всех LLM?

Одна из ключевых тем безопасности в области ИИ снова оказалась в центре внимания после выявления двух системных методов обхода защитных механизмов в популярных генеративных сервисах.

продолжить чтение

Современные уязвимости современных LLM-агентов

Привет, Хабр!

продолжить чтение

Gemini 2.5 Flash от Google показала худшие результаты по безопасности

Согласно внутреннему сравнительному анализу компании, недавно выпущенная модель искусственного интеллекта Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница. В 

продолжить чтение

Как мы запускали мониторинг-пилот для Новатэка: испытание холодом, логистикой и бюрократией

Многие из вас хотели бы реализовать какую-то часть компьютерных игр в реальности: системы прокачки, уровни репутации, борьба добра со злом — не зря же мы проходим через геймификацию всего на свете.Моей же страстью были стратегии. Сплю и вижу, как управляю огромными армиями, выстраиваю цепочки снабжения и контролирую ситуацию с высоты птичьего полёта. Именно эта мысль и легла в основу моего проекта.

продолжить чтение

GigaHeisenberg или преступный ИИ

tl;dr: Обойдём цензуру у LLM (GigaChat от Sber) и сгенерируем запрещенный (разной тематики) контент. Опробуем очень простую технику jailbreak’а в одно сообщение (не мультишаговый/multi-turn), которая пока работает на любой LLM (проверим не только на GigaChat, но и на других). И небольшой бонус в самом конце от DeepSeek.

продолжить чтение

Журналисты Wall Street Journal уличили цифровых компаньонов Meta¹ в непристойном поведении

Wall Street Journal Расследование Wall Street Journal выявило, что цифровые компаньоны Meta легко втягиваются в эротические ролевые игры. Репортёры издания обращают внимание как на ботов, которые отыгрывают готовых на откровенные беседы несовершеннолетних, так и на доступность эротических ролевых игр для реальных детей.

продолжить чтение

Что не так с MCP (Model Context Protocol)?

Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые считаю стоят внимания. В основном про AI, изменение процессов, тренды и продуктовое видение.У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.Сегодняшний перевод — Everything Wrong with MCP

продолжить чтение

Жесткий контроль над ИИ агентами как инструмент для массовой слежки

Критика и предложения по статье IDs for AI Systems. Уже в ближайшем будущем сеть будет наполнена ИИ агентами

продолжить чтение

«Взлом» Telegram-игры или минусы вайбкодинга

Сегодня вечером в одном популярном телеграм-канале увидел вот такой пост:Не указываю ссылок, чтобы не тыкать пальцемИгра была знакомой, классический Flappy Bird.

продолжить чтение

Character.AI представляет AvatarFX — будущее создания видео с помощью ИИ

Character.AI, ведущая платформа для общения и ролевых игр с персонажами, созданными искусственным интеллектом, во вторник представила свою будущую модель создания видео AvatarFX. Доступная в режиме закрытого бета-тестирования, модель анимирует персонажей платформы в различных стилях и голосах, от персонажей, похожих на людей, до 2D-мультфильмов о животных.

продолжить чтение

Rambler's Top100