3 главных инсайта о «взломах» LLM из исследования StrongREJECT
Всем привет!Погружаюсь в новую для себя область AI Security, в связи с чем решил написать несколько обзоров на самые обсуждаемые исследования и статьи по этой теме. Сегодня поговорим про взлом LLM и неожиданные результаты исследования StrongREJECT.TLDR: Не все джейлбрейки одинаково полезныПолный текст доклада (25 стр.) с NeurIPS. Если лень читать обзор, можете пролистать комиксы от нанобананы. Большинство джейлбрейков - иллюзия!
Opera добавила в браузер Neon режим «минутного глубокого исследования»
Opera выпустила обновление браузера Neon на базе искусственного интеллекта под названием 1-minute Deep Research («1-минутное глубокое исследование»). Оно позиционируется как персональный ИИ-агент для выполнения некоторых задач от имени пользователя, в том числе по навигации, покупкам, заполнению форм и так далее.
Автоматизация обработки ТI-отчетов с помощью NER: как мы сэкономили время аналитиков
Меня зовут Виктор Пронин, я старший аналитик киберугроз в центре компетенций группы компаний «Гарда». Для Гарда Threat Intelligence Feeds мы формируем данные об угрозах на основе обезличенной телеметрии из наших инсталляций, а чтобы получить более полную картину, обращаемся в том числе к информации из открытых источников. В статье я расскажу об автоматизированной обработке публикаций по информационной безопасности. Кейс будет полезен аналитикам киберугроз и специалистам, интересующимся применением ML в ИБ.В целом публикации по информационной безопасности можно разделить на
Китай запретил ByteDance использовать чипы Nvidia
Китайские регуляторы запретили ByteDance, владельцу TikTok, использовать чипы Nvidia в новых дата-центрах, сообщает Reuters со ссылкой на внутренние источники.
Я пишу тексты с ИИ. Простите
Давайте поставим точку: я пишу тексты с ИИ.Как это выглядит?Во-первых, я пишу черновик текста. Руками и головой, как я писал сотни текстов до этого. Например, как я написал свою первую тетрадку в 1 классе про "Удивительные приключения суперниндзей", которую учитель потом читал всему классу на уроке труда. Моя первая гордость. Потом таких тетрадок было еще штук пятнадцать. Одноклассники просили продолжение.
Мексика установит самый мощный суперкомпьютер в Латинской Америке
Мексика представила планы по созданию самого мощного суперкомпьютера в Латинской Америке. По словам правительства, этот проект поможет стране извлечь выгоду из стремительно развивающихся возможностей искусственного интеллекта и экспоненциально расширить вычислительные мощности страны.
Официальный гайд по промптам от OpenAI для GPT-5.1 (перевод)
ВведениеGPT-5.1, наша новая флагманская модель, создана для баланса интеллекта и скорости в широком спектре агентных и кодовых задач, а также вводит новый режим «без рассуждений» для низкой задержки. Опираясь на сильные стороны GPT-5, GPT-5.1 лучше калибрует затраты рассуждений под сложность запроса: тратит гораздо меньше токенов на простые входы и эффективнее обрабатывает сложные. В дополнение к этому GPT-5.1 лучше управляется с точки зрения личности, тона и форматирования вывода.

