Исследование Стэнфордского университета выявило опасности обращения к чат-ботам с ИИ за личными советами
Учёные Стэнфордского университета предупредили об опасностях обращения к чат-ботам на базе искусственного интеллекта за личными советами. Они назвали «подхалимство» нейросетей широко распространённым поведение с серьёзными последствиями.
Учёные предупреждают: ИИ даёт вам плохие советы, чтобы вы чувствовали себя лучше
Согласно новому исследованию, посвящённому опасностям, связанным с тем, что ИИ говорит людям то, что они хотят услышать, чат-боты на базе искусственного интеллекта настолько склонны льстить своим пользователям и соглашаться с ними, что дают плохие советы, способные нанести ущерб отношениям и усугубить вредные модели поведения.В исследовании, опубликованном в четверг в журнале Science, были протестированы 11 ведущих систем ИИ, и было обнаружено, что все они в той или иной степени демонстрировали льстивое поведение, чрезмерно уступая пользователю и подтверждая его слова.
Защита агентных приложений по OWASP Agentic Top 10 и модели Trifecta
Все мы знаем, что агентные системы давно не просто "чат-боты 2.0". Это уже полноценные приложения, которые:планируютвыполняют сложные цепочки действийвызывают инструменты (API/FS/shell/browser)хранят и используют память (RAG/long-term)общаются с другими агентамиНо делают все эти действия со скрытыми "побочными эффектами"
OpenAI запустила ChatGPT Library для хранения личных файлов пользователей
OpenAI запускает новую функцию под названием Library («Библиотека») для ChatGPT, которая позволяет хранить личные файлы или изображения в облачном хранилище компании.
Google начала закрытое тестирование Gemini для macOS
Пока без агентов, но с амбициями: Gemini готовится переехать из браузера прямо в macOS. Похоже, эпоха «открой вкладку и молись на интернет» для пользователей Mac постепенно подходит к концу. Google начала закрытое тестирование нативного приложения Gemini для macOS, и это тот случай, когда даже ранний билд уже намекает на куда более интересное будущее, чем просто ещё один чат с ИИ.

