Palisade Research: ChatGPT o3 иногда отказывается подчиняться базовой инструкции по выключению
Недавнее исследование «опасных возможностей ИИ» от Palisade Research показывает, что некоторые модели искусственного интеллекта, включая o3 от OpenAI, могут игнорировать прямые команды выключения. OpenAI позиционирует O3 и o4-mini как «самые умные модели».
О ужас, это текст от LLM
Привет всем В этой статье я лишь немного выскажусь на тему комментаторов, а именно таких, что я назвал бы их «инквизиторов LLM». Кто это? Это такие люди, что находят жптшные статьи или другие и пишут под ними что‑то в стиле.«Дааа, опять этот LLM мусор» или «Как же надоели эти LLM статьи»
Как обойти детекторы текста, сгенерированного ИИ
Провел небольшой ресерч как быстро хакнуть детекторы плагиата / детекторы текста написанного ChatGPT/LLM. Если вкратце, то 100% рабочего варианта нет, существует масса различных сервисов, которые под собой использую нейросетки обученные классифицировать текст на степень его "человечности"Где проверять?Используем сервис GPTZero - https://app.gptzero.me/homeОн дает нам ключевой инструмент в борьбе против детекторов - подсветку наиболее опасных слов и предложений.
Глава Anthropic: ИИ галлюцинирует реже, чем люди, но неожиданнее
Дарио Амодеи, генеральный директор компании Anthropic, заявил, что современные ИИ-модели, вопреки расхожему мнению, врут и выдумывают факты реже, чем люди.
Писатели случайно оставляют промпты для ИИ в своих опубликованных книгах
Читатели романа Darkhollow Academy: Year Two от писательницы Лены Макдональд обнаружили в тексте промпт для искусственного интеллекта. «Я переписал отрывок в стиле Джей Бри, добавив больше напряжения, мрачных оттенков и сырой эмоциональной подоплёки под сверхъестественными элементами», — отчитался ИИ в третьей главе книги.
OpenAI обновляет модель искусственного интеллекта, на которой работает агент Operator
OpenAI обновляет модель искусственного интеллекта Operator, своего ИИ-агента, который может автономно просматривать веб-страницы и использовать определённое программное обеспечение на виртуальной машине в облаке для выполнения запросов пользователей.
Google представила SynthID Detector — «портал проверки» контента на водяной знак SynthID
На конференции Google I/O компания Google анонсировала
Есть ли у AMD перспективы в AI-ML-DL. Часть 2
Привет, Хабр! Это снова Ефим Головин, все еще старший MLOps-инженер в Selectel. В прошлой статье в попытках оценить перспективы AMD в ML мы внезапно погрузились в дебри документации NVIDIA. А теперь пора взглянуть на то, что происходит, собственно, у AMD. Забегая вперед, могу сказать, что во многом «красные» оперируют очень похожими терминами. Это вполне понятно и логично, поскольку и NVIDIA их не из воздуха взяли. Все это так или иначе корнями уходит в идеи, появившиеся и описанные задолго до появления терминов «CUDA», «SM», архитектуры Tesla и т. д.

