Mistral Saba: региональная LLM, ориентированная на восточные языки
Компания Mistral AI представила Saba
Угроза безопасности: как злоумышленники могут манипулировать AI-агентами
Новое исследование показывает, что AI-агенты с доступом в Интернет уязвимы для простых тактик манипулирования. Злоумышленники могут обманом заставить эти системы раскрывать личную информацию, загружать вредоносные файлы и отправлять мошеннические электронные письма — и всё это без каких-либо специальных знаний в области AI или программирования.
Исследователи обнаружили, что больше не нужна тонна данных, чтобы обучить LLM выполнению логических задач
Согласно новому исследованию, проведенному исследователями Шанхайского университета Цзяо Тун, большие языковые модели (LLM) могут выполнять сложные задачи рассуждения, не полагаясь на большие наборы данных. Результаты исследования демонстрируют, что при использовании ограниченного количества тщательно отобранных образцов можно подготовить специалиста в области юриспруденции к выполнению задач, которые, как предполагалось, требуют огромного количества учебных материалов.
OpenAI пытается «не подвергать цензуре» ChatGPT
OpenAI изменяет подход к обучению моделей AI, чтобы открыто поддерживать «интеллектуальную свободу… независимо от того, насколько сложной или противоречивой может быть тема», — говорится в новой политике компании.
Исследователи обучают искусственный интеллект интерпретировать эмоции животных
Со временем искусственный интеллект может помочь нам понять, когда животные испытывают боль или проявляют другие эмоции — по крайней мере, так считают исследователи, о которых недавно писали в журнале Science.
ChatGPT, по мнению исследователей, прошёл тест Тьюринга в области психотерапии
Исследование показало, что людям сложно отличить терапевтические ответы ChatGPT от реплик живых психотерапевтов, причём ответы ИИ нередко воспринимаются как более эмпатичные.
Илон Маск показал скриншот, где Grok 3 оскорбляет издание The Information
Илон Маск сообщил, что компания xAI представит свою новую ИИ‑модель Grok 3 в прямом эфире в понедельник в 20:00 по тихоокеанскому времени (во вторник, 18 февраля, в 07:00 по мск). В посте на X
Результаты взлома Claude получены, и хакеры победили
Результаты джейлбрейка Claude от Anthropic уже готовы. После пяти дней напряженных исследований, в ходе которых было обработано более 300 000 сообщений и, по оценкам Anthropic, затрачено 3700 часов коллективных усилий, защита системы искусственного интеллекта наконец-то дала трещину.Исследователь Anthropic Ян Лейке поделился на X

