Машинное обучение. - страница 74

Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы

System prompt — это просьба. Guardrails — это принуждение.1. ВведениеКогда я впервые внедрял LLM в production-сервис, схема безопасности выглядела примерно так: написать хороший system prompt, поставить галочку «мы всё предусмотрели» и жить дальше. Жизнь не дала долго наслаждаться этим спокойствием — первый же тест показал, что пользователи довольно быстро находят способы заставить модель «забыть» всё, что мы написали в системном промпте.Проблема фундаментальная: system prompt — это инструкция, которую LLM старается выполнить, но не обязан

продолжить чтение

Yandex B2B Tech запустила Академию Yandex AI Studio

Подразделение «Яндекса» Yandex B2B Tech (разрабатывает решения для цифровой трансформации бизнеса) запустило Академию Yandex AI Studio

продолжить чтение

В команде OpenBSD решили переименовать поле в pfsync после ложного отчёта от ИИ об уязвимости в коде

Разработчик Тэо де Раадт (Theo de Raadt) из OpenBSD сообщил

продолжить чтение

Разработчик нашёл способ удалять метки SynthID с AI-изображений

Разработчик провёл реверс-инжинирингу системы SynthID для маркировки сгенерированных изображений и нашёл способ удалять водяные знаки. После этого система проверки принимает AI-картинки за оригинальные.

продолжить чтение

Инвесторы сомневаются в стратегии OpenAI на фоне роста Anthropic

По данным Financial Times, часть инвесторов выражает сомнение в оценке OpenAI на уровне около 852 млрд долларов, указывая на размытость стратегии компании.

продолжить чтение

Anthropic обсуждает мораль и религию для Claude с христианскими лидерами

продолжить чтение

Amazon покупает Globalstar для усиления спутниковой связи и конкуренции со Starlink

Компания Amazon объявила о покупке спутникового оператора Globalstar за примерно 11,6 млрд долларов.

продолжить чтение

AI-специалисты массово возвращаются из США в Китай

Китай фиксирует заметный разворот в глобальной гонке за талантами: ведущие ИИ-инженеры покидают Кремниевую долину и возвращаются в страну. За последний год речь идёт уже о десятках топ-исследователей из компаний вроде Google DeepMind и OpenAI.

продолжить чтение

Топ-10 нейросетей для генерации презентаций в 2026 году

Нейросети появляются на белый свет почти каждый день, и с сервисами на их основе происходит все аналогично. В одном месте вылезет новый чат, который позволяет общаться с персонажами из книг, в другом - какая-нибудь платформа для решения математических задач.Собственно, я уже рассказывал об инструментах для программирования, рерайта, саммари и генерации текста. Упоминал и презентации

продолжить чтение

Agent Cloud: платформа для внедрения ИИ-агентов от OpenAI и Cloudflare

OpenAI совместно с Cloudflare запустили Agent Cloud — платформу, которая позволяет бизнесу встраивать ИИ-агентов прямо в рабочие процессы.

продолжить чтение