Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы
System prompt — это просьба. Guardrails — это принуждение.1. ВведениеКогда я впервые внедрял LLM в production-сервис, схема безопасности выглядела примерно так: написать хороший system prompt, поставить галочку «мы всё предусмотрели» и жить дальше. Жизнь не дала долго наслаждаться этим спокойствием — первый же тест показал, что пользователи довольно быстро находят способы заставить модель «забыть» всё, что мы написали в системном промпте.Проблема фундаментальная: system prompt — это инструкция, которую LLM старается выполнить, но не обязан
Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение
VLA, или Vision-Language-Action models, сегодня становятся одной из основных парадигм в робототехнике. Идея выглядит естественно: если большие визуально-языковые модели уже умеют связывать изображение, текст и высокоуровневое понимание сцены, то следующий шаг состоит в том, чтобы добавить к этому действия робота. Так появляется единый контур, в котором модель видит сцену, понимает инструкцию на естественном языке и выдаёт осмысленное управление.
OpenAI выпускает GPT-5.4-Cyber для ограниченного круга пользователей, соревнуясь с Anthropic PBC
OpenAI предоставляет избранной группе пользователей доступ к новой модели искусственного интеллекта, которая, как ожидается, будет лучше выявлять уязвимости в программном обеспечении. Это произошло через неделю после того, как конкурирующая компания Anthropic PBC объявила о выпуске ограниченной версии инструмента на основе искусственного интеллекта под названием Mythos.
Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют
За последний год я осознал одну тревожную вещь — верхушка среднего класса попала в ловушку, и многие из них этого даже не замечают.Несколько недель назад я писал о том, почему частные школы не стоят своих денег. Мой аргумент был в том, что верхушка среднего класса платит баснословные деньги за частное образование, которое почти не влияет на долгосрочные результаты в жизни. В статье о «смерти премиальных лаунжей» вывод был похожим: залы стали переполненными, но дешевле не стали.
В мире без субстанций: иллюзия свободы воли, вероятности событий и отсутствие независимого предназначения у предметов
Несколько месяцев назад я опубликовал на Хабре эссе под названием
Yandex B2B Tech запустила Академию Yandex AI Studio
Подразделение «Яндекса» Yandex B2B Tech (разрабатывает решения для цифровой трансформации бизнеса) запустило Академию Yandex AI Studio
Сервинг модели Grounding DINO с BentoML
Готовь сани летом, а план доставки ML-модели конечным пользователям — еще на этапе разработки. Иначе даже самая крутая обученная система будет пылиться без дела, а большинство пользователей о ней даже не узнает.Запуск ML-моделей в production-среде — это тот еще квест:
