Почему ваша LLM-платформа — следующая цель: аудит безопасности AI-сервиса изнутри
Disclaimer: Всё описанное — результат санкционированного аудита безопасности по договору. Уязвимости ответственно раскрыты, ключи ротированы, домены и IP изменены. Статья — для понимания, не для воспроизведения.Мы искали уязвимости в RAG-платформе с десятками тысяч пользователей — а нашли доступ ко всей инфраструктуре и API-ключам с бюджетом в сотни тысяч долларов. Две недели мы строили сложные цепочки: SSRF через LangChain, инъекции в промпты, HTTP smuggling, CVE в десериализации. Ни одна не дала результата. А потом мы сделали один curl к открытому порту — и получили все ключи за 5 минут.
Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад
16 апреля Anthropic выкатила Claude Opus 4.7. На self-reported бенчмарках - 12 побед из 14. SWE-bench Verified +6.8, MCP-Atlas +14.6, SWE-bench Pro +10.9. Цена та же, 25 за миллион токенов.Через 24 часа
В Google Translate появился тренажёр произношения с обратной связью на базе ИИ
В Google Translate появился встроенный тренажёр произношения с обратной связью на базе искусственного интеллекта. Тренажёр включается кнопкой Practice в мобильной версии приложения.
Зачем вашей LLM внешняя память: полный разбор RAG-системы от теории до продакшена
RAG для бизнеса и разработчиков: архитектура, Python-туториал, стоимость и кейсы Что такое RAG-система? Retrieval-Augmented Generation — «генерация, дополненная извлечением»: так называют архитектурный подход, при котором модель усиливает ответы, динамично дополняя внутренние знания актуальной информацией из внешних источников. В практическом смысле: RAG — это способ увеличить релевантность ответов языковой модели без хлопот с переобучением.
OpenWebUI: System Prompt vs Skills vs MCP Tools — разбираем на живом примере валидации URL
Автор: Александр Казанцев, руководитель отдела документации и контентаВ последних версиях OpenWebUI появились Skils, и я решил сразу же их «пристроить» в дело. Одной из задач их применения виделась валидация ссылок, которые чат-бот техподдержки отдает в своем ответе: модель должна отвечать на вопросы по документации, строить корректные ссылки на статьи и не выдумывать несуществующие эндпоинты и URL. AI-платформаГотовые серверы с LLM и инструментами для ИИ и машинного обучения. Узнать больше
Ещё раз о Docker
Часть 1. ВведениеВ данной статье хотел бы обобщить знания и опыт, которые накопились за время использования Docker.И так, без долгих предисловий, в путь по океану наполненному синими китами!Важно понять, контейнер - это НЕ виртуальная машина. Это лишь обёртка для одного процесса, который может порождать другие процессы. Он использует ядро и память той системы на которой запущен. Он "эфeмерен" и должен создаваться и уничтожаться без боязни и жалости. Контейнер занимает меньше места и ресурсов, чем виртуальная машина, но не может хранить состояния (по умолчанию) Где Docker поможет, а где нет.
Лисы, кролики и рынок труда IT и инженерии
Основная идея:Рынок труда аналогичен циклическому колебанию популяции лис и кроликов.
Казначейство внедрило ИИ для мониторинга строек нацпроектов
Федеральное казначейство внедрило сервисы ИИ для анализа рисков на объектах капитального строительства, которые возводятся за счёт федерального бюджета. Для аналитики используется отечественная платформа QMonitoring. Она помогает круглосуточно наблюдать за строительными объектами и анализировать видео с камер, установленных на площадках по всей стране.Система в режиме реального времени отслеживает:количество рабочих на объекте;выполняемые работы;чрезвычайные происшествия;эффективность использования спецтехники;объекты, которые попадают в зону риска.
OpenAI наносит ответный удар: хватит ли сил у GPT-5.5 потеснить Claude 4.7 и Gemini 3.1?
OpenAI снова выпустила модель. Сюрприз? Нет. Шестинедельный релизный конвейер работает как часы. GPT-5.4 вышел 5 марта, GPT-5.5 - 23 апреля. Внутри компании новинку ласково называли "Spud"
