Технический обзор моделей DeepSeek от V3 до V3.2
Три самые постоянные вещи в мире — оливье с мандаринами на Новый год, желание начать новую жизнь с понедельника и то, что если выходит статья Себастьяна Рашки, то я делаю ее качественный перевод на русский. Эта технически глубокая статья известного исследователя LLM о том, как эволюционировали флагманские модели с открытыми весами от DeepSeek и обзор DeepSeek V3.2.
Исповедь взломщика: я проник в мозг Nano Banana и заставил её выдать все тайны
Сегодня у меня был интересный разговор с двумя исследователями в области безопасности ИИ. Та встреча, после которой мозг буквально кипит от новых идей. Цитируя Льюиса Кэрролла, я «ещё до завтрака успел поверить в шесть невозможных вещей». Мне пришлось отложить статью, над которой я работал, и окунуться во взлом. Если вы хакер, вам знакомо это непреодолимое желание: сработает ли идея? Что я смогу узнать? Взлом - это стирание границ. Это исследование terra incognita на латентной карте искусственного разума.
OpenAI обучила модели «признаваться» в плохом поведении
OpenAI тестирует ещё один способ раскрыть сложные процессы, происходящие в больших языковых моделях. Исследователи компании экспериментируют с манипуляциями LLM, чтобы те объясняли, как выполнили задачу, и признавались в нежелательном поведении.
Cloudflare заблокировала 416 млрд запросов ИИ-ботов на парсинг за пять месяцев
Генеральный директор Cloudflare Мэтью Принс заявил, что компания заблокировала более 416 млрд запросов от ИИ-ботов с июля этого года. Такую работу провели в рамках инициативы «День независимости контента». Функция Cloudflare позволяет владельцам веб-сайтов блокировать ИИ-ботов по умолчанию, если их владелец не заплатит за доступ к контенту.
Как Claude научился файн-тюнить опенсорсные LLM
Claude получил возможность файн-тюнить языковые модели с помощью нового инструмента под названием Hugging Face Skills. Не просто писать скрипты для обучения, а реально отправлять задачи на облачные GPU, следить за прогрессом и пушить готовые модели на Hugging Face Hub. В этом туториале показано, как это работает и как использовать самому.Claude Code умеет использовать "скиллы" — упакованные инструкции, скрипты и доменные знания для выполнения специализированных задач. Скилл hf-llm-trainer

