Отладка.

Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

TL;DRМы пытались запустить LLM inference на старой AMD RX580 (8 VRAM) через ROCm в Kubernetes. GPU корректно определялся, VRAM использовалась, но inference падал с ошибками вида:hipMemGetInfo(free, total) CUDA error: invalid argumentПосле серии экспериментов с ROCm userspace, Docker‑образами и Kubernetes deployment выяснилось, что проблема лежит на границе:kernel → ROCm runtime → ggml backendФинальное решение включало:переход на kernel 6.8стабилизацию ROCm runtimeиспользование llama.cpp + ROCmgrammar‑constrained decoding для strict sanity promptsВ итоге мы получили стабильный GPU inference:~42 токен/секgpu_busy_percent → до 100%

продолжить чтение

Microsoft восполнила пробел в устранении неполадок в Windows 11 и Server 2025

Microsoft предложила IT-администраторам, управляющим корпоративной инфраструктурой в масштабе предприятия, улучшение отладочного логирования в параметрах групповой политики (GPP). Оно позволило избавиться от давних пробелов в устранении неполадок.

продолжить чтение

Заглянуть под капот ИИ-агентов: новый инструмент раскрывает «магию» Claude Code

TL;DR: Появился открытый инструмент Coding Agent Explorer — обратный прокси-сервер, который в реальном времени показывает всё общение между вашим ИИ-агентом (пока только Claude Code) и API Anthropic. Вы видите системные промпты, последовательность вызовов инструментов, токены (включая кэш), мышление агента шаг за шагом. Запускается за пару минут, работает локально, ключи маскируются автоматически.

продолжить чтение

«Важно доставлять, а не понимать» — идеальный способ работы с нейросетями

«Важно доставлять, а не понимать» — звучит модно, а ломает всё по классике.Последние месяцы я вижу одну и ту же сцену.Кто-то начинает активно применять нейросети в разработке — и первые недели ощущение кайфовое: код появляется быстрее, задач закрывается больше, “как будто полетели”.А потом начинаются знакомые фразы:“стало больше багов, хотя писали быстрее”“вроде всё правильно, но не работает”“оно компилируется, значит норм”“главное — доставлять, а не понимать”Вот с последним тезисом я не согласен.

продолжить чтение

Навайбкодился и спит: дыры в социальной сети для ИИ Moltbook

Что такое Moltbook, и почему она привлекла наше внимание?

продолжить чтение

Пишем историю игрушки:  восстанавливаем исходный код игры «Поле Чудес» 1992 года для MS-DOS

«Вращайте барабан!»Летом мне попалась статья Вадима Башурова «История игрушки

продолжить чтение

«Отучаем» WinFXNet от жадности (часть 2 и заключительная)

Немного контекстаЭта заключительная часть данной серии (ссылка на первую часть) должна быть выйти раньше, но из-за многих факторов (об этом будет в конце статьи, если кому интересно) этого не произошло. Но звёзды сошлись и результаты экспериментов собраны здесь.В данной статье поясню, как я разбирался в работе файловой лицензии, как новая версия программы не поддалась мне с первого раза (поэтому в этот раз патч сделан по иной схеме, но лучше с моей точки зрения), а так же поговорим о экспериментах с живым HASP ключом.Disclaimer: Данная заметка написана в 

продолжить чтение

Claude Code снова удивляет — теперь уже в криптографии

Мы уже видели, как языковые модели решают задачки, над которыми профессора чесали головы годами. Видели, как они не решали задачу, а просто находили ответ, потому что знали, где копать (и не ленились, в отличие от нас, смертных). А теперь Claude Code от Anthropic залез в криптографию и починил реализацию постквантового алгоритма.Инженер писал на Go реализацию ML-DSA, всё шло по плану, пока проверки не начали сыпаться с “invalid signature”.

продолжить чтение

Observability vs Monitoring: за что вы платите?

Помню, как на собеседовании в одну крупную компанию мне задали вопрос: "Чем отличается observability от monitoring?" Я уверенно ответил что-то про "три столпа" и "unknown unknowns". Интервьюер кивнул, но потом спросил: "А зачем платить $100k в год за Datadog, если можно поставить бесплатный Prometheus?"

продолжить чтение

Telegram-бот для дополнения базы знаний: автоматизация без разработчиков

Чтоб сделать, чтобы базой знаний реально пользовались? Один из путей — дать возможность и наполнения, и получения ответов в привычном интерфейсе, без захода в дополнительные приложения.

продолжить чтение

12
Rambler's Top100