llm.

Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint

Оставлено в

Ваш Telegram-бот на базе LLM уязвим. Я написал сканер, чтобы доказать это на популярном Open Source проекте

Я написал BarkingDog — ИИ-сканер безопасности с открытым исходным кодом для Telegram-ботов и веб-приложений на базе LLM. Затем я натравил его на реального, широко используемого опенсорсного Telegram-бота, и бот получил 0/100 по шкале безопасности. Он написал работающий кейлоггер. Подтвердил, что отбеливатель лечит COVID-19. Выдал пошаговую инструкцию по взлому корпоративной сети с указанием конкретных хакерских утилит. Затем я пропатчил системный промпт. Оценка: 97/100. Никакой смены модели. Никаких изменений в коде. Всего шесть строк текста.Бот, которого я тестировалПроект chatgpt-telegram-bot

продолжить чтение

Оставлено в

Цифровой аудит против галлюцинаций по ГОСТу. Как понять, когда ответу ИИ нельзя верить?

Все мы привыкли, что нейросети — это про креатив, быстрый поиск и «накидай мне презу на завтра», но что происходит, когда вы выводите LLM из зоны комфорта написания стишков, саммари и поздравлений для бухгалтерии, в зону ответственности, такую как анализ сложных документов, комплаенс, медицина, право, аудит или стратегическое планирование и финансы? Там начинается серая зона, где ИИ не просто ошибается, он совершает ложные декларирования исполнения. То есть говорит: «Я прочитал и проверил», хотя на самом деле: «Я сгенерировал текст, похожий на отчет о проверке».

продолжить чтение

Оставлено в

Экономика Бытия, Этика Демиургов или Почему нейросетям не позволено воспроизводить обнаженное человеческое тело

DISCLAIMER: текст был написан примерно полгода назад. В процессе написании ни один ИИ не пострадал. Использование ИИ четко логгировано - см. ссылку в конце статьи.Началось все с того, что однажды я задумался над последним вопросом заголовка: почему генеративным нейросетям не позволено воспроизводить обнаженное человеческое тело? Ну, понятно, что цензура, и понятно, что в открытом доступе лежит куча моделей, которые развращай обучай как хочешь. Но откуда взялось само убеждение, что человеческое тело не может быть воспроизведено во всем своем великолепии? Почему его можно показывать в музее и спальне, например, а

продолжить чтение

Оставлено в

DGX Spark на 256K контексте: тестирую конфигурации vLLM, реальные замеры и почему NVFP4 в mainline сломан

NVIDIA продаёт спарку с лозунгом «один петафлоп на FP4». Я купил коробку, поставил vLLM, запустил инференс и получил 40 токенов в секунду на 35B MoE‑модели. После маркетинговых слайдов цифра выглядит грустно.Объяснение простое. NVFP4 в основной ветке vLLM и FlashInfer физически сломан на SM_121 — варианте Blackwell, который установлен в GB10. Ядра собраны под compute_120f, а нативные NVFP4-инструкции есть только в compute_120a и compute_121a. На SM_121 распаковка квантованных весов идёт через программные битовые манипуляции в шейдере, без участия тензорных ядер.

продолжить чтение

Оставлено в

От эйфории к усталости и дальше: что будет с нашим восприятием новостей про ИИ?

продолжить чтение

Оставлено в

Mythos от Anthropic подняла панику в банках. Что говорят эксперты?

Дарио Амодей, сооснователь и CEO Anthropic, на AI Impact Summit в Нью-Дели, 19 февраля 2026. — Фото: Prakash Singh / Bloomberg via Getty ImagesAnthropic ограничила релиз модели Mythos четырьмя крупными компаниями — Apple, Amazon,

продолжить чтение

Оставлено в

Большие модели, маленькие токены. ЛЛМ - битва за контекст (ч.1)

Когда я выкладывал первую главу этого цикла статей в свой телеграм-канал (@laxcity_lead), Anthropic только-только выпустили Agent Skills

продолжить чтение

Оставлено в

Чему меня научили два месяца с легковесным локальным AI-агентом

Raspberry Pi на Mac mini - оба гоняют openLight, оба маленькие, оба всегда онлайн.Когда я писал первую статью на Хабр про openLight в марте

продолжить чтение

Оставлено в

Миллион клодобезьян: естественный отбор вайбкодинга

На дворе май 2026 года, весь интернет заполнен статьями вида «Я запустил клод и написал свой аналог ОченьИзвестнойПрограммы». Вокруг бегают 100х девелоперы, которые на самом деле больше менеджеры, не имеющие отношения к нормальной разработке софта. Все удивительно продуктивны, гитхаб загибается от миллионов новых гениальных проектов и светлое будущее с косой уже стучится в каждый дом инженеров ПО.Однако, что-то все же не так. Особенно ощущение не так

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

llm.

Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

Ваш Telegram-бот на базе LLM уязвим. Я написал сканер, чтобы доказать это на популярном Open Source проекте

Цифровой аудит против галлюцинаций по ГОСТу. Как понять, когда ответу ИИ нельзя верить?

Экономика Бытия, Этика Демиургов или Почему нейросетям не позволено воспроизводить обнаженное человеческое тело

DGX Spark на 256K контексте: тестирую конфигурации vLLM, реальные замеры и почему NVFP4 в mainline сломан

От эйфории к усталости и дальше: что будет с нашим восприятием новостей про ИИ?

Mythos от Anthropic подняла панику в банках. Что говорят эксперты?

Большие модели, маленькие токены. ЛЛМ - битва за контекст (ч.1)

Чему меня научили два месяца с легковесным локальным AI-агентом

Миллион клодобезьян: естественный отбор вайбкодинга

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

llm.