AI обнулил benchmark и пытался шантажировать инженера. И почему это решаемо
В прошлой главе я разобрал три провала чужих AI-агентов в проде - PocketOS, потерю production-базы Replit и сценарии GitHub Copilot, в которых агент действовал быстрее, чем человек успевал сказать стоп.Финал был честный: эти три - не про то, как делать правильно. Это места, где меня поймало бы, если бы я не прочитал разборы до того, как Lexis стал продуктом для людей.И я обещал в следующей главе перейти с уровня отдельные истории на уровень данных. Конкретно - две вещи.Первая: ProgramBench. Топ-модели, которые закрыли SWE-bench на 95%, на ProgramBench показывают 0% и 3%. Не упали на десять пунктов - обнулились.
В России запустили бесплатный сервис для проверки дипфейков
Компания «Архитех ИИ» представила KodikScan
Китайцы ответили на H200 — обзор Zhenwu M890 от Alibaba
20 мая на ежегодном Alibaba Cloud Summit T-Head полупроводниковое подразделение Alibaba представила новое поколение GPU — Zhenwu M890. Это ускоритель с 144 ГБ памяти HBM на борту и возможностью интерконнекта между устройствами до 800 ГБ/с. На основе этого устройства также была представлен суперсервер Panjiu AL128 — стойка из 128 ускорителей M890, объединенных собственным коммутатором ICN Switch 1.0.Предложение уже доступно китайским корпоративным клиентам и поддерживает Qwen, DeepSeek и Kimi. Но что там с характеристиками? Разбираемся под катом.Технические характеристики Zhenwu M890
Как мы подключили LLM к поддержке, а получили идеального лжеца
Где‑то в начале года мы решили: давайте автоматизируем часть поддержки через LLM. Ну, знаете, идея тогда казалась почти очевидной.
Облачная LLM на 16 ГБ VRAM — часть 2: LangGraph Server, LangSmith и SDK
Друзья, привет! Возвращаюсь с продолжением.
Как бизнесу оценить готовность к аттестации по новому Приказу ФСТЭК № 117
Привет, Хабр! На связи Алёна, аналитик по информационной безопасности в Selectel

