Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад
16 апреля Anthropic выкатила Claude Opus 4.7. На self-reported бенчмарках - 12 побед из 14. SWE-bench Verified +6.8, MCP-Atlas +14.6, SWE-bench Pro +10.9. Цена та же, 25 за миллион токенов.Через 24 часа
OpenWebUI: System Prompt vs Skills vs MCP Tools — разбираем на живом примере валидации URL
Автор: Александр Казанцев, руководитель отдела документации и контентаВ последних версиях OpenWebUI появились Skils, и я решил сразу же их «пристроить» в дело. Одной из задач их применения виделась валидация ссылок, которые чат-бот техподдержки отдает в своем ответе: модель должна отвечать на вопросы по документации, строить корректные ссылки на статьи и не выдумывать несуществующие эндпоинты и URL. AI-платформаГотовые серверы с LLM и инструментами для ИИ и машинного обучения. Узнать больше
Манифест устойчивого ИИ: не более умные ассистенты, а новая форма цифрового существования
Я предлагаю смотреть на ИИ через ось устойчивости во времени, а не способностей. Три опоры — непрерывная идентичность, самомодификация, воспроизводство. Манифест и whitepaper исследовательского направления.Уже три года публичный разговор об ИИ крутится вокруг оси способности: насколько умна модель, сколько токенов, сколько бенчмарков. Я предлагаю смотреть на другую ось — устойчивость во времени.
Хакатон RWB х НИЯУ МИФИ: от идеи к реальным инструментам
Привет, Хабр! С вами команда Russtech — разработчики IT-решений ведущего российского оператора рекламы вне дома Russ. 13-14 марта 2026 года компания RWB (Объединенная компания Wildberries & Russ) совместно с Национальным исследовательским ядерным университетом «МИФИ» провела командный хакатон на территории университета. Студенты решали бизнес‑задачи из сферы рекламы вне дома, создавали прототипы цифровых инструментов и представляли свои наработки экспертному жюри. Рассказываем, как это было.Что за мероприятие
Средние модели, большие надежды: испытываем гибридные LLM
Привет, я Дмитрий, занимаюсь развитием LLMaaS. Перед нашей командой встала задача подбора «средней» языковой модели с примерно 9B параметров для обслуживания клиентских задач: оперативные чат-боты, саммаризация документов, генерация кода и аналитика на длинных контекстах. В таких сценариях критичны не только качество ответов, но и скорость, и стоимость инференса — ведь модель должна работать на одном GPU и при этом выдерживать заданный поток запросов.
Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению
Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего.Всем привет! Меня зовут Дмитрий Фырнин, я управляющий партнёр и технический директор в SENSE, и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения.
Кто автор романа «Двенадцать стульев» с точки зрения математики
Существуют различные мнения по поводу того, кому принадлежит авторство "Двенадцать стульев". Эти обсуждения начались сразу же по выходу романа в печать. Два неизвестных до этого автора, с их слов, совместно написали произведения которое сразу же завоевало популярность, было переведено на множество языков, экранизировано, постановки в театрах. На авторов свалился успех и слава.
Все ведущие LLM провалили первый бенчмарк по киберзащите. Что это значит для SOC
Simbian Research опубликовала Cyber Defense Benchmark – первую методику, которая проверяет, способна ли LLM автономно искать атакующего в реальной телеметрии. Ни одна из 11 фронтирных моделей не набрала проходного балла. Пока AI заметно сильнее помогает атакующим, чем защищающимся, единственный рабочий ответ для корпоративной сети – эшелонированная оборона, микросегментация и ZTNA.Что произошло28 апреля 2026 года Simbian Research опубликовала

