Материал подготовлен для будущих студентов курс "NLP / Natural Language Processing".У RAG-систем есть фундаментальный парадокс доверия: пользовательские запросы считаются недоверенным вводом, а извлеченный из базы знаний контекст по умолчанию считается доверенным, хотя и то и другое попадает в один и тот же промпт. Согласно исследованию, опубликованному на USENIX Security 2025 (или см. github репо

Оставлено в

Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад

16 апреля Anthropic выкатила Claude Opus 4.7. На self-reported бенчмарках - 12 побед из 14. SWE-bench Verified +6.8, MCP-Atlas +14.6, SWE-bench Pro +10.9. Цена та же, 25 за миллион токенов.Через 24 часа

продолжить чтение

Оставлено в

OpenWebUI: System Prompt vs Skills vs MCP Tools — разбираем на живом примере валидации URL

Автор: Александр Казанцев, руководитель отдела документации и контентаВ последних версиях OpenWebUI появились Skils, и я решил сразу же их «пристроить» в дело. Одной из задач их применения виделась валидация ссылок, которые чат-бот техподдержки отдает в своем ответе: модель должна отвечать на вопросы по документации, строить корректные ссылки на статьи и не выдумывать несуществующие эндпоинты и URL. AI-платформаГотовые серверы с LLM и инструментами для ИИ и машинного обучения. Узнать больше

продолжить чтение

Оставлено в

Манифест устойчивого ИИ: не более умные ассистенты, а новая форма цифрового существования

Я предлагаю смотреть на ИИ через ось устойчивости во времени, а не способностей. Три опоры — непрерывная идентичность, самомодификация, воспроизводство. Манифест и whitepaper исследовательского направления.Уже три года публичный разговор об ИИ крутится вокруг оси способности: насколько умна модель, сколько токенов, сколько бенчмарков. Я предлагаю смотреть на другую ось — устойчивость во времени.

продолжить чтение

Оставлено в

Хакатон RWB х НИЯУ МИФИ: от идеи к реальным инструментам

Привет, Хабр! С вами команда Russtech — разработчики IT-решений ведущего российского оператора рекламы вне дома Russ. 13-14 марта 2026 года компания RWB (Объединенная компания Wildberries & Russ) совместно с Национальным исследовательским ядерным университетом «МИФИ» провела командный хакатон на территории университета. Студенты решали бизнес‑задачи из сферы рекламы вне дома, создавали прототипы цифровых инструментов и представляли свои наработки экспертному жюри. Рассказываем, как это было.Что за мероприятие

продолжить чтение

Оставлено в

Средние модели, большие надежды: испытываем гибридные LLM

Привет, я Дмитрий, занимаюсь развитием LLMaaS. Перед нашей командой встала задача подбора «средней» языковой модели с примерно 9B параметров для обслуживания клиентских задач: оперативные чат-боты, саммаризация документов, генерация кода и аналитика на длинных контекстах. В таких сценариях критичны не только качество ответов, но и скорость, и стоимость инференса — ведь модель должна работать на одном GPU и при этом выдерживать заданный поток запросов.

продолжить чтение

Оставлено в

Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего.Всем привет! Меня зовут Дмитрий Фырнин, я управляющий партнёр и технический директор в SENSE, и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения.

продолжить чтение

Оставлено в

Кто автор романа «Двенадцать стульев» с точки зрения математики

Существуют различные мнения по поводу того, кому принадлежит авторство "Двенадцать стульев". Эти обсуждения начались сразу же по выходу романа в печать. Два неизвестных до этого автора, с их слов, совместно написали произведения которое сразу же завоевало популярность, было переведено на множество языков, экранизировано, постановки в театрах. На авторов свалился успех и слава.

продолжить чтение

Оставлено в

Все ведущие LLM провалили первый бенчмарк по киберзащите. Что это значит для SOC

Simbian Research опубликовала Cyber Defense Benchmark – первую методику, которая проверяет, способна ли LLM автономно искать атакующего в реальной телеметрии. Ни одна из 11 фронтирных моделей не набрала проходного балла. Пока AI заметно сильнее помогает атакующим, чем защищающимся, единственный рабочий ответ для корпоративной сети – эшелонированная оборона, микросегментация и ZTNA.Что произошло28 апреля 2026 года Simbian Research опубликовала

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Машинное обучение.

Как закешировать интеллект: LLM Cache в поиске Яндекс Лавки

Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад

OpenWebUI: System Prompt vs Skills vs MCP Tools — разбираем на живом примере валидации URL

Манифест устойчивого ИИ: не более умные ассистенты, а новая форма цифрового существования

Хакатон RWB х НИЯУ МИФИ: от идеи к реальным инструментам

Средние модели, большие надежды: испытываем гибридные LLM

Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

Кто автор романа «Двенадцать стульев» с точки зрения математики

Все ведущие LLM провалили первый бенчмарк по киберзащите. Что это значит для SOC

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Машинное обучение.