opensource.

Токен-оптимизация агентов: на что уходит контекстное окно MCP

Чем больше задач берёт на себя агент, тем чаще он упирается не в качество модели, а в контекстное окно: туда нужно уместить инструкции, историю диалога, схемы инструментов и всё, что эти инструменты возвращают. Я считаю, что токен-оптимизация агентов — то, как мы расходуем это окно — станет одним из ключевых направлений ближайших лет, наравне с выбором модели и качеством промпта.

продолжить чтение

Оставлено в

Трансформер в on-premise AppSec: как мы встроили ML-модель для классификации секретов в продукт без GPU

TLDR; Рассказываем, как мы интегрировали CodeBERT-based модель классификации секретов в production-продукт с жёсткими ограничениями по железу, сократив время инференса с 320 до 90 секунд и размер модели с ~600 до ~130 МБ — без дискретных ускорителей и тяжёлых зависимостей.

продолжить чтение

Оставлено в

От баз данных до инструментов для ИИ‑экосистем: проекты, которые получили гранты Yandex Open Source

продолжить чтение

Оставлено в

Ускоряем и оптимизируем numpy, pandas, scipy и sklearn

С момента публикации статьи на Хабре «Импортозамещаем numpy, pandas, scipy и sklearn» прошло почти три года. В течение этого времени я приостановил работу над проектом из-за нехватки времени, ресурсов и сил. К тому же, меня расстроило, что не смог выполнить просьбу пользователя @N-Cube, который активно интересовался моей библиотекой и хотел ускорить работу своего Jupyter Notebook.

продолжить чтение

Оставлено в

Зачем нужны APM-платформы, если есть Prometheus и Grafana

Всем привет! Меня зовут Дмитрий, я архитектор продукта и занимаюсь развитием APM-платформы.

продолжить чтение

Оставлено в

Уход Хашимото с GitHub: пять историй одной недели на Hacker News

29 апреля 2026 года Митчелл Хашимото объявил, что уводит свой Ghostty с GitHub. Цитата ушла на главную Hacker News через статью в The Register: «GitHub больше не место для серьёзной работы, если он каждый день блокирует тебя на часы».

продолжить чтение

Оставлено в

AutoML для NLU без ручной настройки: делимся библиотекой OpenAutoNLU

продолжить чтение

Оставлено в

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Привет, Хабр!

продолжить чтение

Оставлено в

Десктопный агент «Союз»: безопасный и бесплатный, теперь Open Source

Когда смотришь на рынок AI-агентов, создаётся впечатление, что все соревнуются в одном и том же: кто даст модели больше инструментов, больше доступа и больше свободы. Мы попробовали зайти с другой стороны. Что будет, если не наваливать возможностей без разбора, а думать в первую очередь о безопасности и предсказуемости? Так и появился «Союз». Сегодня мы с товарищем открываем исходники, а я расскажу, как мы к этому пришли и почему такой подход вообще сработал.Обзор и ссылки на исходники в конце статьи.Начало: написать агента может каждый

продолжить чтение

Оставлено в

GigaChat-3.1: Большое обновление больших моделей

Салют, хабр!В ноябре мы выложили в open source preview-версии GigaChat-3-Ultra (702B MoE) и GigaChat-3-Lightning (10B MoE). С тех пор мы провели большую работу над нашими моделями, и сегодня выпускаем обновлённые GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. По нашим замерам, Ultra обходит non-reasoning Qwen3-235B-A22B и DeepSeek-V3-0324 в математике и general reasoning, а Lightning на аренах с судьёй GPT-4.1 играет на уровне GPT-4o — при 1,8 млрд активных параметров. Модели, как и раньше, лежат на HuggingFace и GitVerse под MIT.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

opensource.

Токен-оптимизация агентов: на что уходит контекстное окно MCP

Трансформер в on-premise AppSec: как мы встроили ML-модель для классификации секретов в продукт без GPU

От баз данных до инструментов для ИИ‑экосистем: проекты, которые получили гранты Yandex Open Source

Ускоряем и оптимизируем numpy, pandas, scipy и sklearn

Зачем нужны APM-платформы, если есть Prometheus и Grafana

Уход Хашимото с GitHub: пять историй одной недели на Hacker News

AutoML для NLU без ручной настройки: делимся библиотекой OpenAutoNLU

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Десктопный агент «Союз»: безопасный и бесплатный, теперь Open Source

GigaChat-3.1: Большое обновление больших моделей

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

opensource.