ai.
Как мы дистиллировали Qwen для автоматического протоколирования совещаний
Протоколирование совещаний — важная часть корпоративной коммуникации: протоколы позволяют быстро восстановить ключевые моменты, не переслушивая часовые записи. Нас зовут Андрей Ситников и Максим Шкут, мы работаем DS в команде департамента анализа данных и моделирования ВТБ, занимаемся задачей автоматического протоколирования встреч. Мы реализуем ее с помощью LLM-модели Qwen. В этой статье расскажем, как мы оптимизировали inference, сохранив качество генерации протоколов.Эта статья – саммари нашего выступления на Data Fest 2025. Запись выступления вы можете найти по ссылке
MiniMax представила новую модель для кодинга и AI-агентов
Китайская компания MiniMax представила новую открытую модель MiniMax-M2, созданную специально для программирования и AI-агентов. Архитектура Mixture of Experts включает 230 миллиардов общих параметров, из которых одновременно активны только 10 миллиардов.
Momentum Attention: когда внимание получает инерцию
В классическом self-attention каждый токен смотрит на другие токены, чтобы понять, что важно в данный момент.Внимание распределяется мгновенно:Именно этот механизм сделал трансформеры тем, чем они стали.Но вот в чём проблема - внимание не имеет памяти.
Kuaishou Technology представила новую генеративную модель SVG
Kuaishou Technology представила новую генеративную модель SVG
Делаем свой ChatGPT за 10$ в месяц: разворачиваем LLM на облаке. Подробный гайд на VPS + API-обертка
Еще недавно поиск в Google или Яндекс был главным инструментом инженера. Сегодня все изменилось: AI-помощники вроде ChatGPT, Gemini или Claude, понимающие запросы на естественном языке, кардинально меняют подход к работе. Однако их использование упирается в серьезные преграды: вопросы конфиденциальности корпоративных данных, географические блокировки и лимиты бесплатных тарифов стали новой головной болью.
Создаём MCP‑сервер на практике
MCP без воды и шаблонного кода на практике: разбираем протокол, поднимаем сервер, тестируем через Inspector и учим LLM торговать через Finam API. Разберёмся, когда MCP выгоднее «обычных функций», как изолировать интеграции и упростить отладку инструментов.
OpenAI делает собственный генератор музыки
По данным The Information, компания уже начала работу над моделью, которая сможет создавать музыкальные композиции на уровне профессиональных студий. Это значит, что нынешнему лидеру музыкальных нейросетей Suno скоро появится серьезный конкурент.

