ai. - страница 52

ai.

Как мы дистиллировали Qwen для автоматического протоколирования совещаний

Протоколирование совещаний — важная часть корпоративной коммуникации: протоколы позволяют быстро восстановить ключевые моменты, не переслушивая часовые записи. Нас зовут Андрей Ситников и Максим Шкут, мы работаем DS в команде департамента анализа данных и моделирования ВТБ, занимаемся задачей автоматического протоколирования встреч. Мы реализуем ее с помощью LLM-модели Qwen. В этой статье расскажем, как мы оптимизировали inference, сохранив качество генерации протоколов.Эта статья – саммари нашего выступления на Data Fest 2025. Запись выступления вы можете найти по ссылке

продолжить чтение

MiniMax представила новую модель для кодинга и AI-агентов

Китайская компания MiniMax представила новую открытую модель MiniMax-M2, созданную специально для программирования и AI-агентов. Архитектура Mixture of Experts включает 230 миллиардов общих параметров, из которых одновременно активны только 10 миллиардов.

продолжить чтение

Википедия стремительно теряет аудиторию

продолжить чтение

Momentum Attention: когда внимание получает инерцию

В классическом self-attention каждый токен смотрит на другие токены, чтобы понять, что важно в данный момент.Внимание распределяется мгновенно:Именно этот механизм сделал трансформеры тем, чем они стали.Но вот в чём проблема - внимание не имеет памяти.

продолжить чтение

Kuaishou Technology представила новую генеративную модель SVG

Kuaishou Technology представила новую генеративную модель SVG

продолжить чтение

Делаем свой ChatGPT за 10$ в месяц: разворачиваем LLM на облаке. Подробный гайд на VPS + API-обертка

Еще недавно поиск в Google или Яндекс был главным инструментом инженера. Сегодня все изменилось: AI-помощники вроде ChatGPT, Gemini или Claude, понимающие запросы на естественном языке, кардинально меняют подход к работе. Однако их использование упирается в серьезные преграды: вопросы конфиденциальности корпоративных данных, географические блокировки и лимиты бесплатных тарифов стали новой головной болью.

продолжить чтение

Создаём MCP‑сервер на практике

MCP без воды и шаблонного кода на практике: разбираем протокол, поднимаем сервер, тестируем через Inspector и учим LLM торговать через Finam API. Разберёмся, когда MCP выгоднее «обычных функций», как изолировать интеграции и упростить отладку инструментов.

продолжить чтение

NVIDIA представила модель, которая анализирует звук, речь и музыку

продолжить чтение

OpenAI делает собственный генератор музыки

По данным The Information, компания уже начала работу над моделью, которая сможет создавать музыкальные композиции на уровне профессиональных студий. Это значит, что нынешнему лидеру музыкальных нейросетей Suno скоро появится серьезный конкурент.

продолжить чтение

Alibaba выпустила умные очки с Qwen

продолжить чтение

Rambler's Top100