ai. - страница 139

ai.

Anthropic переговаривает с Google о многомиллиардном облачном контракте

продолжить чтение

Градиентный спуск: как «слепой в лабиринте» находит выход в миллиардном пространстве — и почему это сердце любого ML

Пошаговый разбор с метафорами, формулами и лайфхаками, которые спасут ваш fit()

продолжить чтение

Как мы дистиллировали Qwen для автоматического протоколирования совещаний

Протоколирование совещаний — важная часть корпоративной коммуникации: протоколы позволяют быстро восстановить ключевые моменты, не переслушивая часовые записи. Нас зовут Андрей Ситников и Максим Шкут, мы работаем DS в команде департамента анализа данных и моделирования ВТБ, занимаемся задачей автоматического протоколирования встреч. Мы реализуем ее с помощью LLM-модели Qwen. В этой статье расскажем, как мы оптимизировали inference, сохранив качество генерации протоколов.Эта статья – саммари нашего выступления на Data Fest 2025. Запись выступления вы можете найти по ссылке

продолжить чтение

MiniMax представила новую модель для кодинга и AI-агентов

Китайская компания MiniMax представила новую открытую модель MiniMax-M2, созданную специально для программирования и AI-агентов. Архитектура Mixture of Experts включает 230 миллиардов общих параметров, из которых одновременно активны только 10 миллиардов.

продолжить чтение

Википедия стремительно теряет аудиторию

продолжить чтение

Momentum Attention: когда внимание получает инерцию

В классическом self-attention каждый токен смотрит на другие токены, чтобы понять, что важно в данный момент.Внимание распределяется мгновенно:Именно этот механизм сделал трансформеры тем, чем они стали.Но вот в чём проблема - внимание не имеет памяти.

продолжить чтение

Kuaishou Technology представила новую генеративную модель SVG

Kuaishou Technology представила новую генеративную модель SVG

продолжить чтение

Делаем свой ChatGPT за 10$ в месяц: разворачиваем LLM на облаке. Подробный гайд на VPS + API-обертка

Еще недавно поиск в Google или Яндекс был главным инструментом инженера. Сегодня все изменилось: AI-помощники вроде ChatGPT, Gemini или Claude, понимающие запросы на естественном языке, кардинально меняют подход к работе. Однако их использование упирается в серьезные преграды: вопросы конфиденциальности корпоративных данных, географические блокировки и лимиты бесплатных тарифов стали новой головной болью.

продолжить чтение

Создаём MCP‑сервер на практике

MCP без воды и шаблонного кода на практике: разбираем протокол, поднимаем сервер, тестируем через Inspector и учим LLM торговать через Finam API. Разберёмся, когда MCP выгоднее «обычных функций», как изолировать интеграции и упростить отладку инструментов.

продолжить чтение

NVIDIA представила модель, которая анализирует звук, речь и музыку

продолжить чтение

Rambler's Top100