Как мы собрали локальный AI-сервер на 4× RTX 4090 с водянкой — кейс для крупного клиента
ПредысторияГод назад к нам пришёл заказ: собрать локальный сервер под задачи аналитики звонков для крупной компании в России. Поток — 10 000+ звонков в месяц. По требованию службы безопасности — всё в их контуре, on-premise. Никаких облачных API.Основной наш бизнес — речевая аналитика. Звонки забираем откуда угодно: CRM, IP-телефония, операторы (МТС, Билайн, Мегафон, Alltel и прочие), API Яндекс.Диска, любые внешние источники, до которых доехал клиент. Дальше всё транскрибируется, прогоняется через LLM, на выходе — оценка разговора, корневые причины, тесты для сотрудников. Привыкли работать в облаке. А тут — другой формат.
Зачем вашему процессору нейронный блок, если есть RTX 4090?
2024 и 2025 годы в индустрии железа прошли под знаком двух букв: AI. Если раньше нам продавали гигагерцы и количество ядер, то теперь маркетологи Intel, AMD и Qualcomm меряются TOPS (триллионами операций в секунду). Нам обещают эру «AI PC», встраивают нейронные блоки (NPU) даже в бюджетные «камни» и лепят отдельные кнопки для вызова ассистентов на клавиатуры.
RTX 4090 или L40S: оптимальный GPU среднего уровня в 2025 году
Привет! На связи команда mClouds. В 2025 году разработчики AI-проектов сталкиваются с непростым выбором: использовать топовую потребительскую видеокарту RTX 4090 или профессиональное решение L40S. Обе карты построены на архитектуре Ada Lovelace, используют один и тот же графический чип AD102 и имеют похожую вычислительную мощность, но L40S предлагает вдвое больше памяти: 48 ГБ против 24 ГБ у RTX 4090. При этом разница в цене может отличаться в два раза.В этой статье мы детально сравним технические характеристики, производительность и практическую применимость этих карт для различных AI-задач.
Насколько RTX 5090 лучше RTX 4090: реальные сравнительные тесты
Ее ждали достаточно долго, чтобы требовать от нее многоеВот мы и дождались выхода GeForce RTX 5090. Компания Nvidia наконец-то представила

