- BrainTools - https://www.braintools.ru -

Nvidia показала новый графический процессор Rubin CPX, созданный специально для работы с языковыми моделями и мультимодальными [1]системами, которым требуется обрабатывать огромные объёмы информации. Чип оптимизирован [2]под контексты свыше 1 миллиона токенов [3]— это в разы больше, чем способны удерживать в памяти [4] даже самые передовые модели сегодня.

Главное новшество Rubin CPX — поддержка архитектуры disaggregated inference. Суть её в том, что разные GPU [5]берут на себя разные части задачи, а затем объединяют результаты в единый ответ. Такой подход позволяет ускорить обработку длинных запросов, снизить задержки и повысить эффективность использования ресурсов. Это особенно актуально для сценариев, где требуется глобальная связность: от генерации видео и работы с большими кодовыми базами до анализа документов и ведения длительных диалогов.
Появление Rubin CPX важно не только для разработчиков ИИ, но и для целых отраслей. Миллионный контекст открывает новые возможности в юриспруденции, где нужно анализировать сотни страниц законов; в медицине, где критично сопоставлять большой объём данных; в IT, где модели смогут работать сразу с целыми проектами, а не с отдельными файлами. В творческой сфере это позволит системам генерировать длинные и цельные видеоролики или сложные мультимедийные проекты.
Rubin CPX ориентирован не столько на обучение [6], сколько на оптимизацию инференса, то есть на ускорение работы уже готовых моделей. Nvidia уверена, что этот чип станет ключевым элементом для масштабирования ИИ следующего поколения и сделает их внедрение в реальный бизнес заметно дешевле и быстрее.
Выход Rubin CPX намечен на конец 2026 года. И хотя до старта продаж ещё больше года, уже понятно: этот процессор может задать новый стандарт для всей индустрии, где работа с длинным контекстом перестанет быть экспериментом и станет нормой.
Делегируйте часть рутинных задач вместе с [7]BotHub! [8] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [9] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Подробнее [10]
Автор: cognitronn
Источник [11]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/19349
URLs in this post:
[1] мультимодальными : https://www.nvidia.com/en-us/glossary/ai-reasoning/
[2] оптимизирован : https://blogs.nvidia.com/blog/ai-factory-inference-optimization/
[3] токенов : https://blogs.nvidia.com/blog/ai-tokens-explained/
[4] памяти: http://www.braintools.ru/article/4140
[5] GPU : https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference
[6] обучение: http://www.braintools.ru/article/5125
[7] с : https://bothub.chat/?utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_source=contentmarketing&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_medium=habr&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_campaign=news&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_content=GEMINI%20ON%20CHATGPT%27S%20HEELS:%20THE%20LATEST%20AI%20RANKING%20FROM%20ANDREESSEN%20HOROWITZ
[8] BotHub!: https://bothub.chat/?utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_source=contentmarketing&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_medium=habr&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_campaign=news&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_content=NVIDIA%20UNVEILS%20GPU%20FOR%20MODELS%20WITH%20ULTRA-LONG%20CONTEXT
[9] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[10] Подробнее: https://developer.nvidia.com/blog/nvidia-rubin-cpx-accelerates-inference-performance-and-efficiency-for-1m-token-context-workloads/
[11] Источник: https://habr.com/ru/companies/bothub/news/945568/?utm_source=habrahabr&utm_medium=rss&utm_campaign=945568
Нажмите здесь для печати.