- BrainTools - https://www.braintools.ru -

На рынке LLM неожиданная смена лидеров. Бразильская IT-компания IplanRIO, принадлежащая правительству Рио-де-Жанейро, представила open-source новинку Rio 3.5 Open 397B.
Изначально заявлялось, что разработчики дообучили китайскую Tongyi Qwen 3.5 от Alibaba и смогли создать решение, которое с ходу вошло в мировой топ-10 рейтинга ИИ, потеснив флагманские коммерческие системы — однако за этим успехом скрывался совсем другой технический нюанс.
Как модель привлекла внимание [1] общественности? Все дело в масштабе модели — RIO 3.5 построена на базе архитектуры с 397 млрд параметров, и использует схему «Смеси экспертов». Во время генерации активируется часть параметров – 17 млрд на токен. Подход позволяет получить производительность моделей флагманского уровня, т.к. архитектура этой модели аналогична большинству самых успешных моделей.
Хоть основное соперничество в развитии нейросетей идет между Китаем и США, Бразилия громко заявила о себе — RIO развивается по схеме, приносящей успех многим открытым моделям: за базу берутся готовая архитектура и передовые наработки, которые затем модифицируются для повышения качества работы
Из основных плюсов (по заявлению разработчиков) можно выделить:
Интеграция SwiReasoning. Возможность динамически переключаться между явным выводом и выводом в латентном пространстве для достижения оптимального баланса между точностью и эффективностью;
Отличные результаты в рассуждении, выполнении команд и многомодальных задачах, наравне с знаменитыми моделями;
Хорошо понимает многие языки — результаты на английском, китайском и более пятнадцати других языков на высоком уровне;
Лицензия MIT. Она снимает запреты с этого полностью открытого кода, такие как использование в коммерческих целях или модификация.
Ключевое, на мой взгляд, преимущество – огромная длина контекста. Rio 3.5 поддерживает контекст в один миллион токенов, что позволяет анализировать крупные тексты и большие объемы кода, исследовательские материалы и научные работы — все это без необходимости постоянно дробить информацию на части, как бывает в том же ChatGPT.

Облачная инфраструктура для ваших проектов
Виртуальные машины в Москве, Санкт-Петербурге и Новосибирске с оплатой по потреблению.
Подробнее → [2]
Из недостатков можно отметить:
Слишком большая перегруженность модели – использовать такую архитектуру можно, но для этого требуется серьезные вычислительные ресурсы. Полноценный запуск такой модели остается недоступным для обывателей.
Чтобы запустить Rio 3.5 в оригинальном качестве (FP16), потребуется около 880 ГБ VRAM — это четыре серверных чипа Blackwell Ultra. Даже со сжатием (INT4) модели нужно не менее 220 ГБ видеопамяти, так что просто на домашнем ПК ее не развернуть.
Необкатанная модель — преимущества основаны на результатах тестировщиков и разработчиков, обычные пользователи пока не сложили мнения о модели.
Правда, почти сразу вспыхнул скандал. Исследователи из Nex-AGI заявили [3], что бразильцы модель вообще не обучали, а сделали чистый математический мерж весов оригинальной Qwen 3.5 и их собственной Nex-N2 Pro. Более того, когда у Rio стерли системный промпт, она начала отвечать: «Я — Nex». IplanRIO уже извинились на Hugging Face, сославшись на то, что инженеры случайно залили не тот файл.
rio-397b прямо называет себя чужим именем — Nex от Nex-AGI. Источник [3].Хоть модель за счет интеграции SwiReasoning и выдает результаты сильнее базовой Qwen 3.5, конкурируя по ряду тестов с закрытыми флагманами, до фундаментального технологического прорыва она не дотягивает. Однако бесконечно штамповать подобные решения без потери качества невозможно — этот блендинг сработал только благодаря близкой архитектурной генетике исходных моделей, чьи веса идеально подошли друг к другу.
Теперь не только Китай удивляет своими интересными решениями в области ИИ, но и Бразилия. Хоть США и является лидером по выручке [5], монополия в области создания нейросетей сходит на нет. Благодаря открытым базовым моделям, новым методам дообучения и более эффективным архитектурам в борьбу за лидерство [6] будут вступать новые игроки.
Время покажет, сможет ли IplanRIO выпустить свою финальную очищенную версию, но сам прецедент с Rio 3.5 уже стал предметом главных обсуждений в Кремниевой долине. История показала, что open-source сообщество способно мгновенно выводить на рынок сильные решения и так же быстро выводить их создателей на чистую воду, подпитывая огонь конкуренции среди больших языковых моделей.
Протестировать Rio 3.5 Open 397B уже можно через страницу модели на Hugging Face [7].
Автор: Flampanzer
Источник [8]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/31787
URLs in this post:
[1] внимание: http://www.braintools.ru/article/7595
[2] Подробнее →: https://selectel.ru/services/cloud/servers/?utm_source=habr.com&utm_medium=referral&utm_campaign=cloud_news_piollm_160626_banner_i001_ord
[3] заявили: https://github.com/nex-agi/Nex-N2/issues/4
[4] Источник: https://x.com/BackupBrainy/status/2065961268033532191
[5] по выручке: https://finance.yahoo.com/news/openai-tops-25-billion-annualized-033836274.html?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAEm1aFPbOm6Ea3H7H7SF1tIb4XIeQ6G2X8rY4IBI5y9kZ5Ih8f1M4CufRh_SVUIGJHPQswaTRznZvHiwX6ktmXAxEKhZ9K9jzasZ8oYSW0doHOISpzCVqyvB6abJij-oaRO10Zd_Mpzmb8FO3XFPD9143PoztiUhvpOOmjy2fpxK
[6] лидерство: http://www.braintools.ru/article/1165
[7] на Hugging Face: https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
[8] Источник: https://habr.com/ru/companies/selectel/news/1047848/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1047848
Нажмите здесь для печати.