В топ рейтинга ИИ попала модель правительства Рио-де-Жанейро на основе Qwen

На рынке LLM неожиданная смена лидеров. Бразильская IT-компания IplanRIO, принадлежащая правительству Рио-де-Жанейро, представила open-source новинку Rio 3.5 Open 397B.

Изначально заявлялось, что разработчики дообучили китайскую Tongyi Qwen 3.5 от Alibaba и смогли создать решение, которое с ходу вошло в мировой топ-10 рейтинга ИИ, потеснив флагманские коммерческие системы — однако за этим успехом скрывался совсем другой технический нюанс.

Архитектура и масштаб модели

Как модель привлекла внимание ^[1] общественности? Все дело в масштабе модели — RIO 3.5 построена на базе архитектуры с 397 млрд параметров, и использует схему «Смеси экспертов». Во время генерации активируется часть параметров – 17 млрд на токен. Подход позволяет получить производительность моделей флагманского уровня, т.к. архитектура этой модели аналогична большинству самых успешных моделей.

Хоть основное соперничество в развитии нейросетей идет между Китаем и США, Бразилия громко заявила о себе — RIO развивается по схеме, приносящей успех многим открытым моделям: за базу берутся готовая архитектура и передовые наработки, которые затем модифицируются для повышения качества работы

Главные плюсы

Из основных плюсов (по заявлению разработчиков) можно выделить:

Интеграция SwiReasoning. Возможность динамически переключаться между явным выводом и выводом в латентном пространстве для достижения оптимального баланса между точностью и эффективностью;
Отличные результаты в рассуждении, выполнении команд и многомодальных задачах, наравне с знаменитыми моделями;
Хорошо понимает многие языки — результаты на английском, китайском и более пятнадцати других языков на высоком уровне;
Лицензия MIT. Она снимает запреты с этого полностью открытого кода, такие как использование в коммерческих целях или модификация.

Ключевое, на мой взгляд, преимущество – огромная длина контекста. Rio 3.5 поддерживает контекст в один миллион токенов, что позволяет анализировать крупные тексты и большие объемы кода, исследовательские материалы и научные работы — все это без необходимости постоянно дробить информацию на части, как бывает в том же ChatGPT.

В топ рейтинга ИИ попала модель правительства Рио-де-Жанейро на основе Qwen - 2

Облачная инфраструктура для ваших проектов

Виртуальные машины в Москве, Санкт-Петербурге и Новосибирске с оплатой по потреблению.

Подробнее → ^[2]

Недостатки и требования к железу

Из недостатков можно отметить:

Слишком большая перегруженность модели – использовать такую архитектуру можно, но для этого требуется серьезные вычислительные ресурсы. Полноценный запуск такой модели остается недоступным для обывателей.

Чтобы запустить Rio 3.5 в оригинальном качестве (FP16), потребуется около 880 ГБ VRAM — это четыре серверных чипа Blackwell Ultra. Даже со сжатием (INT4) модели нужно не менее 220 ГБ видеопамяти, так что просто на домашнем ПК ее не развернуть.

Необкатанная модель — преимущества основаны на результатах тестировщиков и разработчиков, обычные пользователи пока не сложили мнения о модели.

Правда, почти сразу вспыхнул скандал. Исследователи из Nex-AGI заявили ^[3], что бразильцы модель вообще не обучали, а сделали чистый математический мерж весов оригинальной Qwen 3.5 и их собственной Nex-N2 Pro. Более того, когда у Rio стерли системный промпт, она начала отвечать: «Я — Nex». IplanRIO уже извинились на Hugging Face, сославшись на то, что инженеры случайно залили не тот файл.

Доказательство подмены весов: в ответах API модель rio-397b прямо называет себя чужим именем — Nex от Nex-AGI. Источник. — *Доказательство подмены весов: в ответах API модель* `rio-397b` *прямо называет себя чужим именем — Nex от Nex-AGI.* *Источник* ^[3].

Хоть модель за счет интеграции SwiReasoning и выдает результаты сильнее базовой Qwen 3.5, конкурируя по ряду тестов с закрытыми флагманами, до фундаментального технологического прорыва она не дотягивает. Однако бесконечно штамповать подобные решения без потери качества невозможно — этот блендинг сработал только благодаря близкой архитектурной генетике исходных моделей, чьи веса идеально подошли друг к другу.

Диаграмма бенчмарков от разработчиков Rio. Стоит учесть, что сравнение идет с закрытыми коммерческими версиями вроде Qwen 3.7 Plus, тогда как базовая модель Qwen 3.5 на графике намеренно отсутствует. Минимальный отрыв в ряде тестов находится в пределах погрешности и обусловлен внешней надстройкой SwiReasoning. Источник. — Диаграмма бенчмарков от разработчиков Rio. Стоит учесть, что сравнение идет с закрытыми коммерческими версиями вроде Qwen 3.7 Plus, тогда как базовая модель Qwen 3.5 на графике намеренно отсутствует. Минимальный отрыв в ряде тестов находится в пределах погрешности и обусловлен внешней надстройкой SwiReasoning. *Источник* ^[4].

Что в итоге

Теперь не только Китай удивляет своими интересными решениями в области ИИ, но и Бразилия. Хоть США и является лидером по выручке ^[5], монополия в области создания нейросетей сходит на нет. Благодаря открытым базовым моделям, новым методам дообучения и более эффективным архитектурам в борьбу за лидерство ^[6] будут вступать новые игроки.

Время покажет, сможет ли IplanRIO выпустить свою финальную очищенную версию, но сам прецедент с Rio 3.5 уже стал предметом главных обсуждений в Кремниевой долине. История показала, что open-source сообщество способно мгновенно выводить на рынок сильные решения и так же быстро выводить их создателей на чистую воду, подпитывая огонь конкуренции среди больших языковых моделей.

Протестировать Rio 3.5 Open 397B уже можно через страницу модели на Hugging Face ^[7].

Автор: Flampanzer

Источник ^[8]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/31787

URLs in this post:

[1] внимание: http://www.braintools.ru/article/7595

[2] Подробнее →: https://selectel.ru/services/cloud/servers/?utm_source=habr.com&utm_medium=referral&utm_campaign=cloud_news_piollm_160626_banner_i001_ord

[3] заявили: https://github.com/nex-agi/Nex-N2/issues/4

[4] Источник: https://x.com/BackupBrainy/status/2065961268033532191

[5] по выручке: https://finance.yahoo.com/news/openai-tops-25-billion-annualized-033836274.html?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAEm1aFPbOm6Ea3H7H7SF1tIb4XIeQ6G2X8rY4IBI5y9kZ5Ih8f1M4CufRh_SVUIGJHPQswaTRznZvHiwX6ktmXAxEKhZ9K9jzasZ8oYSW0doHOISpzCVqyvB6abJij-oaRO10Zd_Mpzmb8FO3XFPD9143PoztiUhvpOOmjy2fpxK

[6] лидерство: http://www.braintools.ru/article/1165

[7] на Hugging Face: https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B

[8] Источник: https://habr.com/ru/companies/selectel/news/1047848/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1047848

Нажмите здесь для печати.