В топ рейтинга ИИ попала модель правительства Рио-де-Жанейро на основе Qwen. ai.. ai. alibaba.. ai. alibaba. IplanRIO.. ai. alibaba. IplanRIO. IT-компании.. ai. alibaba. IplanRIO. IT-компании. llm.. ai. alibaba. IplanRIO. IT-компании. llm. ml.. ai. alibaba. IplanRIO. IT-компании. llm. ml. Open source.. ai. alibaba. IplanRIO. IT-компании. llm. ml. Open source. qwen.. ai. alibaba. IplanRIO. IT-компании. llm. ml. Open source. qwen. Rio 3.5 Open.. ai. alibaba. IplanRIO. IT-компании. llm. ml. Open source. qwen. Rio 3.5 Open. selectel.. ai. alibaba. IplanRIO. IT-компании. llm. ml. Open source. qwen. Rio 3.5 Open. selectel. Блог компании Selectel.. ai. alibaba. IplanRIO. IT-компании. llm. ml. Open source. qwen. Rio 3.5 Open. selectel. Блог компании Selectel. искусственный интеллект.. ai. alibaba. IplanRIO. IT-компании. llm. ml. Open source. qwen. Rio 3.5 Open. selectel. Блог компании Selectel. искусственный интеллект. Машинное обучение.
В топ рейтинга ИИ попала модель правительства Рио-де-Жанейро на основе Qwen - 1

На рынке LLM неожиданная смена лидеров. Бразильская IT-компания IplanRIO, принадлежащая правительству Рио-де-Жанейро, представила open-source новинку Rio 3.5 Open 397B. 

Изначально заявлялось, что разработчики дообучили китайскую Tongyi Qwen 3.5 от Alibaba и смогли создать решение, которое с ходу вошло в мировой топ-10 рейтинга ИИ, потеснив флагманские коммерческие системы — однако за этим успехом скрывался совсем другой технический нюанс.

Архитектура и масштаб модели

Как модель привлекла внимание общественности? Все дело в масштабе модели — RIO 3.5 построена на базе архитектуры с 397 млрд параметров, и использует схему «Смеси экспертов». Во время генерации активируется часть параметров – 17 млрд на токен. Подход позволяет получить производительность моделей флагманского уровня, т.к. архитектура этой модели аналогична большинству самых успешных моделей.

Хоть основное соперничество в развитии нейросетей идет между Китаем и США, Бразилия громко заявила о себе — RIO развивается по схеме, приносящей успех многим открытым моделям: за базу берутся готовая архитектура и передовые наработки, которые затем модифицируются для повышения качества работы

Главные плюсы

Из основных плюсов (по заявлению разработчиков) можно выделить:

  • Интеграция SwiReasoning. Возможность динамически переключаться между явным выводом и выводом в латентном пространстве для достижения оптимального баланса между точностью и эффективностью;

  • Отличные результаты в рассуждении, выполнении команд и многомодальных задачах, наравне с знаменитыми моделями; 

  • Хорошо понимает многие языки — результаты на английском, китайском и более пятнадцати других языков на высоком уровне;

  • Лицензия MIT. Она снимает запреты с этого полностью открытого кода, такие как  использование в коммерческих целях или модификация.

Ключевое, на мой взгляд, преимущество – огромная длина контекста. Rio 3.5 поддерживает контекст в один миллион токенов, что позволяет анализировать крупные тексты и большие объемы кода, исследовательские материалы и научные работы — все это без необходимости постоянно дробить информацию на части, как бывает в том же ChatGPT. 

В топ рейтинга ИИ попала модель правительства Рио-де-Жанейро на основе Qwen - 2

Облачная инфраструктура для ваших проектов

Виртуальные машины в Москве, Санкт-Петербурге и Новосибирске с оплатой по потреблению.

Подробнее →

Недостатки и требования к железу

Из недостатков можно отметить:

Слишком большая перегруженность модели – использовать такую архитектуру можно, но для этого требуется серьезные вычислительные ресурсы. Полноценный запуск такой модели остается недоступным для обывателей.

Чтобы запустить Rio 3.5 в оригинальном качестве (FP16), потребуется около 880 ГБ VRAM — это четыре серверных чипа Blackwell Ultra. Даже со сжатием (INT4) модели нужно не менее 220 ГБ видеопамяти, так что просто на домашнем ПК ее не развернуть.

Необкатанная модель — преимущества основаны на результатах тестировщиков и разработчиков, обычные пользователи пока не сложили мнения о модели.

Правда, почти сразу вспыхнул скандал. Исследователи из Nex-AGI заявили, что бразильцы модель вообще не обучали, а сделали чистый математический мерж весов оригинальной Qwen 3.5 и их собственной Nex-N2 Pro. Более того, когда у Rio стерли системный промпт, она начала отвечать: «Я — Nex». IplanRIO уже извинились на Hugging Face, сославшись на то, что инженеры случайно залили не тот файл. 

Доказательство подмены весов: в ответах API модель rio-397b прямо называет себя чужим именем — Nex от Nex-AGI. Источник.

Доказательство подмены весов: в ответах API модель rio-397b прямо называет себя чужим именем — Nex от Nex-AGI. Источник.

Хоть модель за счет интеграции SwiReasoning и выдает результаты сильнее базовой Qwen 3.5, конкурируя по ряду тестов с закрытыми флагманами, до фундаментального технологического прорыва она не дотягивает. Однако бесконечно штамповать подобные решения без потери качества невозможно — этот блендинг сработал только благодаря близкой архитектурной генетике исходных моделей, чьи веса идеально подошли друг к другу. 

Диаграмма бенчмарков от разработчиков Rio. Стоит учесть, что сравнение идет с закрытыми коммерческими версиями вроде Qwen 3.7 Plus, тогда как базовая модель Qwen 3.5 на графике намеренно отсутствует. Минимальный отрыв в ряде тестов находится в пределах погрешности и обусловлен внешней надстройкой SwiReasoning. Источник.

Диаграмма бенчмарков от разработчиков Rio. Стоит учесть, что сравнение идет с закрытыми коммерческими версиями вроде Qwen 3.7 Plus, тогда как базовая модель Qwen 3.5 на графике намеренно отсутствует. Минимальный отрыв в ряде тестов находится в пределах погрешности и обусловлен внешней надстройкой SwiReasoning. Источник.

Что в итоге

Теперь не только Китай удивляет своими интересными решениями в области ИИ, но и Бразилия. Хоть США и является лидером по выручке, монополия в области создания нейросетей сходит на нет. Благодаря открытым базовым моделям, новым методам дообучения и более эффективным архитектурам в борьбу за лидерство будут вступать новые игроки. 

Время покажет, сможет ли IplanRIO выпустить свою финальную очищенную версию, но сам прецедент с Rio 3.5 уже стал предметом главных обсуждений в Кремниевой долине. История показала, что open-source сообщество способно мгновенно выводить на рынок сильные решения и так же быстро выводить их создателей на чистую воду, подпитывая огонь конкуренции среди больших языковых моделей.

Протестировать Rio 3.5 Open 397B уже можно через страницу модели на Hugging Face

Автор: Flampanzer

Источник