qwen.
Они умеют думать. Как я искал (и нашёл) язык, на котором «думает» LLM
Это история одного эксперимента. Без хайпа про «сознание ИИ», но с настоящим результатом: внутри большой языковой модели есть слой, где мысль ещё не слово, а концепт. И этот концепт можно поймать за руку, подвигать, как ручку громкости, и прочитать по слогам.Вопрос, с которого всё началосьКогда LLM отвечает вам, она выдаёт токены — кусочки слов. Слева направо, по одному. Но до того, как родился токен, внутри сети прокатывается волна чисел — скрытые состояния, 3584 числа на каждом слое, 28 слоёв. Вопрос, который не давал мне покоя:
Как использовать новые Qwen3.7 Plus в России и GLM 5.2 на русском
Qwen3.7 Plus от Alibaba и GLM 5.2 от Z.AI теперь работают без VPN. Обе заточены под кодинг и агентные задачи, обе держат миллион токенов контекста, и обе могут вам пригодиться. Как получить к ним доступ без подписок и сервисов обхода, разбираемся в этой статье.Qwen3.7 Plus: мультимодальный агент за копейкиQwen3.7 Plus — это мультимодальная версия агентного бэкбона Qwen3.7 примерно в шесть раз дешевле, чем флагманский Qwen3.7 Max.
Как я пытался создать шедевр в Qwen, Luma и Pika, и что из этого вышло
Помните, как полтора-два года назад в коротких видео стали появляться видео сомнительного качества, которые можно с легкостью пометить как сгенерированные? С тех пор их количество заметно упало.
В топ рейтинга ИИ попала модель правительства Рио-де-Жанейро на основе Qwen
На рынке LLM неожиданная смена лидеров. Бразильская IT-компания IplanRIO, принадлежащая правительству Рио-де-Жанейро, представила open-source новинку Rio 3.5 Open 397B.
«ChatGPT с AliExpress» или лучшая китайская нейросеть: разбираемся в Qwen 3.7
Роли между популярными нейросетями более-менее распределены.
Нужно ли использовать Qwen? Качество и цена
Текст носит юмористический характер и написан для @mahmud90 и @MountainGoatКитайские модели стоят в разы дешевле западных — и каждый месяц кто-нибудь спрашивает: а можно ли просто пересесть на Qwen и не платить за Claude с GPT? Я взял одну реальную задачу и прогнал её через три модели сразу, а потом свёл качество с ценой. Ниже — что получилось и кому Qwen реально подойдёт.Задача одна на всех: разобрать топ-10 heap alloc_objects
Модели почти год, а она всё ещё №1 по цене-качеству. Прогнал свежий батл-тест — и опять не сдвинул
Собрал четыре модели в один батч — одна сессия, один судья, те же пять тем. Сравнивать баллы из разных тестов нельзя: разница в пару баллов между сессиями — это шум, а не сигнал.qwen/qwen3-235b-a22b-2507 снова №1 по цене/качеству (value 91.6). Модель вышла 21 июля 2025 — почти год назад. Рынок несколько раз перетряхнуло, а она с трона не сдвинулась.DeepSeek V4 Flash был недооценён на 6 баллов. В апреле у меня стоял 83, в честном батче — 89, сильнейший по качеству из четырёх. Аутсайдер оказался лидером.Мнимый сюрприз развеялся.
Finetune Lora Qwen3vl и прочие приключения
У меня была видеокарта NVIDIA A100 с максимальным объёмом памяти 79,254 Гб. Нужно было извлечь ключевую информацию (задача Question Answering) из 6 тыс. многостраничных документов. Всего было 15 полей разного типа:

