qwen.

Выжать больше из локальных LLM. Ollama медленнее llama.cpp в 3 раза. UD_Q4_K_XL лучше чем Q4_K_M, а вес тот же и т.д

Оставлено в

Как за 30 000р дообучить модель, которая работает на уровне GPT-5.4 — на задачах российских учителей

Продолжение. В первой статье мы протестировали 30 нейросетей на задачах для российских учителей. Российские модели заняли последние места. Но строчка #9 — наша: дообученная модель за ~30 000₽, которая работает локально. Вот как мы её сделали.Зачем вообще дообучатьВ комментариях к первой статье справедливо спросили — почему российские модели плохи? GigaChat-2 Max набрал 2.39 из 4, YandexGPT 5.1 Pro — 2.51. Ответ простой: в обучающей выборке этих моделей мало российских школьных задач, они оптимизированы под чат, не под образовательную деятельность.

продолжить чтение

Оставлено в

Как развернуть Qwen в облаке так, чтобы модель не была доступна из интернета

продолжить чтение

Оставлено в

Практическое руководство по Qwen: установка, настройка vLLM и работа через API

продолжить чтение

Оставлено в

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака

Я давно слежу за развитием локальных LLM, но всегда упирался в одно и то же — либо модель маленькая и качество не устраивает, либо большая и не влезает в видеопамять. Всё изменилось когда я наткнулся на статью про MoE-модели и параметр -cmoe в llama.cpp.Расскажу как я запустил Qwen3.6 35B-A3B на RTX 4070 12GB с 32GB RAM, настроил его как AI-ассистент для реального проекта в opencode, и почему теперь эта модель у меня работает постоянно.Железо и ожиданияМоя конфигурация:GPU: RTX 4070 12GB VRAMRAM: 32GB DDR4CPU: 12 физических ядерOS: Windows 11 + WSL2 (Ubuntu)

продолжить чтение

Оставлено в

Вторая волна ИИ: мы там, где интернет в 1997-м. Догоним или уже нет?

продолжить чтение

Оставлено в

CorpClaw-Lite или как я сделал безопасный аналог OpenClaw

Сегодня я хочу рассказать о проекте, над которым я работал последние полтора месяца и сегодня открыл его в опенсорс, чтобы дать ему развитие, и, возможно, предоставить его функционал тем, кому он окажется полезен.Предыстория

продолжить чтение

Оставлено в

Кто круче рисует бананы? Сравниваем Nano Banana, Qwen и ChatGPT

продолжить чтение

Оставлено в

Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

Battle test на русском и английском: цена, качество и артефакты — открытый лидербордLLM-судья оценивает сам себя. Что могло пойти не так?127 баллов из 100. Не опечатка.

продолжить чтение

Оставлено в

Вышло обновление бенчмарка Artificial Analysis: GLM-5.1, Qwen3.6 и другие

В сегодняшнем и вчерашнем обновлении рейтинга Artificial Analysis Intelligence Index добавились несколько моделей, про которые в последние дни писали в новостях.https://artificialanalysis.ai/changelog

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

qwen.

Выжать больше из локальных LLM. Ollama медленнее llama.cpp в 3 раза. UD_Q4_K_XL лучше чем Q4_K_M, а вес тот же и т.д

Как за 30 000р дообучить модель, которая работает на уровне GPT-5.4 — на задачах российских учителей

Как развернуть Qwen в облаке так, чтобы модель не была доступна из интернета

Практическое руководство по Qwen: установка, настройка vLLM и работа через API

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака

Вторая волна ИИ: мы там, где интернет в 1997-м. Догоним или уже нет?

CorpClaw-Lite или как я сделал безопасный аналог OpenClaw

Кто круче рисует бананы? Сравниваем Nano Banana, Qwen и ChatGPT

Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

Вышло обновление бенчмарка Artificial Analysis: GLM-5.1, Qwen3.6 и другие

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

qwen.