qwen3.6.

Тесты бюджетных сборок для ИИ до 100к рублей

GPU для локального ИИ достаточно дорогие, и мне стало интересно: а есть ли жизнеспособный инференс на CPU? А что будет если добавить дешевую видеокарту для майнинга или Tesla V100 16gb? Что можно выжать из максимально бюджетных решений для локального ИИ?Я собрал бюджетную сборку в разных вариациях (2 материнские платы и 2 видеокарты) прогнал тесты некоторых известных моделей LLM и построил графики чтобы можно было сделать выводы.Объем статьи достаточно большой, поэтому для простоты восприятия оформил 15-ти минутное видео на youtube.Навигация по тексту:Стенд

продолжить чтение

Оставлено в

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

ВведениеВсем привет! Продолжаю тему предыдущей статьи. В ней сравнивалось железо для локального инференса — Nvidia DGX Spark, Mac Studio M3 Ultra и Strix Halo. И как можно было догадаться, остановился я именно на последнем.Железо есть, зарядим теперь на нем пару-тройку локальных моделей под управлением проверенного AI-агента.Claude Сode по подписке с оригинальными LLM - это, конечно, замечательно. Но это стоит денег, да и свой код в чужие дата-центры не всегда правильно отправлять. Плюс за всякое неосторожное движение можно попасть в бан, рискуя потерять все свои наработки.Одно из решений:

продолжить чтение

Оставлено в

В каталоге готовых моделей Selectel теперь доступна линейка Qwen3.6

Рады объявить о большом пополнении: в нашем Foundation Models Catalog

продолжить чтение

Оставлено в

Почему Qwen3.6-27B лучше чем Claude? Железная коробка, которая научилась думать

На вопрос «Чем локальная модель лучше коммерческой top‑quality модели от Anthropic, OpenAI или Google?», — обычно отвечают: приватность. На самом деле это не совсем так. Приватность важна, но не только она. У локальных моделей есть более важные качества, которые я опишу в этой статье.Первое преимущество локальных моделей

продолжить чтение

Оставлено в

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t-s до 130 t-s без потерь. Что такое MTP

продолжить чтение

Оставлено в

Локальные LLM в реальной работе: Gemma 4, Qwen 3.6 и Qwen Coder

Gemma 4 обыграла Qwen Coder в задачах программирования, а режим мышления заставил модели хуже следовать инструкциям. Рассказываю почему.Зачем я это затеялПривет, меня зовут Вячеслав. Я интересуюсь локальными LLM и тем, как они ведут себя в реальных задачах — не на синтетических бенчмарках, а когда нужно написать работающий код, отрефакторить файл с багами или вытащить данные из HTML.

продолжить чтение

Оставлено в

Топ локальных нейросетей ︎◍ 2026: подборка ИИ для запуска из дома

Сознаюсь: когда я впервые попытался запустить большую языковую модель на своём ноутбуке, всё закончилось вертушкой кулера, жутким лагом и системным сообщением “Недостаточно памяти”. Казалось, что домашний ИИ –

продолжить чтение