qwen3.

Vera — ваш личный десктопный агент

В прошлой статье я описывал свой эксперимент по возможностям маленьких LLM. Эта статья идет как продолжение, в которой я расскажу о проделанной работе по изменению и улучшению функционала голосового агента. И поверьте, мне есть что рассказать.Когда я задумывал своего агента, меня дико раздражали три вещи в существующих решениях:"Дай денег": Либо плати подписку за ChatGPT Plus, либо привязывай свою карту к API OpenAI/Anthropic/Perplexity."Дай данные":

продолжить чтение

Оставлено в

Применение локальных LLM для OCR

Вдруг кому-то будет полезно. Возникла задача быстрого распознавания данных с фотографий и получения из них структурированной информации. Так же важно было отсутствие требовательного к ресурсам ПО и легкость разворачивания системы. Поэтому было решено попробовать использовать в качестве подключаемого модуля мультимодальные LLM запускаемые под Ollama, т.к. у неё есть REST API по которому удобно обращаться к модели.В последних версиях Ollama появился графический интерфейс, но он неудобен. Модели в ollama проще всего загрузить из командной строки. Например: ollama pull codellama.

продолжить чтение

Оставлено в

Qwen3Guard: следующий шаг в модерации и контроле контента

продолжить чтение

Оставлено в

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

Привет, Хабр! Каждый, кто хоть раз пытался вытащить данные из скана акта или старого отчета, знает эту боль. Классические OCR-инструменты, вроде старого доброго Apache Tika, отлично справляются с простым печатным текстом, но пасуют перед реальными вызовами: таблицами со сложной вёрсткой, рукописными пометками, мелким курсивом и разными шрифтами в одном документе.Чтобы не быть голословными, давайте посмотрим на типичный «сложный» документ и что с ним делает Tika.

продолжить чтение

Оставлено в

Alibaba представила превью reasoning-версии Qwen3-Max-Thinking

Китайская компания Alibaba представила предварительную версию своей новой модели Qwen3-Max-Thinking, которая позиционируется как экспериментальная reasoning-модификация флагманской линейки Qwen3-Max. Разработка ориентирована на сложные задачи, требующие логического мышления и многошаговых рассуждений.

продолжить чтение

Оставлено в

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t-s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

продолжить чтение

Оставлено в

Airbnb выбрал китайского ИИ-агента от Alibaba вместо ChatGPT

Американский сервис по бронированию жилья Airbnb выбрал ИИ-агента Quark на базе языковой модели Qwen3 от китайской Alibaba Cloud вместо решений OpenAI и других конкурирующих компаний. Чат-бот Quark предлагает функции текстового и голосового общения, подобные ChatGPT. Alibaba Cloud — это подразделение Alibaba, базирующееся Ханчжоу и занимающееся искусственным интеллектом и облачными сервисами.

продолжить чтение

Оставлено в

Alibaba выпустила Qwen3-VL-2B и Qwen3-VL-32B

продолжить чтение

Оставлено в

Alibaba выпустила мощную мультимодальную модель

продолжить чтение

Оставлено в

От GPT-2 к gpt-oss: анализ достижений архитектуры

И как они выглядят на фоне Qwen 3📌 Telegram @TheWeeklyBrief — краткие обзоры и подкасты 📌 GitHub Pages — углублённые разборы статей5 августа, 2025 года OpenAI выпустила новые модели LLM с открытым весом: gpt-oss-120b и gpt-oss-20b — первые полностью открытые модели с момента выхода GPT-2 в 2019 году. И да, благодаря некоторым умным оптимизациям, их можно запускать локально (но об этом чуть позже).

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

qwen3.

Vera — ваш личный десктопный агент

Применение локальных LLM для OCR

Qwen3Guard: следующий шаг в модерации и контроле контента

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

Alibaba представила превью reasoning-версии Qwen3-Max-Thinking

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t-s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

Airbnb выбрал китайского ИИ-агента от Alibaba вместо ChatGPT

Alibaba выпустила Qwen3-VL-2B и Qwen3-VL-32B

Alibaba выпустила мощную мультимодальную модель

От GPT-2 к gpt-oss: анализ достижений архитектуры

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

qwen3.