Разработчик под никнеймом Anemll запустил языковую модель Qwen 3.5 с 397 млрд параметров на iPhone 17 Pro. Веса модели подгружали с внешнего SSD, а скорость генерации ответов составила всего 0,6 токенов. Авторы проекта признают, что решение не годится для нормального использования, а лишь демонстрирует возможности.

Оставлено в

Alibaba сократила более 66 тыс. сотрудников за год на фоне смены стратегии в сторону ИИ

Alibaba Group за 2025 год сократила численность персонала примерно на треть — с 194 тыс. до 128 тыс. сотрудников. Таким образом, компанию покинули более 66 тыс. человек, следует из отчетности, на которую ссылается CNBC.

продолжить чтение

Оставлено в

Как мы внедрили ИИ для обработки рекламаций на производстве

Где бы вы ни работали и каким идеальным продуктом или сервисом вы бы ни занимались, вас всегда будут сопровождать жалобы и рекламации от клиентов.Рекламации — это вежливо-агрессивная форма общения между заказчиком и поставщиком, где каждая сторона добивается максимально приемлемого для себя результата. Потребитель, в идеале, хочет замену товара без дополнительных затрат, а производитель — соблюсти баланс между полным отзывом по гарантийному случаю , или вежливым ответом: «ваше обращение очень важно для нас, но помочь ничем не можем — вот вам промокод в размере 2% на последующие покупки».

продолжить чтение

Оставлено в

Китай приравнял ИИ к обороне: технологии впервые стали приоритетом №1 в пятилетке

15-й пятилетний план Китая на 2026–2030 годы, принятый

продолжить чтение

Оставлено в

Семантический поиск vs полнотекстовый: сравниваем три embedding-модели на 10 000 категорий Ozon

1. Семантический поиск: поиск по смыслуИдея семантического поиска: представить и документы, и запрос в виде числовых векторов (embeddings) в едином пространстве. Близкие по смыслу тексты будут иметь близкие векторы. Для измерения близости используется косинусное расстояние.Как это работаетТекст → Embedding-модель → Вектор (сотни/тысячи измерений) При индексации каждый документ превращается в вектор и сохраняется в базу. При поиске запрос тоже превращается в вектор, и pgvector находит ближайшие документы по косинусному расстоянию:

продолжить чтение

Оставлено в

Облачные модели Ollama в задачах code review — честное сравнение на примерах

С недавних пор AI-инструменты стали важной частью разработки. Такие решения, как Cursor, Codex и Claude Code позволяют разработчикам генерировать код, ускорять написание функций и автоматизировать рутинные задачи. Это существенно повышает скорость разработки. Однако у такого подхода есть и обратная сторона: код начинает появляться быстрее, чем команды успевают его качественно проверять. В результате нагрузка на процесс code review

продолжить чтение

Оставлено в

9 агентов, 6 моделей, 1 сервер: как собрать ИИ-компанию на open-source в марте 2026

Я собрал команду из 9 ИИ-агентов, которая проектирует, пишет, тестирует и деплоит других ИИ-агентов. Полный цикл — от пользовательского запроса до production-ready кода с тестами и security review. Без людей в цикле.Ниже — конкретика: какие модели, на какие роли, почему именно эти, как они шарят GPU, сколько стоят в гигабайтах и какие бенчмарки реально определяют выбор. С конфигурациями развёртывания от одной RTX 4090 до кластера A100.TL;DR: 9 логических агентов = 3-4 физических модели. Минимальный сетап — 24 GB VRAM (одна RTX 4090). Полный продакшен — 211 GB (четыре A100). Интерактивный дашборд

продолжить чтение

Оставлено в

Ещё один архитектор правил для ИИ-агентов

Проблема, которую ощущают многие, но решают немногие.Вы запускаете Zed, Kiro, Cline, Claude Code или Qwen. Описываете задачу. Агент создаёт код. И вот он перед вами... Иногда качественный. Иногда — беспорядочная смесь чужих стандартов, случайных шаблонов и игнорирование структуры вашего проекта.Вы поправляете. Объясняете снова. Поправляете. Через час понимаете: вы тратите больше времени на управление агентом, чем на саму задачу.Знакомо?Почему агенты «тупят»Дело не в модели. Claude, GPT, Gemini, Qwen — все они достаточно "умные".Проблема в другом: У агента нет контекста вашего проекта.

продолжить чтение

Оставлено в

Как научить планшет видеть несколько объектов в кадре одновременно: multi-label классификация

Представьте: вам нужно научить камеру планшета почти мгновенно определять, что происходит в кадре. И это не просто «автомобиль» или «человек»: нужно различать и связывать разные категории объектов: документы, текст, людей, QR и штрихкоды. Казалось бы, достаточно взять предобученную модель и заточить для запуска на конкретном железе, в нашем случае это планшет KVADRA_T. Но задача оказалась сложнее из-за доменов классов. Для них не нашлось моделей, которые соответствовали заданным в проекте метрикам и времени исполнения.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

qwen.

Хайп закончился: российский бизнес массово сворачивает GenAI-проекты

Qwen 3.5 с 397 млрд параметров запустили на iPhone 17 Pro: для этого понадобился внешний SSD

Alibaba сократила более 66 тыс. сотрудников за год на фоне смены стратегии в сторону ИИ

Как мы внедрили ИИ для обработки рекламаций на производстве

Китай приравнял ИИ к обороне: технологии впервые стали приоритетом №1 в пятилетке

Семантический поиск vs полнотекстовый: сравниваем три embedding-модели на 10 000 категорий Ozon

Облачные модели Ollama в задачах code review — честное сравнение на примерах

9 агентов, 6 моделей, 1 сервер: как собрать ИИ-компанию на open-source в марте 2026

Ещё один архитектор правил для ИИ-агентов

Как научить планшет видеть несколько объектов в кадре одновременно: multi-label классификация

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

qwen.