qwen. - страница 3

Локальный Tool Calling или «У нас есть BFCL-V4 дома»

В своей прошлой статье я рассказывал о компактной модели, которая по бенчмаркам смогла превзойти модели в 10 раз больше ее самой. О том, что это стало возможным благодаря особому подходу к обучения самой модели и что такую модель вполне реально запустить у себя локально.Однако, когда дело касается локального запуска, думаю, далеко немногие из нас запускают модели в BF16 через vLLM на Nvidia H100. А значит, все эти красивые результаты по бенчмаркам на практике, вероятнее всего, очень далеки от того, что мы получим на практике.И я решил это проверить.

продолжить чтение

Qwen-Image обновилась к Новому году и заметно прибавила в качестве

продолжить чтение

ИИ-индустрия Китая превысила 1 трлн юаней — рост более 40% за год

Объем ИИ-индустрии Китая превысил

продолжить чтение

Маленькая модель обыграла большие: почему Nanbeige4-3B меняет правила игры

продолжить чтение

Китай приравнял ИИ к стихийным бедствиям и эпидемиям — власти обновили план реагирования на катастрофы

продолжить чтение

Xiaomi Mimo V2: Как бесплатная модель от вендора смартфонов обошла Qwen 235B в генерации образовательного контента

Мы ожидали увидеть очередную "легкую" модель для телефонов, а нашли hidden gem, который генерирует учебные материалы лучше, чем модели в 100 раз больше. Подробный разбор с JSON-ами, промптами и сравнением.Скрытый текстXiaomi MiMo V2 Flash — бесплатная модель на OpenRouter, которая:🏆 Генерирует лучшие педагогические сценарии среди протестированных моделей⚡ Работает в 3x быстрее Qwen 3 (11 сек vs 34 сек)🎯 100% валидный JSON с первой попытки💰 Стоит $0.00 (пока)Когда использовать: EdTech, онбординг, soft skills, обучающие боты.

продолжить чтение

Qwen выпустила модель, которая разделяет изображения на редактируемые слои, подобно Photoshop

продолжить чтение

Разбираем три новых Qwen: нейросеть в роли диктора, художника и писателя

Привет! Я Антон, инженер по информационной безопасности в Selectel

продолжить чтение

Исследователи Huawei представили WindowSeat — диффузионный трансформер для удаления отражений на фотографиях

Команда исследователей лаборатории Huawei Bayer Lab и Швейцарской высшей технической школы Цюриха (ETH Zurich) представила ​​WindowSeat — модель машинного обучения для удаления отражений с фотографий. Модель адаптировали для типичных пользовательских сценариев: съёмка из окна транспорта, фотографирование предметов через стекло витрин и снимки городских пейзажей.

продолжить чтение

Как написать AI-ТЗ из одной фразы заказчика: пошаговая инструкция по методике SARD от идеи до спецификации требований

АннотацияАктуальность

продолжить чтение

123456...10...11
Rambler's Top100