- BrainTools - https://www.braintools.ru -
Вышла Ollama версии 0.7.0, которая расширила поддержку мультимодальных моделей с помощью нового специально разработанного движка. Теперь Ollama не зависит от проекта ggml-org/llama.cpp, сосредоточившись вместо этого на создании собственной надёжной основы для мультимодальных систем.
Заявлена поддержка ключевых мультимодальных моделей, таких как Meta Llama 4, Google Gemma 3, Qwen 2.5 VL и Mistral Small 3.1 и других. Новый движок обеспечивает полную внутреннюю обработку этих моделей, что позволяет повысить надёжность, точность и масштабируемость для таких задач, как обработка изображений, речь и закладывает основу для поддержки генерации изображений и видео в мультимодальном режиме.
Каждая модель теперь полностью автономна, что устраняет необходимость в сложной логике [1] оркестрации между визуальными кодировщиками и текстовыми декодерами. Это упрощает разработку и уменьшает количество ошибок. Для повышения точности Ollama вводит обработку метаданных во время обработки изображений, обеспечивая правильную позиционную информацию и разделение на пакеты для поддержания качества вывода.

Также в сотрудничестве с партнерами-производителями аппаратного обеспечения произведена оптимизация использования памяти [2], включая кэширование изображений и усовершенствования KV-кэша, Заявлена поддержка таких вещей, как скользящее окно внимания [3] (sliding window attention) в Gemma 3 и фрагментированного внимания (chunked attention ) для Meta Llama 4 Scout и Maverick models.
Дополнительные улучшения релиза включают поддержку изображений WebP, исправления ошибок для Windows и совместимости с графическими процессорами NVIDIA, улучшенный импорт моделей safetensors и усовершенствования API.
Подробнее об релизе: https://ollama.com/blog/multimodal-models [4]
Автор: akdengi
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/15320
URLs in this post:
[1] логике: http://www.braintools.ru/article/7640
[2] памяти: http://www.braintools.ru/article/4140
[3] внимания: http://www.braintools.ru/article/7595
[4] https://ollama.com/blog/multimodal-models: https://ollama.com/blog/multimodal-models
[5] Источник: https://habr.com/ru/companies/hostkey/news/910576/?utm_source=habrahabr&utm_medium=rss&utm_campaign=910576
Нажмите здесь для печати.