- BrainTools - https://www.braintools.ru -

Ollama 0.7.0 теперь поддерживает мультимодальные модели на своем «движке»

Вышла Ollama версии 0.7.0, которая расширила поддержку мультимодальных моделей с помощью нового специально разработанного движка. Теперь Ollama не зависит от проекта ggml-org/llama.cpp, сосредоточившись вместо этого на создании собственной надёжной основы для мультимодальных систем.

Заявлена поддержка ключевых мультимодальных моделей, таких как Meta Llama 4, Google Gemma 3, Qwen 2.5 VL и Mistral Small 3.1 и других. Новый движок обеспечивает полную внутреннюю обработку этих моделей, что позволяет повысить надёжность, точность и масштабируемость для таких задач, как обработка изображений, речь и закладывает основу для поддержки генерации изображений и видео в мультимодальном режиме.

Каждая модель теперь полностью автономна, что устраняет необходимость в сложной логике [1] оркестрации между визуальными кодировщиками и текстовыми декодерами. Это упрощает разработку и уменьшает количество ошибок. Для повышения точности Ollama вводит обработку метаданных во время обработки изображений, обеспечивая правильную позиционную информацию и разделение на пакеты для поддержания качества вывода.

Ollama 0.7.0 теперь поддерживает мультимодальные модели на своем «движке» - 1

Также в сотрудничестве с партнерами-производителями аппаратного обеспечения произведена оптимизация использования памяти [2], включая кэширование изображений и усовершенствования KV-кэша, Заявлена поддержка таких вещей, как скользящее окно внимания [3] (sliding window attention) в Gemma 3 и фрагментированного внимания (chunked attention ) для Meta Llama 4 Scout и Maverick models.

Дополнительные улучшения релиза включают поддержку изображений WebP, исправления ошибок для Windows и совместимости с графическими процессорами NVIDIA, улучшенный импорт моделей safetensors и усовершенствования API.

Подробнее об релизе: https://ollama.com/blog/multimodal-models [4]

Автор: akdengi

Источник [5]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/15320

URLs in this post:

[1] логике: http://www.braintools.ru/article/7640

[2] памяти: http://www.braintools.ru/article/4140

[3] внимания: http://www.braintools.ru/article/7595

[4] https://ollama.com/blog/multimodal-models: https://ollama.com/blog/multimodal-models

[5] Источник: https://habr.com/ru/companies/hostkey/news/910576/?utm_source=habrahabr&utm_medium=rss&utm_campaign=910576

www.BrainTools.ru

Rambler's Top100