- BrainTools - https://www.braintools.ru -

Mistral AI выпустила Small 3 — мощную языковую модель с 24 миллиардами параметров

Mistral AI выпустила Small 3 — новую языковую модель с 24 миллиардами параметров, которая по производительности не уступает гораздо более крупным моделям от Meta* и OpenAI. Компания также переходит на более либеральную лицензию Apache 2.0.

Mistral AI выпустила Small 3 — мощную языковую модель с 24 миллиардами параметров - 1

Компания Mistral AI заявляет, что Small 3 [1] обеспечивает такую же производительность, как модели в три раза больше по размеру, при этом используя всего 24 миллиарда параметров. Модель, оптимизированная для низкой задержки и локального развёртывания, является продолжением предыдущей версии Mistral, выпущенной в сентябре 2024 года [2].

В тестах Small 3 показал результаты наравне со значительно более крупными моделями, включая Meta Llama-3.3-70B [3]Qwen2.5-32B [4] и GPT-4o-mini. Модель достигла 81% точности в тесте MMLU [5], обрабатывая 150 токенов в секунду, что делает её одной из самых эффективных моделей в своей категории, по мнению Mistral.

Mistral Small 3 оптимизирован для обеспечения качества и низкой задержки.

Mistral Small 3 оптимизирован для обеспечения качества и низкой задержки.

Новая модель создана для выполнения повседневных задач без использования дорогостоящего оборудования. Она может быстро отвечать на сообщения в чате, выполнять определённые функции, адаптироваться к специализированным областям и работать на одном графическом процессоре, что делает её практичной для использования в реальных условиях.

По словам Мистраля, несколько отраслей уже тестируют эту технологию. Банки используют её для выявления мошенничества, а поставщики медицинских услуг и производители тестируют её для обслуживания клиентов и анализа их отзывов. Компании, занимающиеся робототехникой, также изучают потенциальные варианты использования.

Mistral-Small-24B демонстрирует высокую производительность в тесте мультимодального понимания MMLU. 

Mistral-Small-24B демонстрирует высокую производительность в тесте мультимодального понимания MMLU. 
 В тестах, разработанных для задач по программированию и математике, Mistral Small показывает такие же результаты, как и более крупные модели. 

В тестах, разработанных для задач по программированию и математике [6], Mistral Small показывает такие же результаты, как и более крупные модели. 
Эти тесты проверяют, помимо прочего, насколько хорошо модели выполняют инструкции и сохраняют информацию в своей «памяти».

Эти тесты проверяют, помимо прочего, насколько хорошо модели выполняют инструкции и сохраняют информацию в своей «памяти».

Модель теперь доступна на платформе Mistral [7] и у партнёров, включая Hugging Face [8]Ollama [9]Kaggle [10]Together AI [11] и Fireworks AI [12]. Планируется запуск на других платформах.

В этом выпуске Mistral переходит от собственной лицензии MRL (Mistral Research License) к более свободной лицензии Apache 2.0 [13]. Это изменение позволяет пользователям свободно использовать, изменять и распространять модели даже в коммерческих целях. Компания продолжит предлагать специализированные коммерческие модели для конкретных задач.

В ближайшие недели Mistral планирует выпустить дополнительные модели, уделяя особое внимание [14] улучшенным возможностям логического мышления [15]. Компания позиционирует Small 3 как дополнение к более крупным моделям логического мышления с открытым исходным кодом, таким как Deepseek [16], пытаясь достичь аналогичных возможностей при меньших вычислительных мощностях.

Компания Mistral заняла свою нишу на европейском рынке AI и является практически единственным поставщиком соответствующих моделей AI. Хотя её модели пока не соответствуют возможностям мультимодальных систем, таких как Sonnet 3.5, компания продолжает набирать обороты. Её последнее предложение, Pixtral [17], знаменует собой первый шаг компании в области визуально-языковых моделей. 

*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации

Источник [18]

Автор: mefdayy

Источник [19]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/11747

URLs in this post:

[1] Small 3: https://mistral.ai/small-3

[2] предыдущей версии Mistral, выпущенной в сентябре 2024 года: https://the-decoder.com/french-ai-startup-mistral-overhauls-its-chat-service/

[3] моделями, включая Meta Llama-3.3-70B: https://ai.meta.com/llama

[4] Qwen2.5-32B: https://huggingface.co/Qwen

[5] тесте MMLU: https://arxiv.org/abs/2009.03300

[6] математике: http://www.braintools.ru/article/7620

[7] платформе Mistral: https://mistral.ai/

[8] Hugging Face: https://huggingface.co/

[9] Ollama: https://ollama.ai/

[10] Kaggle: https://kaggle.com/

[11] Together AI: https://together.ai/

[12] Fireworks AI: https://fireworks.ai/

[13] лицензии Apache 2.0: https://www.apache.org/licenses/LICENSE-2.0

[14] внимание: http://www.braintools.ru/article/7595

[15] мышления: http://www.braintools.ru/thinking

[16] Deepseek: https://the-decoder.com/deepseeks-latest-r1-zero-model-matches-openais-o1-in-reasoning-benchmarks/

[17] Pixtral: https://the-decoder.com/mistral-ai-adds-flux-image-generation-and-web-search-to-le-chat-launches-pixtral-large/

[18] Источник: https://the-decoder.com/new-mistral-small-3-does-more-with-less-under-apache-license/

[19] Источник: https://habr.com/ru/companies/bothub/news/878409/?utm_source=habrahabr&utm_medium=rss&utm_campaign=878409

www.BrainTools.ru

Rambler's Top100