slm.

slm.

Тренды архитектуры ПО — взгляд InfoQ 2025

Ключевые идеиПока все вокруг активно прикручивают большие языковые модели, новые эксперименты всё чаще уходят в сторону более компактных и специализированных SLM и агентного ИИ.RAG уже стал почти обязательной надстройкой, чтобы вытянуть качество ответов из LLM, и теперь архитекторы стараются проектировать системы так, чтобы его было проще встроить.

продолжить чтение

Корпоративный ИИ: краткое пособие для ИТ-директора

ВведениеДанная статья была написана для крупнейшего сообщества цифровых управленцев я-ИТ-ы. Ее основная цель — дать тем, на чьих плечах сейчас лежит ответственность за выстраивание ИТ-инфраструктуры компаний, понимание технологического «сегодня» в сфере искусственного интеллекта (ИИ), решений, технологий, которые применяются и уже дают результат. И, что самое важное, обозначить вектор развития для понимания технологического «завтра», чтобы инфраструктура и процессы строились с учетом всех изменений, происходящих в этой весьма динамичной сфере.

продолжить чтение

Nvidia призывает ИИ-индустрию переосмыслить агентный подход в пользу компактных моделей

По мнению специалистов Nvidia, индустрия слишком увлеклась крупными языковыми моделями (LLM) для работы агентов — подходом, который, как они утверждают, экономически и экологически нежизнеспособен.В недавней научной статье они предлагают пересмотреть стратегию: большинство агентов, уверены авторы, могут работать не хуже, если использовать компактные языковые модели (SLM), и призывают компании изменить подход.В 2024 году рынок API LLM для агентных систем оценивался в 5,6 млрд $, но расходы на облачную инфраструктуру для их работы достигли 57 млрд $ — разрыв 10 к 1.

продолжить чтение

Языковые модели для бизнеса: сравниваем малые (SLM) и большие (LLM) модели

Большие языковые модели (LLM) звучат впечатляюще, но всегда ли нужно их использовать? Разберемся, в каких случаях стоит использовать LLM, а когда использование малых языковых моделей (SLM) окажется более разумным и экономичным решением без потери качества.В последние годы технологии искусственного интеллекта и обработки естественного языка (NLP) уверенно вошли в бизнес-практику. Их используют повсеместно — от анализа поведения клиентов до поддержки пользователей с помощью чат-ботов, автоматизированного маркетинга и многого другого.

продолжить чтение

Новые модели искусственного интеллекта Phi-4 от Microsoft сочетают в себе большую производительность и компактность

Microsoft представила новый класс высокоэффективных моделей AI, которые обрабатывают текст, изображения и речь одновременно, требуя при этом значительно меньше вычислительной мощности, чем существующие системы. Новые модели Phi-4 , выпущенные сегодня, представляют собой прорыв в разработке малых языковых моделей (SLM), которые предоставляют возможности, ранее зарезервированные для гораздо более крупных систем AI.

продолжить чтение

Как масштабирование во время тестирования раскрывает скрытые способности к рассуждению в небольших языковых моделях

Согласно новому исследованию Шанхайской лаборатории искусственного интеллекта, очень маленькие языковые модели (SLM) могут превзойти ведущие большие языковые модели (LLM) в задачах рассуждения. Авторы показывают, что при наличии правильных инструментов и методов масштабирования во время тестирования SLM с 1 миллиардом параметров может превзойти LLM 405B в сложных математических тестах.

продолжить чтение

Rambler's Top100