slm.

OCC-RAG: компактные модели, которые отвечают только по источникам

Привет, Хабр! На связи команда Optimal Cognitive Core (OCC) из AIRI. Развитие языковых моделей в последние годы определяется масштабом: каждое новое поколение вмещает в веса всё больше знаний о мире. Но огромная доля практических задач выигрывает тогда, когда модель демонстрирует не свою энциклопедичность, а способность рассуждать и анализировать предоставленный контекст. Из этого наблюдения и выросло OCC — наше семейство компактных языковых моделей (SLM), которые имеют сильные когнитивные способности, не обладая при этом большим багажом «вызубренной» информации.

продолжить чтение

Оставлено в

Geometry > Scale: Как 40М параметров на решетке E8 обходят классические трансформеры

Ребята, кажется, мы уперлись в стену. Пока гиганты наращивают параметры и жгут тераватты, пытаясь выжать каплю разума из статистики, я решил пересмотреть сам фундамент. Проблема не в данных, проблема в «вязкости» стандартного Attention.Суть метода: Я заменил стандартный механизм внимания на нативную

продолжить чтение

Оставлено в

Как сделать (очень) маленькие LLM действительно полезными

Команда AI for Devs подготовила перевод статьи о том, как выжать максимум из маленьких языковых моделей. Автор показывает, что даже очень компактные LLM могут быть полезны в реальных задачах — если правильно работать с контекстом, embeddings и RAG.

продолжить чтение

Оставлено в

Плато возможностей, или Куда катится машинное обучение в 2026 году

2025 год

продолжить чтение

Оставлено в

Тренды архитектуры ПО — взгляд InfoQ 2025

Ключевые идеиПока все вокруг активно прикручивают большие языковые модели, новые эксперименты всё чаще уходят в сторону более компактных и специализированных SLM и агентного ИИ.RAG уже стал почти обязательной надстройкой, чтобы вытянуть качество ответов из LLM, и теперь архитекторы стараются проектировать системы так, чтобы его было проще встроить.

продолжить чтение

Оставлено в

Корпоративный ИИ: краткое пособие для ИТ-директора

ВведениеДанная статья была написана для крупнейшего сообщества цифровых управленцев я-ИТ-ы. Ее основная цель — дать тем, на чьих плечах сейчас лежит ответственность за выстраивание ИТ-инфраструктуры компаний, понимание технологического «сегодня» в сфере искусственного интеллекта (ИИ), решений, технологий, которые применяются и уже дают результат. И, что самое важное, обозначить вектор развития для понимания технологического «завтра», чтобы инфраструктура и процессы строились с учетом всех изменений, происходящих в этой весьма динамичной сфере.

продолжить чтение

Оставлено в

Nvidia призывает ИИ-индустрию переосмыслить агентный подход в пользу компактных моделей

По мнению специалистов Nvidia, индустрия слишком увлеклась крупными языковыми моделями (LLM) для работы агентов — подходом, который, как они утверждают, экономически и экологически нежизнеспособен.В недавней научной статье они предлагают пересмотреть стратегию: большинство агентов, уверены авторы, могут работать не хуже, если использовать компактные языковые модели (SLM), и призывают компании изменить подход.В 2024 году рынок API LLM для агентных систем оценивался в 5,6 млрд $, но расходы на облачную инфраструктуру для их работы достигли 57 млрд $ — разрыв 10 к 1.

продолжить чтение

Оставлено в

Языковые модели для бизнеса: сравниваем малые (SLM) и большие (LLM) модели

Большие языковые модели (LLM) звучат впечатляюще, но всегда ли нужно их использовать? Разберемся, в каких случаях стоит использовать LLM, а когда использование малых языковых моделей (SLM) окажется более разумным и экономичным решением без потери качества.В последние годы технологии искусственного интеллекта и обработки естественного языка (NLP) уверенно вошли в бизнес-практику. Их используют повсеместно — от анализа поведения клиентов до поддержки пользователей с помощью чат-ботов, автоматизированного маркетинга и многого другого.

продолжить чтение

Оставлено в

Новые модели искусственного интеллекта Phi-4 от Microsoft сочетают в себе большую производительность и компактность

Microsoft представила новый класс высокоэффективных моделей AI, которые обрабатывают текст, изображения и речь одновременно, требуя при этом значительно меньше вычислительной мощности, чем существующие системы. Новые модели Phi-4 , выпущенные сегодня, представляют собой прорыв в разработке малых языковых моделей (SLM), которые предоставляют возможности, ранее зарезервированные для гораздо более крупных систем AI.

продолжить чтение

Оставлено в

Как масштабирование во время тестирования раскрывает скрытые способности к рассуждению в небольших языковых моделях

Согласно новому исследованию Шанхайской лаборатории искусственного интеллекта, очень маленькие языковые модели (SLM) могут превзойти ведущие большие языковые модели (LLM) в задачах рассуждения. Авторы показывают, что при наличии правильных инструментов и методов масштабирования во время тестирования SLM с 1 миллиардом параметров может превзойти LLM 405B в сложных математических тестах.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

slm.

OCC-RAG: компактные модели, которые отвечают только по источникам

Geometry > Scale: Как 40М параметров на решетке E8 обходят классические трансформеры

Как сделать (очень) маленькие LLM действительно полезными

Плато возможностей, или Куда катится машинное обучение в 2026 году

Тренды архитектуры ПО — взгляд InfoQ 2025

Корпоративный ИИ: краткое пособие для ИТ-директора

Nvidia призывает ИИ-индустрию переосмыслить агентный подход в пользу компактных моделей

Языковые модели для бизнеса: сравниваем малые (SLM) и большие (LLM) модели

Новые модели искусственного интеллекта Phi-4 от Microsoft сочетают в себе большую производительность и компактность

Как масштабирование во время тестирования раскрывает скрытые способности к рассуждению в небольших языковых моделях

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

slm.