llm-архитектура.

Зачем бизнесу LLM: стратегический взгляд

© Генерация автораВведение: почему LLM — ваш следующий стратегический шагЗнакомо: «Давай что-нибудь уже сделаем с этими LLM»? Согласно исследованию McKinsey, 78% руководителей рассматривают ИИ как стратегический актив, но лишь 17% знают, как его внедрить. → McKinsey The state of AI, март 2025Болевые точки бизнеса

продолжить чтение

Квантизация

Автор статьи: Марк Блуменау - Сотрудник научно-исследовательских институтов ФИАН, ИЗМИРАН, ИФТТ, преподаватель Школы Высшей Математики

продолжить чтение

Как научить модель рассуждать, не переобучая её, меньше чем за 10$

ВведениеЭто статья обобщение моего исследования передачи знаний от большой модели с замороженными весами в малую модель, которую мы будем обучать через расширенный механизм кросс внимания или проще говоря через LLM модули. Оригинальное исследование доступно по ссылке: arxiv.org/abs/2502.08213 . Репозиторий с кодом и весами доступен на Hugging Face: LLM модули.

продолжить чтение

Rambler's Top100