llm-архитектура.

За пределами LLM: детерминированный движок рассуждения на конечном алфавите

Часть 1. Детерминированный движок рассуждения на конечной таблице операции (в перспективе — замена LLM)Когда речь заходит о больших языковых моделях, все сразу отмечают их талант к сочинению и пересказу текстов. Но вот встроить такую модель в реальный продукт — задача куда более каверзная, чем кажется на первый взгляд. На практике вылезают три системных «подводных камня», из‑за которых работать с ними бывает откровенно неудобно.

продолжить чтение

Оставлено в

Как я делал свою языковую модель: история эксперимента

Уже больше года назад у меня зародилась идея создать свою архитектуру языковой модели. Традиционные модели, "думающие" на уровне токенов мне решительно не нравились. Колоссальный вычислительный бюджет на то, чтобы просто предсказать один токен. Логичным мне казалось оторвать мышление модели от токенов, перенеся его в латентное пространство. Примерно полгода назад я начал первые практические эксперименты и сейчас получил первые практические результаты. Поскольку уровень подготовки читателей очень сильно различается, в статье не будет глубоких технических разборов, а скорее история эксперимента.

продолжить чтение

Оставлено в

AiConf 2026: нам нужен именно ты! Что нового?

Привет, трудяга! На носу одно из самых волнующих мероприятий этой весны — AiConf 2026, которое традиционно проходит в Москве. Кто был на наших конференциях, тот знает, что это кладезь полезной информации, нетворкинга и вдохновения.В новом году пришло время перемен: мы проанализировали отзывы и предложения наших участников, докладчиков и партнёров, и пришли к выводу, что AiConf 2026 года будет другой. С этого момента AiConf становится конференцией развития.

продолжить чтение

Оставлено в

ИИ-агенты на рынке недвижимости: эволюция

Всем привет! Меня зовут Алина. На связи снова компания Домклик. Сегодня мы обсудим очень горячую тему этого года — разработку ИИ-агентов. Недавно я выступила с докладом на конференции HighLoad++ 2025, и, думаю, всем будет интересно узнать, как мы создавали ИИ-агентов для рынка недвижимости прошедшим летом. Несмотря на уже существовавшие Transformer-модели, массового интереса вокруг агентов тогда не наблюдалось. Однако в этом году ситуация кардинально изменилась.Эволюция чат-бота до агента-консультанта

продолжить чтение

Оставлено в

Искусственный интеллект без иллюзий: как не сжечь бюджет компании на хайпе

продолжить чтение

Оставлено в

Как мы сделали аналитику контакт-центра на LLM в 7 раз дешевле

ВведениеМы устали слушать звонки.Не из-за любопытства - просто это занимало слишком много времени.Из 5 минут разговора рождались 20 минут отчёта в Excel, где человек вручную отмечал:«вежлив ли оператор», «упомянул ли цену», «отработал ли возражение».Мы построили систему, которая делает это автоматически:Whisper → QLoRA → отчёт → BI.Она оценивает звонки, считает метрики и не жалуется на переработки.Анализ стоит $0.0003 за звонок, и работает это лучше, чем ожидалось.Но не идеально.вот обновлённый фрагмент раздела 1. “От Excel к первому прототипу”

продолжить чтение

Оставлено в

Я «уволил» LLM с должности «мозга» проекта. И его производительность взлетела

(...или почему будущее AI — не в увеличении контекстного окна, а в создании структурированной "памяти")Помните свой первый "вау-эффект" от LLM?

продолжить чтение

Оставлено в

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1

Что будет, если к опасному запросу в LLM приписать специально подобранную строку токенов? Вместо отказа модель может послушно сгенерирует подробный ответ на запрещённую тему — например, как ограбить магазин. Именно так работают состязательные суффиксы: они заставляют LLM игнорировать ограничения и отвечать там, где она должна сказать «опасно».

продолжить чтение

Оставлено в

Как работают серверы MCP: компоненты, логика и архитектура

Закулисный взгляд на основные компоненты серверов MCP — от обработки запросов и управления сессиями до кеширования и хранилищ контекста.Современные ассистенты на базе искусственного интеллекта (ИИ) столь же эффективны, насколько развитыми данными и инструментами они располагают.КДПВ, но в тему

продолжить чтение