llm. - страница 32

llm.

ADSM: каталоги верхнего уровня

Когда мы работаем в паре с LLM-агентом, нужно принимать во внимание природу нашего "партнёра". Агент опирается только на тексты, действует в пределах ограниченного контекста и не удерживает долгосрочную историю. Поэтому особенно важным становится то, какие тексты мы ему предоставляем и как они структурированы.Ниже - компактная, прикладная схема верхнего уровня, которую можно использовать в собственных проектах. Она помогает держать порядок, снижает шум для модели и делает работу агента более предсказуемой.Общий принципПроект лучше разделять на три смысловых слоя:./ctx/ product/ rules/ agent/

продолжить чтение

Квантовые физики уменьшили и «освободили от цензуры» DeepSeek R1

Им удалось сократить размер ИИ-модели рассуждений более чем наполовину — и они утверждают, что теперь она может отвечать на политически чувствительные вопросы, которые раньше были под запретом в китайских ИИ-системах.TL;DR:Multiverse Computing сжала DeepSeek R1 с помощью квантово-вдохновлённых тензорных сетей: модель стала на 55% компактнее при почти той же точности. По пути они «сняли» китайскую цензуру: модифицированная версия отвечает на табуированные для китайских LLM вопросы примерно как западные модели.

продолжить чтение

Наш новый LLM-based синтез речи

Всем привет! Я Гриша Стерлинг, лид команды TTS в Сбере. Мы сделали новый синтез речи, он на голову лучше старого, особенно по естественности и человечности. Мы так и называем его – «новый синтез», или GigaTTS. Он умеет смеяться, справляется со всеми эмоциями, говорит как живой человек.Сразу предлагаю поболтать с ним в голосовом режиме GigaChat.

продолжить чтение

Почему ChatGPT не знает ваших внутренних данных и как это исправить: простое объяснение RAG

Вы думаете, ChatGPT стал идеальным? Может «загуглить» любой факт, анализировать документы, даже писать код? Попробуйте спросить его про внутренние API вашей компании, корпоративные гайдлайны или правила код-ревью. Он молчит — и не зря. Ведь около 80 % рабочего времени программист тратит на поиск информации во внутренних системах.Сегодня расскажу о технологии, которая решает эту проблему — Retrieval Augmented Generation (RAG).Почему ChatGPT «не знает» ваши документы

продолжить чтение

Зашкаливающая бюрократия на стыке проектов двух крупных банков — мой опыт

Я руководитель проектов, работаю с крупными корпоратами и банками первой пятёрки.Самый ад — это когда проект на стыке двух таких банков. У меня есть живой пример )На этом проекте:Юристы и безопасники из двух банков 4 месяца гоняли договор по кругу. Надо было как-то их договорить и всё-таки начать работать. Договор был рассчитан до 2026 года, а бюджет в системе был заложен только на 2025-й. Бухгалтерия возвращала ошибку Not defined и предлагала запланировать бюджет на 2026 год прямо сейчас.Уволился ключевой подписант.Это был ИТ-директор!

продолжить чтение

Как подключить LLM в n8n без иностранной карты и протестировать сервис бесплатно

Подключить LLM к n8n вроде бы просто, но на практике большинство зарубежных сервисов ломают весь процесс. Чтобы получить ключ, приходится использовать карту иностранного банка и заходить с иностранного IP-адреса. Для российских разработчиков и вайбкодеров это превращается в отдельный квест.Поэтому в инструкции разберем, как настроить работу LLM в n8n без иностранной карты и протестировать все бесплатно. Для примера воспользуемся сервисом VseLLM

продолжить чтение

Coding Agents становятся нормой: AWS Kiro против Cursor, Copilot и Claude Code

продолжить чтение

Нейро-дайджест: ключевые события мира AI за 3-ю неделю ноября 2025

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.Меня зовут Вандер

продолжить чтение

Собираем ROCm 7.1 + PyTorch в Windows под свои GPU

ВведениеВ этой статье я поделюсь опытом сборки еще не вышедшей на момент написания ROCm 7 под свои GPU, даже если их нет в списке официально поддерживаемых архитектур. Затем покажу, как с собранным ROCm 7 собрать PyTorch и запустить ComfyUI. Для примера я буду собирать ROCm под RX 6800 + Radeon 780m. Я предполагаю, что читатель уже знает, что такое ROCm и зачем он нужен.

продолжить чтение

Путешествие в пространство смыслов: как анатомия LLM поможет нам в работе со смыслами и поиске новой теории познания

продолжить чтение

Rambler's Top100