RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain
PM: Нам нужно актуализировать базу знаний для ИИ-ассистента, там изменилась инструкция по смене пароля.DevOps: Не проблема, сейчас запущу скрипт, через два часа всё обновится. Предупреди Заказчика о недоступности сервиса.Знакомая ситуация? Полная зачистка векторной базы и реиндексация всех имеющихся документов с остановкой сервиса - решение простое и надёжное, но «прощается» только на этапе прототипа.В продакшене могут быть сотни тысяч документов, живые пользователи и
Облачная LLM на 16 ГБ VRAM — часть 2: LangGraph Server, LangSmith и SDK
Друзья, привет! Возвращаюсь с продолжением.
«Абалкинские чтения» впервые об ИТ в медицине: спектральный анализ МЭГ выявил гендерные пики активности мозга
В Плехановском Университете прошли "Абалкинские чтения". Это было в юбилейный 15-й раз. Новость в том, что в первый раз на этой экономической площадке была заявлена секция с цифровой медициной : "
15 Google-аккаунтов и ни рубля на ИИ: пишу VPN-сервис в одиночку
Меня зовут Стас. Коммерческой разработки — ноль. Ни фронт, ни бэк. Есть MacBook Air M2 на 16 гб и привычка докапываться до сути.
Как мы в отделе документации создали LLM агента для автоматизированного перевода с английского на другие языки
Автор: Александр Казанцев, руководитель отдела документации и контентаПредставьте, что вы поддерживаете крупный проект с документацией на нескольких языках. Каждый раз, когда в английской версии появляется новое руководство или исправляется ошибка, нужно вручную обновлять все переводы в других языковых версиях. Это дорого, медленно и чревато рассинхронизацией. Даже два дополнительных языка начинают создавать проблему, а если их больше?LLM-модели на вашем сервереЛучшие LLM-модели на профессиональных серверах с GPU-картами
Как я обучил GPT с нуля на русском языке — и что из этого получилось
Всё началось с наивной мысли: зачем платить за API или тащить 7B-модель, если мне нужна маленькая модель для простых разговоров на одном языке? Логика казалась железной — большие модели умеют всё и на всех языках сразу, но это же избыточно. 0.7B, заточенная под один язык и один стиль общения, должна справляться не хуже.Спойлер: это было наивно. Но путь оказался ценнее результата.В этой статье — как я прошёл путь от стандартного nanoGPT до кастомной архитектуры с RoPE/SwiGLU/GQA, собрал русскоязычный корпус с нуля, и придумал распределённое обучение на бесплатных Colab-воркерах через Google Drive.Почему не взять готовую модель?
RAG для тех, кто разочаровался: почему retrieval ломается и как это починить
Вы собрали RAG-пайплайн: загрузили документы, нарезали на чанки, сгенерировали эмбеддинги, подключили векторную базу. Задаёте вопрос — модель отвечает уверенно и подробно. Показываете заказчику, тот в восторге. Потом начинается тестирование на реальных вопросах, и оказывается, что на половину из них система отвечает мимо: то находит не тот документ, то находит правильный, но не тот кусок, то вообще ничего релевантного не достаёт и модель уверенно галлюцинирует.
Разобрал фишинг MAX, собрал в нём своего AI-секретаря. Гайд: Claw Bot + MCP
==== Месяц назад мне в личку прислали clk1.me/rD7P5E. Якобы видео с моим участием. Открыл в sandbox, начал ковырять. Под коротким редиректом оказалась инфраструктура из 179 доменов: фишинг-кит с собственной admin-panel, MITM-прокси к настоящему API мессенджера MAX. Разбирался дольше, чем планировал. Опкоды, формат фрейма, флаги push-подписки, антибот-эвристики. Внутреннее устройство мессенджера свалилось мне в голову как побочный эффект.
Создаем ИИ‑модель для генерации музыки на базе Lakh MIDI Dataset
ВведениеГенерация музыки алгоритмами — давно рабочий инструмент индустрии. Этот сегмент прошел путь от простых цепей Маркова, которые предсказывали вероятности перехода одной ноты в другую, до современных трансформеров, способных выдавать многоканальные аудиозаписи.

