ai.
Моя RAG-система: как я за 8 дней собрал RAG для своего сайта визитки
За 8 дней частичной занятости я собрал RAG-систему на NestJS + PostgreSQL (pgvector), которая обрабатывает ~11 000 чанков документов. Первая версия отвечала около 4 минут, после оптимизации - 40–60 секунд. Главный вывод: RAG - это не «векторный поиск + LLM», а в первую очередь подготовка данных, фильтрация контекста и аккуратная работа с промптами.Зачем я это делалГлавной целью проекта было создать RAG-систему, которая могла бы отвечать на вопросы на основе моих знаний и опыта, это позволило понять реальную работу с большим количеством документов.RAG-система была интегрирована с моим сайтом-визиткой
Как я сделал классификатор обращений для телеком-поддержки на своей LLM за $10-месяц
Привет, Хабр! Расскажу как я fine-tuned модель Qwen2.5-0.5B для автоматической классификации обращений в службу поддержки, сквантовал её до 350 MB и задеплоил на дешёвый VPS.TL;DR: Модель классифицирует обращения клиентов по intent, category, urgency, sentiment и автоматически определяет куда маршрутизировать тикет. Работает на CPU, данные не покидают ваш сервер.Демо | API DocsЗачем это нужноВ типичной службе поддержки телеком-оператора:60% времени оператора уходит на понимание "а что вообще хочет клиент"
ИИ помог написать Linux-вредонос VoidLink всего за 6 дней
Исследователи Check Point выяснили, что продвинутый Linux-вредонос VoidLink, обнаруженный в декабре 2025 года, был создан преимущественно с помощью искусственного интеллекта. По данным отчёта
Альтман врал годами. Теперь у OpenAI $1 триллион долга
Для Альтмана игра почти оконченаФото: Lucas K, Unsplash
Возможно, именно использование вайб-кодинга стало причиной роста числа новых iOS-приложений
Данные Sensor Tower и Wells Fargo Securities свидетельствуют о том, что инструменты для разработки приложений с использованием ИИ наводняют iOS App Store. По данным
Компания Anthropic переписала правила Claude
Компания Anthropic выпустила переработанную версию основополагающего документа, определяющего ценности и поведение Claude. Эта конституция объемом в 10 000 слов написана в первую очередь для самого ИИ и открыто затрагивает вопросы о возможном наличии сознания.
За пределами LLM: детерминированный движок рассуждения на конечном алфавите
Часть 1. Детерминированный движок рассуждения на конечной таблице операции (в перспективе — замена LLM)Когда речь заходит о больших языковых моделях, все сразу отмечают их талант к сочинению и пересказу текстов. Но вот встроить такую модель в реальный продукт — задача куда более каверзная, чем кажется на первый взгляд. На практике вылезают три системных «подводных камня», из‑за которых работать с ними бывает откровенно неудобно.
Исследование Apple: управляемость ИИ зависит от задачи
Новое исследование показало, что управлять языковыми и генеративными AI-моделями сложнее, чем кажется. Эффективность таких моделей зависит от конкретной задачи, самого алгоритма и использованного запроса.

