ai. - страница 60

ai.

Моя RAG-система: как я за 8 дней собрал RAG для своего сайта визитки

За 8 дней частичной занятости я собрал RAG-систему на NestJS + PostgreSQL (pgvector), которая обрабатывает ~11 000 чанков документов. Первая версия отвечала около 4 минут, после оптимизации - 40–60 секунд. Главный вывод: RAG - это не «векторный поиск + LLM», а в первую очередь подготовка данных, фильтрация контекста и аккуратная работа с промптами.Зачем я это делалГлавной целью проекта было создать RAG-систему, которая могла бы отвечать на вопросы на основе моих знаний и опыта, это позволило понять реальную работу с большим количеством документов.RAG-система была интегрирована с моим сайтом-визиткой

продолжить чтение

Как я сделал классификатор обращений для телеком-поддержки на своей LLM за $10-месяц

Привет, Хабр! Расскажу как я fine-tuned модель Qwen2.5-0.5B для автоматической классификации обращений в службу поддержки, сквантовал её до 350 MB и задеплоил на дешёвый VPS.TL;DR: Модель классифицирует обращения клиентов по intent, category, urgency, sentiment и автоматически определяет куда маршрутизировать тикет. Работает на CPU, данные не покидают ваш сервер.Демо | API DocsЗачем это нужноВ типичной службе поддержки телеком-оператора:60% времени оператора уходит на понимание "а что вообще хочет клиент"

продолжить чтение

ИИ помог написать Linux-вредонос VoidLink всего за 6 дней

Исследователи Check Point выяснили, что продвинутый Linux-вредонос VoidLink, обнаруженный в декабре 2025 года, был создан преимущественно с помощью искусственного интеллекта. По данным отчёта

продолжить чтение

Альтман врал годами. Теперь у OpenAI $1 триллион долга

Для Альтмана игра почти оконченаФото:  Lucas K, Unsplash

продолжить чтение

В мире существует уже более 1 млн сайтов в домене .ai

продолжить чтение

Возможно, именно использование вайб-кодинга стало причиной роста числа новых iOS-приложений

Данные Sensor Tower и Wells Fargo Securities свидетельствуют о том, что инструменты для разработки приложений с использованием ИИ наводняют iOS App Store. По данным 

продолжить чтение

Компания Anthropic переписала правила Claude

Компания Anthropic выпустила переработанную версию основополагающего документа, определяющего ценности и поведение Claude. Эта конституция объемом в 10 000 слов написана в первую очередь для самого ИИ и открыто затрагивает вопросы о возможном наличии сознания.

продолжить чтение

За пределами LLM: детерминированный движок рассуждения на конечном алфавите

Часть 1. Детерминированный движок рассуждения на конечной таблице операции (в перспективе — замена LLM)Когда речь заходит о больших языковых моделях, все сразу отмечают их талант к сочинению и пересказу текстов. Но вот встроить такую модель в реальный продукт — задача куда более каверзная, чем кажется на первый взгляд. На практике вылезают три системных «подводных камня», из‑за которых работать с ними бывает откровенно неудобно.

продолжить чтение

Исследование Apple: управляемость ИИ зависит от задачи

Новое исследование показало, что управлять языковыми и генеративными AI-моделями сложнее, чем кажется. Эффективность таких моделей зависит от конкретной задачи, самого алгоритма и использованного запроса.

продолжить чтение

Созданный ИИ препарат против Паркинсона допущен к клиническим испытаниям

продолжить чтение

Rambler's Top100