искусственный интеллект. - страница 28

Зачем GenAI-ассистенту platform logic: как управлять источниками, evidence и ответами

GenAI-ассистент может довольно быстро начать отвечать "по теме": находить релевантные фрагменты, собирать уверенный текст и создавать ощущение, что система уже работает.Если подключить LLM к корпоративным документам через RAG, подобрать параметры поиска, немного почистить контекст и добавить хороший prompt, первые результаты часто выглядят обнадеживающе. Пользователи начинают пробовать систему, появляются первые метрики использования, а сама идея быстро кажется готовой к расширению.Но для продуктового контура этого недостаточно.

продолжить чтение

Skills исправляют привычки MCP исправляет память

Я долго пытался решить одну проблему Claude Code в разных сессиях ведет себя поразному и это иногда просто ломает логику работысначала думал что дело в промптах потом начал думать что проблема в контексте но в итоге стало понятно что все немного глубже.

продолжить чтение

Как мы реализовали оптимальное обучение моделей в Luna Line. Часть 1. Классификация

Привет, Хабр! Меня зовут Анастасия Белозерова, я тимлид исследовательской команды, работающей над продуктом Luna Line

продолжить чтение

Акции Getty Images выросли на 145% после сообщения о заключении сделки с OpenAI

Акции Getty Images Holdings выросли на 145% после объявления о заключении сделки с OpenAI, пишет Bloomberg. Изображения из библиотеки Getty Images будут показывать в функциях поиска и обнаружения контента ChatGPT. Стороны не сообщили о финансовых условиях сделки и подробностях о том, будут ли изображения Getty использоваться для обучения будущих моделей искусственного интеллекта OpenAI.

продолжить чтение

Уволен, но не ушёл: два слоя защиты от инсайдера

Начало историиПонедельник, 9:45. Вторая неделя на должности IT-директора. Голова идёт кругом: план закупок на квартал, проект бюджета на следующий год, аудит безопасности, тендер на новые серверы 1С, длинный список невыполненных задач от предшественника и очередь желающих получить точный ответ — «когда наконец 1С начнёт нормально работать?».В коридоре встречаю генерального директора.— Слушай. Ко мне в личку пишут двое наших бывших сотрудников. Интересуются новостями из вчерашней корпоративной рассылки. Почему они её получают?

продолжить чтение

Иллюзия контроля: почему промпты не защищают ИИ‑агентов

От Permission Boundary Bypass до языка Дика: почему безопасность агента должна жить в runtime, а не в system prompt.Эпоха простых чат‑ботов подошла к концу. Сегодня мы строим автономных ИИ‑агентов, которые через MCP

продолжить чтение

Галлюцинации недели: SpaceX покупает Cursor за $60 млрд, GLM-5.2 догоняет Opus, а Midjourney просвечивает людей звуком

продолжить чтение

Локальный RAG без магии: sources, timings, request_id и отказ от генерации

На практике было интересно не просто вызвать локальную LLM из Python а понять, в какой момент такой вызов превращается в backend-систему: с API-контрактом, логами, request_id, источниками ответа, индексом документов, диагностикой и честным отказом отвечать, если данных в документах нет.В этой статье показываю не теорию RAG, а небольшой локальный проект, где хорошо видно, какие инженерные проблемы появляются вокруг LLM:что попадает в prompt;какие sources были найдены;сколько заняли retrieval и generation;когда backend должен не вызывать LLM;почему stale index может давать странное поведение;

продолжить чтение

Где заканчивается вызов LLM и начинается backend система: локальный RAG на FastAPI и Ollama

На практике хотел понять где заканчивается простой вызов локальной LLM и начинается backend система: с API контрактом, логированием, request_id, источниками, индексом документов, диагностикой и честными ограничениями.Сначала проект выглядел просто: frontend отправляет вопрос, FastAPI принимает POST /ask, backend вызывает локальную модель через Ollama и возвращает ответ. Это уже работало, но стало понятно такой вариант ещё нельзя назвать системой по документации. Модель отвечает, но непонятно на что она опирается, откуда взяла ответ, сколько времени занял каждый этап и что делать если документы изменились.

продолжить чтение

Архитектура высокоэффективных нейросетевых вычислений на C++ для прогнозирования динамики ВВП

Введение Принято считать, что для анализа макроэкономики и прогнозирования ВВП необходимы мощные серверы. Обычно разработчики используют Python и тяжелые библиотеки вроде TensorFlow или PyTorch. Однако бывают случаи когда надо чтобы модель была доступна на обычном недорогом ноутбуке или мы хотим применить наработки модели и переложить их на платы ардуино с лимитом памяти 32 кб и ценой в розничном магазине 300 - 400 рублей за штуку.

продолжить чтение