Как нейросеть может быть лучшим ассистентом?. ai.. ai. claude code.. ai. claude code. Dify.. ai. claude code. Dify. langchain.. ai. claude code. Dify. langchain. искусственный интеллект.

Привет, меня зовут Лера. Работаю Head of Community / Marketing в школе Web3-разработки, но времена немного меняются. И тема этой статьи говорит за себя. По долгу своей службы вокруг меня постоянно проводят стримы, связанные с AI: автоматизация, вайбкод, личные ассистенты, оптимизация рабочих процессов. Ресёрч, подключение MCP и конечно же RAG.

Выбирая множество тем из огромного и хайпового сегмента нейросетей сложно ухватиться за что-то очень конкретное. Будь то вводная статья в тему, я бы вам рассказывала про LLM модели. Оно и многим понятно и доступно. Мне кажется, что каждый уже слышал про ChatGPT. Слышал казусные ситуации оттуда или видел аватарки в стиле студии Гибли. Это относительно понятное явление.

Но с другой стороны оно и слишком очевидное. Даже без особых знаний по написанию промптов, любой может найти способ оплатить подписку или протестировать бесплатно. Поговорить с нейросетью и либо закончить на этом, либо же пойти пробовать дальше.

Хотелось рассказать про RAG

RAG (Retrieval-Augmented Generation) — это архитектурный подход в области искусственного интеллекта, который объединяет возможности больших языковых моделей (LLM) с внешними системами поиска информации.

Потому что сегодня без него в серьёзной работе с нейросетями никуда. Но кажется логичным всё же осветить тех, во что этот RAG и встраивается. А именно про AI-агентов или личных AI-ассистентов.

А ещё видимо актуальнее было бы писать про Clawdbot, но это тоже нужно будет посвятить статью!

Поэтому я начну расписывать серию статей, беря за основу именно это, отталкиваясь от сборки чего-то личного под ваши задачи. И небольшая ремарка перед началом — в этих статьях я не буду пересказывать многочасовые стримы. Раскрою тему в немного вольной форме, самостоятельно проведя ресёрч и углубившись в тему ещё раз, отдельно и лично.

Заодно поведаю и вам, приятного прочтения!

Что такое AI агенты?

AI-агент — это продвинутая система на базе большой языковой модели (LLM), которая не просто отвечает на вопросы, а способна действовать самостоятельно для достижения поставленной цели.

Можно сказать, что современный стандарт, который предполагает повсеместное использование агентов. Потому что простой умный чат-бот мало в чём оказывается реально полезным. И наверное НЕ использовать AI-агентов как минимум странно.

Есть реализация полностью автономных, пользователям криптовалют может быть знакома ElizaOS, мы также её у себя отдельно разбирали, и там тема достойна отдельной статьи. Но в ~80% случаев AI-агент это LLM с хорошо прописанным промптом, который включает в себя подходящую роль.

Структура промпта для агента отличается от обычного запроса тем, что она должна быть инструктивной и ограничивающей. Агенту нужно чётко понимать не только «что делать», но и «как думать» и «какие инструменты использовать».

Вот классическая структура (фреймворк) эффективного промпта для AI-агента:

  • Role (Роль): Кем является агент? (Экспертность, тон, бэкграунд).

  • Objective (Цель/Задача): Что именно нужно достичь? Какой финальный результат считается успешным?

  • Context & Constraints (Контекст и Ограничения): В каких условиях работает агент? Что ему запрещено делать?

  • Tools & Resources (Инструменты): К каким API, базам данных или функциям у него есть доступ.

  • Chain of Thought / Process (Процесс мышления): Пошаговый алгоритм действий (Сначала сделай А, затем Б).

  • Output Format (Формат ответа): В каком виде выдать результат (JSON, Markdown, отчёт).

Как нейросеть может быть лучшим ассистентом? - 1

Хороший же AI-агент как раз включает в себя дополнительные инструменты. Не только для большего числа задач, вроде генерации изображения, видео и музыки под них. Но и для более точного и качественного результата.

Пожалуй я могу выделить несколько ключевых инструментов, которые в большинстве случаев оказываются не просто полезными, а жизненно необходимыми.

  1. RAG — упомянут выше, это базис для всех агентов, которые понимают ваши документы, ваши продукты и могут ответить на любой вопрос из базы данных.

  2. Отдельный дип-ресёрч, не кнопочка в LLM, а именно сервис ищущий актуальные данные сегодня, например Tavily с их бесплатным API

  3. Оркестрация — объединение разных AI-агентов в одну команду, чтобы они последовательно или параллельно выполняли чётко поставленные задачи для достижения единой цели

И давайте немного упомяну именно автономных AI, попробуем разграничить разбираемое в этой статье и теорию.

Автономные AI‑агенты — это системы, которые не просто отвечают на запрос, а сами ставят подзадачи, планируют шаги и выполняют действия в внешнем мире (запускают команды, ходят в API, двигают деньги, пишут посты) с минимальным вмешательством человека.

Ключевые характеристики:

  • Цель, а не один запрос: ты задаёшь цель (например, «вести Twitter‑аккаунт» или «торговать мемкоинами по стратегии»), а не единичный промпт.

  • Петля планирования: агент сам составляет план (sub‑goals), рефлексирует, корректирует стратегию.

  • Доступ к инструментам: shell, HTTP‑API, блокчейн‑SDK, базы данных, браузер и т.д.

  • Автономный цикл: план → действие → наблюдение → рефлексия → следующий шаг без постоянных ручных подтверждений.

Вот написанные агенты на фреймворке ElizaOS сами по себе пишут твиты, проводят торговые операции в криптовалюте и просто живут без вмешательства человека. Они не решают ваши задачи, они постоянно решают поставленные задачи исходя из своих планов/ожиданий и хотелок. Насколько вообще уместно говорить о личных желаниях нейросети.

Ну вот вам вводная информация по теме для последующих статей, а сейчас посмотрим на самое начало. Хотим AI-агента для какой-либо задачи, как его создать, что использовать?

Сложность реализации: развернуть в докере -> прописать конфинги -> написать “приложение”. Пойдем по этой градации и разберем инструменты.

Легче простого это Dify

Как нейросеть может быть лучшим ассистентом? - 2

Dify — это open‑source платформа для разработки приложений и AI‑агентов с визуальными workflow, встроенным RAG и LLMOps.

  • Визуальный конструктор workflow: drag‑and‑drop канвас, где можно собирать цепочки вызовов LLM, ветвления, параллельные ветки, код‑блоки и т.п.​

  • Поддержка RAG: есть модуль для выгрузки данных из разных источников, преобразования и индексации во векторные БД, плюс готовые RAG‑пайплайны.

  • Агентные возможности: можно определять агентов (Function Calling / ReAct), навешивать на них инструменты, использовать 50+ встроенных тулов (поиск, DALL·E, Stable Diffusion, WolframAlpha и пр.).

По сути вы можете в несколько кликов в красивом UI собрать для себя простого чат-бота, которому подключаются инструменты/скиллы + нужная LLM. Здесь не нужно никаких навыков, лишь немного ресёрча.

Более того, вы можете запустить сервис на своих локальных решениях, используя модели из Ollama, а также подключить туда членов своей команды.

При желании можно даже ничего не запускать, отказаться от развёртки в докере за минут 5, а выбрать платный тариф и использовать Dify как коммерческое решение.

Сложнее, но интереснее это Claude Code

Как нейросеть может быть лучшим ассистентом? - 3

Claude Code — это агентный кодинг‑инструмент от Anthropic, который живёт в терминале/IDE и позволяет Claude реально работать с твоим кодом: читать репо, править файлы, гонять команды и git‑флоу.

На скромный взгляд десятка наших учеников, людей из индустрии/тусовки и моему собственному мнению — Claude Code это реальное чудо. И ключевая причина в системе скиллов и плагинов. А не автоматизация, заточенная под Unix, хотя и этот аспект сверхкруто сделан и продуман.

И упомянутые RAG, оркестрация и конечно сами AI-агенты — это то, что здесь можно запустить/развернуть и создать за минут 5-15, чисто на энтузиазме и силе вайбкода. Как минимум упростив себе жизнь, автоматизировав команды и нудные участки кода, которые не хочется писать лично.

И сразу ремарка, что если ChatGPT пишет отвратительный код это не значит, что Claude пишет его примерно также плохо, напротив.

Состоит всё из двух главных компонентов

Skill — это описанный в файле «навык» агента: что он умеет делать, с какими инструментами и по какому протоколу.

  • Skill описывается как отдельный модуль (файл) с frontmatter: название и описание, какие файлы/директории он использует, какие команды может вызывать (shell, git, тесты и т.п.).

  • Агент может: вызывать skill как подзадачу, передавать ему часть контекста (например, конкретный баг/файл), комбинировать несколько skills в одной сессии.

  • Версиях 2.x добавили: авто‑подхват изменений skills без рестарта (modify → сразу доступен), более чёткую спецификацию входов/выходов, чтобы агент мог выбирать правильный skill сам.

Плагины и интеграции

  • Интеграции с IDE Плагины для VS Code / JetBrains, где Claude Code получает доступ к открытым файлам, символам, структуре проекта, и ты можешь дёргать его прямо из редактора.

  • CLI‑интеграции Поддержка стандартных инструментов (git, npm, pytest, docker и т.п.), которые агент умеет вызывать как «встроенные tools» в рамках skill’ов.

  • HTTP / внешние сервисы В новых гайдах есть паттерны, как описывать «HTTP‑плагины» (REST API как tool), чтобы Claude Code мог, например, стучаться в CI/CD, issue‑tracker или документацию.

Anthropic в best practices подчёркивает: лучше заворачивать сложные вещи (CI, миграции БД, деплой) в отдельные явные skills/tools, а не давать агенту прямой root‑доступ ко всему подряд.

На сайте https://claude-plugins.dev/ указано 12 тысяч плагинов с хвостиком! От красивых статус-лайнов до интеграции в ваш GitHub и n8n.

Это уже сам по себе AI-агент, дополняя его скиллами вы можете покрывать десятки, если не сотни задач. От автоматизации работы с кодом, отрабатывая задачи по кругу до победного конца. До личного ассистента, который может напоминать о задачах и болтать с вами.

Если интересно — напишите в комментариях, первым делом вам расскажу о чём-то из этого по Claude Code, прежде чем писать огромную статью по теме.

Самый сложный уровень это LangChain

LangChain — это open‑source фреймворк для сборки приложений и агентов поверх LLM: он даёт стандартные абстракции (модель, промпт, память, retrieval, tools) и интеграции с кучей провайдеров, чтобы не писать всё руками через сырые API.

Но если быть более точными, то нас интересует LangGraph, который создан именно для AI-агентов. Граф состояний (узлы — шаги: LLM, tools, маршрутизация; рёбра — переходы), поддержка многосоставных агентов, параллельных вызовов tools, повторов, лимитов итераций.

LangChain часто используют для RAG/линейных chain’ов, а LangGraph — для сложных агентных сценариев.

Как нейросеть может быть лучшим ассистентом? - 4

Вся сложность в том, что в этом методе из коробки вайбкода нет, да и он может упереться в банальный потолок нейросетей. Тут уже требуется разработка. Мы пишем структуру, мы пишем код. Мы делаем всё сами.

У тебя всегда есть три вещи:

  • State — структура данных, которая живёт между шагами (обычно messages, иногда ещё scratchpad, tools_output, флаги и т.д.).

  • Nodes — функции, которые принимают state и возвращают обновлённый state (например, вызвать LLM, выполнить tool, переписать вопрос).

  • Edges — связи между узлами: обычные (последовательные) условные (router, решающий, куда дальше идти).

Обычно всё пишется на Python, TypeScript/JavaScript допустим. Безусловно, идём и обращаемся к документации, придётся освоить этот инструмент.

Наверное этот инструмент достоин целой серии статей, где мы погрузимся в саму разработку. Дайте знать, что вам интереснее из этого узнать в первую очередь.

Правда AI не просто хайп и пузырь?

Если после прочтения у вас остались сомнения, вы всё ещё испытываете скепсис и вообще ожидаете краха всей индустрии. Я вас понимаю, давайте поговорим прямо.

AI сегодня правда огромный пузырь, миллиардные инвестиции в новые проекты, продукты, архитектуры и железо. И это всё не окупает себя, эти компании не зарабатывают. AI‑пузырь вокруг агентов — это смесь завышенных ожиданий («ИИ‑сотрудник, который сам ведёт бизнес») и реальных ниш, где агенты уже тихо приносят пользу.

Нейросети — это инструмент, который способен ускорить вашу работу или расширить возможности. И ключевое слово это инструмент, которым вы должны уметь пользоваться и собирать под себя. А насколько инструмент полезный вопрос едва ли спорный, можно посмотреть список возможностей, что ассистенты на практике закрывают сегодня:

Что в принципе могут делать агенты

Вот хотя бы краткий список того, что сейчас люди внедряют к себе, просто для того, чтобы вас немного удивить и дать немного мотивации.

  • Закрывать рутину и «офисный труд»: разбирать почту, триажить тикеты, ставить задачи в таск‑трекер; заполнять CRM, обновлять статусы сделок, напоминать о дедлайнах.

  • Автоматизировать поддержку и FAQ: отвечать на типовые вопросы клиентов и сотрудников 24/7; собирать нужный контекст из RAG‑базы и эскалировать сложные кейсы человеку.

  • Делать ресёрч и аналитику: собирать данные с сайтов, соцсетей, форумов, API; агрегировать и резюмировать отчёты, новости, документацию.

  • Помогать в операциях и финансах: обрабатывать счета, заявки, формы, акты; отслеживать аномалии и фрод, подсвечивать рисковые транзакции.

  • Оптимизировать процессы и инфраструктуру: следить за логами, метриками, алертами (AIOps‑агенты); предсказывать поломки (predictive maintenance), подсказывать, когда обслужить оборудование.

  • Лично для человека: календарь и встречи, email‑ассистент, подготовка к созвонам; заметки, сводки дня, повторение задач и контекстов.

Спасибо за прочтение! Очень вам благодарна!

Автор: Lerushka

Источник

Rambler's Top100