Если вы активно пользуетесь нейросетями для работы, вы наверняка знаете это чувство. Открыта вкладка ChatGPT, рядом висит Gemini (потому что Nano Banana), в третьей вкладке Perplexity для ресерча. Где-то в закладках пылятся генераторы картинок и видео, к которым вы возвращаетесь раз в пару месяцев.
Вся эта радость обходится в $60-100 ежемесячно, конечно если у вас есть доступ. Оплачивать это из РФ — отдельный квест с криптой и перекупщиками виртуальных карт. А самое обидное — если вы ушли в отпуск или у вас была неделя созвонов, подписки просто “сгорают” в конце месяца.
Мы в команде поняли, что этот “зоопарк” пора привести в порядок. Так появился проект VEGA — единый интерфейс, в котором собраны топовые AI-инструменты под капотом удобного чата, без VPN и навязчивых подписок.
В этой статье мы хотим рассказать, как устроен наш проект не только с продуктовой, но и с архитектурной точки зрения.
Концепт: Pay-As-You-Go и никаких сгорающих месяцев
Главное правило, которое мы заложили в продукт: пользователь должен платить только за результат. Мы отказались от классической модели SaaS с жесткой месячной подпиской, внедрив внутреннюю валюту (Звёзды ⭐).
Нужно сгенерировать 10 фотореалистичных картинок раз в полгода? Вы просто тратите баланс на эту задачу. Завтра вышли топовые модели от Anthropic и Google? Они появляются у нас в день релиза, и вам не нужно покупать еще одну подписку за $20, чтобы их протестировать.
Более того, для базовых повседневных задач мы оставили 10 запросов в сутки к бесплатным моделям (300 + запросов в месяц), никакиз ограничений на качество у них нет.
Что умеет VEGA
Чтобы выделяться среди десятков классических “оберток над OpenAI”, мы интегрировали более 30 различных сервисов и моделей:
-
Многоуровневый Web Search. Мы прикрутили не просто парсер гугла, а интегрировали сразу два движка — Exa и Parallel AI. Работает в реальном времени. Нужно сделать ресерч публикаций, собрать аналитику по трендам за год, изучить документацию опенсорс-библиотеки по ссылке — ИИ скачивает десятки и сотник релевантных источников и делает на их основе саммари. И это все работает в том числе в режиме Чат – чтение ссылок интегрированы для всех AI моделей, а кнопка Web использует Exa, чтобы AI опирался на факты из Web Search.
-
“Автопилот” (Умный роутинг). Самое сложное в комбайнах — не перегрузить UX. У нас нет сложной панели на 100 кнопок. Выбираете режим “Автопилот” и пишете промпт, а система сама поймет интент:
Написали "Создай песню про Машу и Мишу" — запрос летит в интеграцию Suno.Закинули PDF и 10 фоток — идет в мультимодальный анализ.Попросили "Дай анализ акций Apple" — включается финансовый API и парсинг инвестиционных данных.Кейсов конечно намного больше, т.к. Автопилоту доступен весь функционал проекта (кроме Транскрибации).
-
Транскрибация 99+ языков. Закидываем голосовое или видео, система (на базе AssemblyAI) делает speech-to-text, разбивает по спикерам, определяет эмоциональный окрас и выдает сжатое саммари. Такого вы точно еще не видели.
-
Генерация Видео и Фото. Veo, Kling, Grok, Nano Banana – с подержкой всех фичей. А чтобы не перегружать UI, под капотом тоже стоит AI – роутер, который понимает чего вы хотите – редактировать или склеить видео. Использовать первый и послдний фрейм в виде картинки, которые вы прикрепили. Все очень сложно, но это только для вас.
Под капотом: как мы склеили это технически
Теперь к самому интересному — к технологиям. Это не просто “Next.js + fetch к OpenAI”. Мы собрали серьезный и современный стек из мира Serverless и AI-инженерии.
Core Stack
-
Фреймворк: Next.js 16 (React 19, TypeScript 5.9). Работаем на острие последних фич: серверные компоненты и экшены позволяют держать бандл легким.
-
UI/Styles: Tailwind CSS v4, глубокая интеграция Radix UI для доступности и Framer Motion для микроанимаций. Дизайн у нас минималистичный (чтобы не отвлекать от контента), но с высокой отзывчивостью.
Оркестрация AI
Делать десятки интеграций руками — выстрел в ногу. Поэтому “сердцем” маршрутизации стал Vercel AI SDK. С помощью @openrouter/ai-sdk-provider, @ai-sdk/openai, @ai-sdk/google, @ai-sdk/xai мы привели работу с моделями к единому интерфейсу (Unified API). Для потоковой передачи данных (чтобы ответ печатался в реальном времени, а генерация фото отдавала статус) мы используем стриминговые протоколы. Логика авто-режима (Автопилота) построена на классификации интентов: система быстрым LLM-вызовом или эвристикой определяет, требуется ли вызов тулзов (Tool Calling), нужно ли лезть в векторную БД, и какой провайдер лучше справится с задачей.
Долгосрочная память
Мы хотели, чтобы чат не страдал амнезией при создании новых сессий. Для этого мы интегрировали Mem0 и Supermemory. Система анализирует диалоги пользователя, вычленяет факты (“пользователь — frontend-разработчик”, “любит кофе”, “пишет на React”) и сохраняет их. При новых запросах эти факты подмешиваются в контекст, создавая эффект персонализированного ассистента. Пользователь может управлять сохраненными фактами в отдельной вкладке.
Базы Данных и Инфраструктура
Мы полностью ушли в Serverless/Edge:
-
Основная БД: Пока используем Postgres SQL 17, на 18 еще не перешли :/
-
ORM: В качестве прослойки используем Drizzle ORM. Никакой боли с абстракциями Prisma, чистый и строгий SQL_like синтаксис на TypeScript.
-
Кеширование и Лимиты: Upstash Redis и их библиотека
@upstash/ratelimit. Так как мы даем фри-тир, нам жизненно важно жестко контролировать abuse и DDoSS. Upstash работает в Edge с задержками в единицы миллисекунд. -
Аутентификация: Используем легковесный
better-auth. -
Парсинг документов: За обработку документов, загружаемых пользователями, отвечает AI Gemini 2.5 flash lite и его fallback. Чтобы user мог добавить почти любой формат. он конвертируется через бибилиотку
libreoffice headlesspdfjs,mammoth(для Word) и парсеры таблиц. А для отрисовки математики и диаграмм внутри чата —rehype-katexи мощнейший инструментmermaid.
Приглашение к тестированию
Мы сделали инструмент, которым с удовольствием пользуемся сами для работы с кодом, документацией и просто для повседневных задач. Но мы хотим, чтобы VEGA стала помощником для более широкого круга людей, особенно для разработчиков.
При регистрации мы сразу начисляем бонусные ⭐ Звёзды, чтобы вы могли потестировать самые функции чата VEGA. Тем не менее, 10 базовых запросов в день к Free-моделям всегда останутся бесплатными. Не требуется VPN, все работает максимально быстро.
Будем рады видеть вас на vega.chat, а еще сильнее будем рады конструктивной критике, багрепортам и предложениям в комментариях. Наш “Автопилот” с каждым днем становится умнее, но настоящий краш-тест могут устроить только хаброжители.
P.S. Если вам интересно технологии которые мы применяем в VEGA, напишите об этом и мы готовы рассказать более подробные кейсы.
Автор: ingeniare


