Как мы устали от зоопарка AI-подписок и объединили 30 нейросетей в одном интерфейсе

Если вы активно пользуетесь нейросетями для работы, вы наверняка знаете это чувство. Открыта вкладка ChatGPT, рядом висит Gemini (потому что Nano Banana), в третьей вкладке Perplexity для ресерча. Где-то в закладках пылятся генераторы картинок и видео, к которым вы возвращаетесь раз в пару месяцев.

Вся эта радость обходится в $60-100 ежемесячно, конечно если у вас есть доступ. Оплачивать это из РФ — отдельный квест с криптой и перекупщиками виртуальных карт. А самое обидное — если вы ушли в отпуск или у вас была неделя созвонов, подписки просто “сгорают” в конце месяца.

Мы в команде поняли, что этот “зоопарк” пора привести в порядок. Так появился проект VEGA — единый интерфейс, в котором собраны топовые AI-инструменты под капотом удобного чата, без VPN и навязчивых подписок.

В этой статье мы хотим рассказать, как устроен наш проект не только с продуктовой, но и с архитектурной точки зрения ^[1].

Концепт: Pay-As-You-Go и никаких сгорающих месяцев

Главное правило, которое мы заложили в продукт: пользователь должен платить только за результат. Мы отказались от классической модели SaaS с жесткой месячной подпиской, внедрив внутреннюю валюту (Звёзды ⭐).

Нужно сгенерировать 10 фотореалистичных картинок раз в полгода? Вы просто тратите баланс на эту задачу. Завтра вышли топовые модели от Anthropic и Google? Они появляются у нас в день релиза, и вам не нужно покупать еще одну подписку за $20, чтобы их протестировать.

Более того, для базовых повседневных задач мы оставили 10 запросов в сутки к бесплатным моделям (300 + запросов в месяц), никакиз ограничений на качество у них нет.

Что умеет VEGA

Чтобы выделяться среди десятков классических “оберток над OpenAI”, мы интегрировали более 30 различных сервисов и моделей:

Многоуровневый Web Search. Мы прикрутили не просто парсер гугла, а интегрировали сразу два движка — Exa и Parallel AI. Работает в реальном времени. Нужно сделать ресерч публикаций, собрать аналитику по трендам за год, изучить документацию опенсорс-библиотеки по ссылке — ИИ скачивает десятки и сотник релевантных источников и делает на их основе саммари. И это все работает в том числе в режиме Чат – чтение ссылок интегрированы для всех AI моделей, а кнопка Web использует Exa, чтобы AI опирался на факты из Web Search.
“Автопилот” (Умный роутинг). Самое сложное в комбайнах — не перегрузить UX. У нас нет сложной панели на 100 кнопок. Выбираете режим “Автопилот” и пишете промпт, а система сама поймет интент:

Написали "Создай песню про Машу и Мишу" — запрос летит в интеграцию Suno.

Закинули PDF и 10 фоток — идет в мультимодальный анализ.

Попросили "Дай анализ акций Apple" — включается финансовый API и парсинг инвестиционных данных.

Кейсов конечно намного больше, т.к. Автопилоту доступен весь функционал проекта (кроме Транскрибации).
Транскрибация 99+ языков. Закидываем голосовое или видео, система (на базе AssemblyAI) делает speech-to-text, разбивает по спикерам, определяет эмоциональный окрас и выдает сжатое саммари. Такого вы точно еще не видели.
Генерация Видео и Фото. Veo, Kling, Grok, Nano Banana – с подержкой всех фичей. А чтобы не перегружать UI, под капотом тоже стоит AI – роутер, который понимает чего вы хотите – редактировать или склеить видео. Использовать первый и послдний фрейм в виде картинки, которые вы прикрепили. Все очень сложно, но это только для вас.

Под капотом: как мы склеили это технически

Теперь к самому интересному — к технологиям. Это не просто “Next.js + fetch к OpenAI”. Мы собрали серьезный и современный стек из мира Serverless и AI-инженерии.

Core Stack

Фреймворк: Next.js 16 (React 19, TypeScript 5.9). Работаем на острие последних фич: серверные компоненты и экшены позволяют держать бандл легким.
UI/Styles: Tailwind CSS v4, глубокая интеграция Radix UI для доступности и Framer Motion для микроанимаций. Дизайн у нас минималистичный (чтобы не отвлекать от контента), но с высокой отзывчивостью.

Оркестрация AI

Делать десятки интеграций руками — выстрел в ногу. Поэтому “сердцем” маршрутизации стал Vercel AI SDK. С помощью @openrouter/ai-sdk-provider, @ai-sdk/openai, @ai-sdk/google, @ai-sdk/xai мы привели работу с моделями к единому интерфейсу (Unified API). Для потоковой передачи данных (чтобы ответ печатался в реальном времени, а генерация фото отдавала статус) мы используем стриминговые протоколы. Логика ^[2] авто-режима (Автопилота) построена на классификации интентов: система быстрым LLM-вызовом или эвристикой определяет, требуется ли вызов тулзов (Tool Calling), нужно ли лезть в векторную БД, и какой провайдер лучше справится с задачей.

Долгосрочная память

Мы хотели, чтобы чат не страдал амнезией при создании новых сессий. Для этого мы интегрировали Mem0 и Supermemory. Система анализирует диалоги пользователя, вычленяет факты (“пользователь — frontend-разработчик”, “любит кофе”, “пишет на React”) и сохраняет их. При новых запросах эти факты подмешиваются в контекст, создавая эффект персонализированного ассистента. Пользователь может управлять сохраненными фактами в отдельной вкладке.

Базы Данных и Инфраструктура

Мы полностью ушли в Serverless/Edge:

Основная БД: Пока используем Postgres SQL 17, на 18 еще не перешли :/
ORM: В качестве прослойки используем Drizzle ORM. Никакой боли ^[3] с абстракциями Prisma, чистый и строгий SQL_like синтаксис на TypeScript.
Кеширование и Лимиты: Upstash Redis и их библиотека @upstash/ratelimit. Так как мы даем фри-тир, нам жизненно важно жестко контролировать abuse и DDoSS. Upstash работает в Edge с задержками в единицы миллисекунд.
Аутентификация: Используем легковесный better-auth.
Парсинг документов: За обработку документов, загружаемых пользователями, отвечает AI Gemini 2.5 flash lite и его fallback. Чтобы user мог добавить почти любой формат. он конвертируется через бибилиотку libreoffice headless pdfjs, mammoth (для Word) и парсеры таблиц. А для отрисовки математики ^[4] и диаграмм внутри чата — rehype-katex и мощнейший инструмент mermaid.

Приглашение к тестированию

Мы сделали инструмент, которым с удовольствием пользуемся сами для работы с кодом, документацией и просто для повседневных задач. Но мы хотим, чтобы VEGA стала помощником для более широкого круга людей, особенно для разработчиков.

При регистрации мы сразу начисляем бонусные ⭐ Звёзды, чтобы вы могли потестировать самые функции чата VEGA. Тем не менее, 10 базовых запросов в день к Free-моделям всегда останутся бесплатными. Не требуется VPN, все работает максимально быстро.

Будем рады видеть вас на vega.chat ^[5], а еще сильнее будем рады конструктивной критике, багрепортам и предложениям в комментариях. Наш “Автопилот” с каждым днем становится умнее, но настоящий краш-тест могут устроить только хаброжители.

P.S. Если вам интересно технологии которые мы применяем в VEGA, напишите об этом и мы готовы рассказать более подробные кейсы.

Автор: ingeniare

Источник ^[6]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/26815

URLs in this post:

[1] зрения: http://www.braintools.ru/article/6238

[2] Логика: http://www.braintools.ru/article/7640

[3] боли: http://www.braintools.ru/article/9901

[4] математики: http://www.braintools.ru/article/7620

[5] vega.chat: http://vega.chat

[6] Источник: https://habr.com/ru/articles/1008160/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1008160

Нажмите здесь для печати.