Как мы устали от зоопарка AI-подписок и объединили 30 нейросетей в одном интерфейсе. ai.. ai. ИИ.. ai. ИИ. Функциональное программирование.

Если вы активно пользуетесь нейросетями для работы, вы наверняка знаете это чувство. Открыта вкладка ChatGPT, рядом висит Gemini (потому что Nano Banana), в третьей вкладке Perplexity для ресерча. Где-то в закладках пылятся генераторы картинок и видео, к которым вы возвращаетесь раз в пару месяцев.

Вся эта радость обходится в $60-100 ежемесячно, конечно если у вас есть доступ. Оплачивать это из РФ — отдельный квест с криптой и перекупщиками виртуальных карт. А самое обидное — если вы ушли в отпуск или у вас была неделя созвонов, подписки просто “сгорают” в конце месяца.

Мы в команде поняли, что этот “зоопарк” пора привести в порядок. Так появился проект VEGA — единый интерфейс, в котором собраны топовые AI-инструменты под капотом удобного чата, без VPN и навязчивых подписок.

В этой статье мы хотим рассказать, как устроен наш проект не только с продуктовой, но и с архитектурной точки зрения.

Концепт: Pay-As-You-Go и никаких сгорающих месяцев

Главное правило, которое мы заложили в продукт: пользователь должен платить только за результат. Мы отказались от классической модели SaaS с жесткой месячной подпиской, внедрив внутреннюю валюту (Звёзды ⭐).

Нужно сгенерировать 10 фотореалистичных картинок раз в полгода? Вы просто тратите баланс на эту задачу. Завтра вышли топовые модели от Anthropic и Google? Они появляются у нас в день релиза, и вам не нужно покупать еще одну подписку за $20, чтобы их протестировать.

Более того, для базовых повседневных задач мы оставили 10 запросов в сутки к бесплатным моделям (300 + запросов в месяц), никакиз ограничений на качество у них нет.

Что умеет VEGA

Чтобы выделяться среди десятков классических “оберток над OpenAI”, мы интегрировали более 30 различных сервисов и моделей:

Многоуровневый Web Search. Мы прикрутили не просто парсер гугла, а интегрировали сразу два движка — Exa и Parallel AI. Работает в реальном времени. Нужно сделать ресерч публикаций, собрать аналитику по трендам за год, изучить документацию опенсорс-библиотеки по ссылке — ИИ скачивает десятки и сотник релевантных источников и делает на их основе саммари. И это все работает в том числе в режиме Чат – чтение ссылок интегрированы для всех AI моделей, а кнопка Web использует Exa, чтобы AI опирался на факты из Web Search.
“Автопилот” (Умный роутинг). Самое сложное в комбайнах — не перегрузить UX. У нас нет сложной панели на 100 кнопок. Выбираете режим “Автопилот” и пишете промпт, а система сама поймет интент:

Написали "Создай песню про Машу и Мишу" — запрос летит в интеграцию Suno.

Закинули PDF и 10 фоток — идет в мультимодальный анализ.

Попросили "Дай анализ акций Apple" — включается финансовый API и парсинг инвестиционных данных.

Кейсов конечно намного больше, т.к. Автопилоту доступен весь функционал проекта (кроме Транскрибации).
Транскрибация 99+ языков. Закидываем голосовое или видео, система (на базе AssemblyAI) делает speech-to-text, разбивает по спикерам, определяет эмоциональный окрас и выдает сжатое саммари. Такого вы точно еще не видели.
Генерация Видео и Фото. Veo, Kling, Grok, Nano Banana – с подержкой всех фичей. А чтобы не перегружать UI, под капотом тоже стоит AI – роутер, который понимает чего вы хотите – редактировать или склеить видео. Использовать первый и послдний фрейм в виде картинки, которые вы прикрепили. Все очень сложно, но это только для вас.

Под капотом: как мы склеили это технически

Теперь к самому интересному — к технологиям. Это не просто “Next.js + fetch к OpenAI”. Мы собрали серьезный и современный стек из мира Serverless и AI-инженерии.

Core Stack

Фреймворк: Next.js 16 (React 19, TypeScript 5.9). Работаем на острие последних фич: серверные компоненты и экшены позволяют держать бандл легким.
UI/Styles: Tailwind CSS v4, глубокая интеграция Radix UI для доступности и Framer Motion для микроанимаций. Дизайн у нас минималистичный (чтобы не отвлекать от контента), но с высокой отзывчивостью.

Оркестрация AI

Делать десятки интеграций руками — выстрел в ногу. Поэтому “сердцем” маршрутизации стал Vercel AI SDK. С помощью @openrouter/ai-sdk-provider, @ai-sdk/openai, @ai-sdk/google, @ai-sdk/xai мы привели работу с моделями к единому интерфейсу (Unified API). Для потоковой передачи данных (чтобы ответ печатался в реальном времени, а генерация фото отдавала статус) мы используем стриминговые протоколы. Логика авто-режима (Автопилота) построена на классификации интентов: система быстрым LLM-вызовом или эвристикой определяет, требуется ли вызов тулзов (Tool Calling), нужно ли лезть в векторную БД, и какой провайдер лучше справится с задачей.

Долгосрочная память

Мы хотели, чтобы чат не страдал амнезией при создании новых сессий. Для этого мы интегрировали Mem0 и Supermemory. Система анализирует диалоги пользователя, вычленяет факты (“пользователь — frontend-разработчик”, “любит кофе”, “пишет на React”) и сохраняет их. При новых запросах эти факты подмешиваются в контекст, создавая эффект персонализированного ассистента. Пользователь может управлять сохраненными фактами в отдельной вкладке.

Базы Данных и Инфраструктура

Мы полностью ушли в Serverless/Edge:

Основная БД: Пока используем Postgres SQL 17, на 18 еще не перешли :/
ORM: В качестве прослойки используем Drizzle ORM. Никакой боли с абстракциями Prisma, чистый и строгий SQL_like синтаксис на TypeScript.
Кеширование и Лимиты: Upstash Redis и их библиотека @upstash/ratelimit. Так как мы даем фри-тир, нам жизненно важно жестко контролировать abuse и DDoSS. Upstash работает в Edge с задержками в единицы миллисекунд.
Аутентификация: Используем легковесный better-auth.
Парсинг документов: За обработку документов, загружаемых пользователями, отвечает AI Gemini 2.5 flash lite и его fallback. Чтобы user мог добавить почти любой формат. он конвертируется через бибилиотку libreoffice headless pdfjs, mammoth (для Word) и парсеры таблиц. А для отрисовки математики и диаграмм внутри чата — rehype-katex и мощнейший инструмент mermaid.

Приглашение к тестированию

Мы сделали инструмент, которым с удовольствием пользуемся сами для работы с кодом, документацией и просто для повседневных задач. Но мы хотим, чтобы VEGA стала помощником для более широкого круга людей, особенно для разработчиков.

При регистрации мы сразу начисляем бонусные ⭐ Звёзды, чтобы вы могли потестировать самые функции чата VEGA. Тем не менее, 10 базовых запросов в день к Free-моделям всегда останутся бесплатными. Не требуется VPN, все работает максимально быстро.

Будем рады видеть вас на vega.chat, а еще сильнее будем рады конструктивной критике, багрепортам и предложениям в комментариях. Наш “Автопилот” с каждым днем становится умнее, но настоящий краш-тест могут устроить только хаброжители.

P.S. Если вам интересно технологии которые мы применяем в VEGA, напишите об этом и мы готовы рассказать более подробные кейсы.

Автор: ingeniare

Источник

Запись добавлена: 09.03.2026 в 12:55
Оставлено в

Как мы устали от зоопарка AI-подписок и объединили 30 нейросетей в одном интерфейсе

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Концепт: Pay-As-You-Go и никаких сгорающих месяцев

Что умеет VEGA

Под капотом: как мы склеили это технически

Core Stack

Оркестрация AI

Долгосрочная память

Базы Данных и Инфраструктура

Приглашение к тестированию

Как мы устали от зоопарка AI-подписок и объединили 30 нейросетей в одном интерфейсе

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Концепт: Pay-As-You-Go и никаких сгорающих месяцев

Что умеет VEGA

Под капотом: как мы склеили это технически

Core Stack

Оркестрация AI

Долгосрочная память

Базы Данных и Инфраструктура

Приглашение к тестированию