Auto AI Router: высокопроизводительный прокси-роутер для LLM API на Go
Если вы работаете с LLM-провайдерами, то наверняка сталкивались с одной и той же проблемой: у OpenAI лимит 100 RPM на ключ, у Vertex AI — свои квоты на проект, у Anthropic — отдельные ограничения. В итоге приходится держать несколько ключей, балансировать нагрузку вручную, следить, чтобы один заблокированный доступ не уронил всё приложение, и при этом хочется сохранить единый OpenAI-совсместимый эндпоинт для клиентского кода.Именно для этого и создан Auto AI Router
Google Cloud опубликовал 101 реальный кейс применения генеративного ИИ
Чтобы помочь бизнесам внедрять ИИ решения, Google Cloud выпустил подборку 101 архитектурного шаблона (blueprint), демонстрирующего, как применять генеративный ИИ в различных отраслях.
Google добавляет свою голосовую модель Chirp 3 к своей платформе Vertex AI
Большая часть внимания в генеративном AI была сосредоточена на текстовых интерфейсах, используемых для генерации текста, изображений и многого другого. Следующая волна, похоже, будет голосом, и она быстро накатывает. В последней разработке Google сегодня объявила, что добавит Chirp 3 — свои модели преобразования речи в текст и HD-текста в речь — в свою платформу разработки Vertex AI, начиная со следующей недели.

