Как выбрать между облаком, арендой GPU и своим железом для LLM-систем
В этой статье разберём, во сколько обходится LLM-сервис при нагрузке в 100 000 диалогов в день и где проходит граница окупаемости разных вариантов. Посмотрим на стоимость облачных API, аренды GPU и собственного железа, а заодно прикинем, какая инфраструктура нужна, чтобы всё это выдержало боевой трафик.Исходные допущенияПредставим продукт, в котором пользователи активно общаются с моделью:100 000 диалогов в день.Каждый диалог — это 100–300 токенов от пользователя.На один диалог модель отвечает примерно тремя сообщениями.В среднем получаем:
OpenAI AgentKit vs Just AI Agent Platform: где ограничения, а где возможности?
Привет, Хабр! Меня зовут Даниил Сухан, я занимаюсь разработкой AI-приложений в Just AI.Недавно OpenAI представила AgentKit, вызвавший большой интерес в сообществе разработчиков. Однако мы в Just AI не только не отстаём от тенденций, но и опережаем их – мы запустили low-code инструмент — Agent Platform — за месяц до анонса от OpenAI.Давайте сравним, как создаются проекты на обеих платформах и разберемся, в чём заключаются ключевые преимущества нашего решения. Философия интерфейса: битва двух холстов
Spotify упростил процесс перехода пользователей с других стримингов через функцию переноса плейлистов
Стриминговый сервис Spotify запустил инструмент для переноса плейлистов с других платформ. Весной этого года Apple развернула аналогичную функцию для пользователей Apple Music в Австралии и Новой Зеландии.
Google опровергла сообщения об использовании в Gmail пользовательских писем для обучения ИИ
Google ответила на публикации в социальных сетях и статьи, в которых утверждается, что компания изменила свою политику использования сообщений и вложений Gmail для обучения моделей искусственного интеллекта.
В сервисе «Яндекс Такси» появился ИИ-агент службы поддержки
В сервис «Яндекс Такси» внедрили
Крупнейшие музыкальные лейблы заключают сделки с сервисами на базе ИИ
Звукозаписывающие лейблы Universal Music, Sony Music и Warner Music заключили индивидуальные лицензионные соглашения с музыкальным стартапом в сфере искусственного интеллекта Klay.
Вы написали AI-агента, а что дальше? Разбираем Google Vertex AI Agent Engine — спасательный круг или золотая клетка?
Давайте честно: написать умного AI-агента сегодня — это самая простая часть работы. Собрали LangChain или LangGraph, прикрутили API OpenAI или Gemini, заставили это работать у себя в терминале — красота! Вы чувствуете себя Тони Старком.Но настоящий кошмар начинается, когда возникает вопрос: "А как выкатить это в продакшен?"И тут вы понимаете, что ваш скрипт на Python — это не бэкенд. Вам нужно думать про:Где хранить историю диалогов (Redis? Postgres?).Как масштабировать это, если придет 1000 юзеров?Как сделать так, чтобы агент, выполняя код, не "уронил" сервер?Бесконечные IAM-права, ключи, VPC и безопасность.
Microsoft анонсировала «революционную» функцию для Word и PowerPoint
На конференции Ignite 2025 Microsoft представила специализированные агенты Microsoft 365 Copilot для Word, Excel и PowerPoint, а также бесплатную интеграцию Copilot Chat во все эти приложения. Кроме того, компания объявила, что в будущем создание альтернативного текста для Word и PowerPoint в Windows будет основано на моделях генеративного ИИ, а не на существующей модели Azure Vision.

