ai.
Как выбрать между облаком, арендой GPU и своим железом для LLM-систем
В этой статье разберём, во сколько обходится LLM-сервис при нагрузке в 100 000 диалогов в день и где проходит граница окупаемости разных вариантов. Посмотрим на стоимость облачных API, аренды GPU и собственного железа, а заодно прикинем, какая инфраструктура нужна, чтобы всё это выдержало боевой трафик.Исходные допущенияПредставим продукт, в котором пользователи активно общаются с моделью:100 000 диалогов в день.Каждый диалог — это 100–300 токенов от пользователя.На один диалог модель отвечает примерно тремя сообщениями.В среднем получаем:
Gemini 3 Pro обошла 98 процентов людей по IQ
Gemini 3 Pro снова удивляет индустрию. Модель вышла в абсолютные лидеры среди ИИ по результатам IQ-тестов, набрав впечатляющие 130 баллов. Такой показатель соответствует примерно двум процентам людей с наивысшим уровнем интеллекта и ставит модель в категорию «очень высокий IQ».
OpenAI AgentKit vs Just AI Agent Platform: где ограничения, а где возможности?
Привет, Хабр! Меня зовут Даниил Сухан, я занимаюсь разработкой AI-приложений в Just AI.Недавно OpenAI представила AgentKit, вызвавший большой интерес в сообществе разработчиков. Однако мы в Just AI не только не отстаём от тенденций, но и опережаем их – мы запустили low-code инструмент — Agent Platform — за месяц до анонса от OpenAI.Давайте сравним, как создаются проекты на обеих платформах и разберемся, в чём заключаются ключевые преимущества нашего решения. Философия интерфейса: битва двух холстов
Мечта о ИИ-учёных разрушена: Gemini 3 Pro и GPT‑5 провалили задачи из астрофизики
Новая регистрационная работа под названием “CritPt
Гайд по нейро-рекламе: Как ИИ спасает даже самые безнадежные объявления на Авито
Авито — это не просто доска объявлений. Это настоящий музей народного творчества, странных ракурсов и загадочных предметов. Мы все видели эти фото: размытый диван в темноте, «селфи» чайника в зеркале или ковер, который видел еще Брежнева.Но что, если бы наши продавцы имели доступ к технологиям будущего? 🤔Мы решили провести эксперимент. Взяли самые колоритные (и случайные!) объявления и попросили Искусственный Интеллект переосмыслить их визуал. Никакого сложного фотошопа, только магия нейросетей и чатбота.⚠️
LMSYS запускает Miles и обещает ускорение RL на 25 процентов. Конец эпохе медленных MoE?
Команда LMSYS ORG, известная своими опенсорс-инициативами и Chatbot Arena, представила новый фреймворк Miles

