ИИ. - страница 132

Как выбрать между облаком, арендой GPU и своим железом для LLM-систем

В этой статье разберём, во сколько обходится LLM-сервис при нагрузке в 100 000 диалогов в день и где проходит граница окупаемости разных вариантов. Посмотрим на стоимость облачных API, аренды GPU и собственного железа, а заодно прикинем, какая инфраструктура нужна, чтобы всё это выдержало боевой трафик.Исходные допущенияПредставим продукт, в котором пользователи активно общаются с моделью:100 000 диалогов в день.Каждый диалог — это 100–300 токенов от пользователя.На один диалог модель отвечает примерно тремя сообщениями.В среднем получаем:

продолжить чтение

Gemini 3 Pro обошла 98 процентов людей по IQ

Gemini 3 Pro снова удивляет индустрию. Модель вышла в абсолютные лидеры среди ИИ по результатам IQ-тестов, набрав впечатляющие 130 баллов. Такой показатель соответствует примерно двум процентам людей с наивысшим уровнем интеллекта и ставит модель в категорию «очень высокий IQ».

продолжить чтение

Психическое здоровье против прибыли. Meta* узнала, что Facebook* вредит пользователям, но скрыла это

продолжить чтение

ИИ смеётся, но не понимает: как LLM имитируют, а не распознают юмор и каламбуры

продолжить чтение

Один агент управляет, другие делают работу: новая эпоха кооперативного обучения ИИ?

продолжить чтение

Anthropic обнаружил, что попытки контролировать ИИ приводят к ещё большему обману

продолжить чтение

Роботы и бельё: всё ли складывается со складыванием?

Weave Robotics, Figure 02, Figure 03, Physical Intelligence, Google, 7X Tech — кажется, каждую неделю появляется новое видео, где робот складывает одежду. Компания Dyna вообще засняла 18 часов непрерывного складывания салфеток — возможно, лучшее робо-видео года. Причём это не единичные лабораторные эксперименты: 7X Tech уже планирует продавать таких роботов в массы. Роботы складывают вещи на робототехнических выставках. Google показала складывание одежды в проекте ALOHA Unleashed. Что же случилось? Почему вся робототехническая индустрия внезапно помешалась на складывании футболок и полотенец?

продолжить чтение

Мечта о ИИ-учёных разрушена: Gemini 3 Pro и GPT‑5 провалили задачи из астрофизики

Новая регистрационная работа под названием “CritPt

продолжить чтение

Каждый четвертый россиянин использует нейросети минимум раз в месяц

Согласно исследованию Mediascope, каждый четвёртый россиянин старше 12 лет пользуется нейросетями хотя бы раз в месяц. Общий месячный охват ИИ-сервисов среди этой возрастной группы составляет 26% населения. 

продолжить чтение

LMSYS запускает Miles и обещает ускорение RL на 25 процентов. Конец эпохе медленных MoE?

Команда LMSYS ORG, известная своими опенсорс-инициативами и Chatbot Arena, представила новый фреймворк Miles

продолжить чтение

Rambler's Top100