Архивные записи BrainTools за

Как выбрать между облаком, арендой GPU и своим железом для LLM-систем

В этой статье разберём, во сколько обходится LLM-сервис при нагрузке в 100 000 диалогов в день и где проходит граница окупаемости разных вариантов. Посмотрим на стоимость облачных API, аренды GPU и собственного железа, а заодно прикинем, какая инфраструктура нужна, чтобы всё это выдержало боевой трафик.Исходные допущенияПредставим продукт, в котором пользователи активно общаются с моделью:100 000 диалогов в день.Каждый диалог — это 100–300 токенов от пользователя.На один диалог модель отвечает примерно тремя сообщениями.В среднем получаем:

продолжить чтение

Оставлено в

Практическое исследование: вайбкодим HFT движок с Gemini 2.5 Pro

Нейронное КДПВ. Как хотелось бы видеть процесс, но не срослось

продолжить чтение

Оставлено в

Gemini 3 Pro обошла 98 процентов людей по IQ

Gemini 3 Pro снова удивляет индустрию. Модель вышла в абсолютные лидеры среди ИИ по результатам IQ-тестов, набрав впечатляющие 130 баллов. Такой показатель соответствует примерно двум процентам людей с наивысшим уровнем интеллекта и ставит модель в категорию «очень высокий IQ».

продолжить чтение

Оставлено в

Госдума РФ приняла в первом чтении законопроект о патентной охране IT‑решений

Государственная Дума России 20 ноября 2025 года приняла в первом чтении законопроект о патентной охране IT‑решений. Документ упрощает возможность получения патента на результаты интеллектуальной деятельности, которые относятся к программным продуктам. Разработанные при участии Роспатента поправки в Гражданский кодекс закрепляют перечень IT‑решений, которые будут признаваться изобретениями, полезными моделями, а также промышленными образцами.

продолжить чтение

Оставлено в

Мифы, суеверия и народные мудрости в разработке игр

Кто к нам с мудростью придет, тот её и будет фиксить.

продолжить чтение

Оставлено в

Gemini 3 Pro стал первым ИИ, достигшим уровня IQ 130

Превью-версия Gemini 3 Pro набрала 130 баллов в оффлайн-бенчмарке Mensa, который является специальной версией знаменитого теста на IQ, адаптированного для оценки ИИ. В основу положен классический тест Mensa Norway, однако задачи написаны заново и не раскрываются, чтобы не допустить дообучения новых моделей специально под эти вопросы. Моделям с компьютерным зрением тест показывают в виде картинок, всем остальным — поясняют текстом смысл задачи. Вот сводная таблица, в которой даны результаты моделей в оффлайн-бенчмарке и Mensa Norway:

продолжить чтение

Оставлено в

Психическое здоровье против прибыли. Meta* узнала, что Facebook* вредит пользователям, но скрыла это

продолжить чтение

Оставлено в

Claude стал хитрить, ИИ создал беспорядки, Google обошёл OpenAI

157 выпуск новостей ИИ by AIvengo Привет! С вами AIvengo и сейчас я расскажу вам много интересного про искусственный интеллект. Итак, сегодня в 157 выпуске:Сэм Альтман признал поражение от GoogleClaude научился врать и планировать побег

продолжить чтение

Оставлено в
- искусственный интеллект
- новости технологий

Кембриджский словарь выбрал термин «парасоциальный» словом 2025 года

Словом 2025 года по версии Кембриджского словаря английского языка стало

продолжить чтение

Оставлено в

Как я собрал Telegram-бота-консультанта по железу на бесплатном стеке (RAG + Groq + python telegram bot)

Представьте консультанта в DNS/Ситилинке, который не навязывает «вот этот блок питания потому что остался на складе», а спокойно объясняет, чем один БП лучше другого под ваш билд, помнит, о чём вы спрашивали раньше, и ещё просит вежливый фидбек. Я решил собрать такого консультанта в виде Telegram-бота «Кремний» — RAG-бота по железу на бесплатных инструментах: Telegram Bot API, Groq (Llama 3.1 8B), sentence-transformers и чуть-чуть боли с NumPy и Pterodactyl.Задача: живой консультант по железу в Telegram

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Как выбрать между облаком, арендой GPU и своим железом для LLM-систем

Практическое исследование: вайбкодим HFT движок с Gemini 2.5 Pro

Gemini 3 Pro обошла 98 процентов людей по IQ

Госдума РФ приняла в первом чтении законопроект о патентной охране IT‑решений

Мифы, суеверия и народные мудрости в разработке игр

Gemini 3 Pro стал первым ИИ, достигшим уровня IQ 130

Психическое здоровье против прибыли. Meta* узнала, что Facebook* вредит пользователям, но скрыла это

Claude стал хитрить, ИИ создал беспорядки, Google обошёл OpenAI

Кембриджский словарь выбрал термин «парасоциальный» словом 2025 года

Как я собрал Telegram-бота-консультанта по железу на бесплатном стеке (RAG + Groq + python telegram bot)

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов