Как выбрать между облаком, арендой GPU и своим железом для LLM-систем
В этой статье разберём, во сколько обходится LLM-сервис при нагрузке в 100 000 диалогов в день и где проходит граница окупаемости разных вариантов. Посмотрим на стоимость облачных API, аренды GPU и собственного железа, а заодно прикинем, какая инфраструктура нужна, чтобы всё это выдержало боевой трафик.Исходные допущенияПредставим продукт, в котором пользователи активно общаются с моделью:100 000 диалогов в день.Каждый диалог — это 100–300 токенов от пользователя.На один диалог модель отвечает примерно тремя сообщениями.В среднем получаем:
Практическое исследование: вайбкодим HFT движок с Gemini 2.5 Pro
Нейронное КДПВ. Как хотелось бы видеть процесс, но не срослось
Gemini 3 Pro обошла 98 процентов людей по IQ
Gemini 3 Pro снова удивляет индустрию. Модель вышла в абсолютные лидеры среди ИИ по результатам IQ-тестов, набрав впечатляющие 130 баллов. Такой показатель соответствует примерно двум процентам людей с наивысшим уровнем интеллекта и ставит модель в категорию «очень высокий IQ».
Госдума РФ приняла в первом чтении законопроект о патентной охране IT‑решений
Государственная Дума России 20 ноября 2025 года приняла в первом чтении законопроект о патентной охране IT‑решений. Документ упрощает возможность получения патента на результаты интеллектуальной деятельности, которые относятся к программным продуктам. Разработанные при участии Роспатента поправки в Гражданский кодекс закрепляют перечень IT‑решений, которые будут признаваться изобретениями, полезными моделями, а также промышленными образцами.
Мифы, суеверия и народные мудрости в разработке игр
Кто к нам с мудростью придет, тот её и будет фиксить.
Gemini 3 Pro стал первым ИИ, достигшим уровня IQ 130
Превью-версия Gemini 3 Pro набрала 130 баллов в оффлайн-бенчмарке Mensa, который является специальной версией знаменитого теста на IQ, адаптированного для оценки ИИ. В основу положен классический тест Mensa Norway, однако задачи написаны заново и не раскрываются, чтобы не допустить дообучения новых моделей специально под эти вопросы. Моделям с компьютерным зрением тест показывают в виде картинок, всем остальным — поясняют текстом смысл задачи. Вот сводная таблица, в которой даны результаты моделей в оффлайн-бенчмарке и Mensa Norway:
Claude стал хитрить, ИИ создал беспорядки, Google обошёл OpenAI
157 выпуск новостей ИИ by AIvengo Привет! С вами AIvengo и сейчас я расскажу вам много интересного про искусственный интеллект. Итак, сегодня в 157 выпуске:Сэм Альтман признал поражение от GoogleClaude научился врать и планировать побег
Кембриджский словарь выбрал термин «парасоциальный» словом 2025 года
Словом 2025 года по версии Кембриджского словаря английского языка стало
Как я собрал Telegram-бота-консультанта по железу на бесплатном стеке (RAG + Groq + python telegram bot)
Представьте консультанта в DNS/Ситилинке, который не навязывает «вот этот блок питания потому что остался на складе», а спокойно объясняет, чем один БП лучше другого под ваш билд, помнит, о чём вы спрашивали раньше, и ещё просит вежливый фидбек. Я решил собрать такого консультанта в виде Telegram-бота «Кремний» — RAG-бота по железу на бесплатных инструментах: Telegram Bot API, Groq (Llama 3.1 8B), sentence-transformers и чуть-чуть боли с NumPy и Pterodactyl.Задача: живой консультант по железу в Telegram

