API. - страница 4

API.

Токенная разработка: почему я плачу $200 в месяц, а не $800 за устаревшее железо

Хуанг на GTC 2026 предложил платить инженерам токен-бюджеты вместо части зарплаты. Forbes написал: “output isn’t software, it’s tokens”. Anthropic посчитала: Claude Code обходится в $13 на разработчика в день, $150-250 в месяц.Я 4 месяца не обсуждаю, а считаю. И первое что посчитал: б/у RTX 3090 стоит $800-1000. За эти деньги я оплачиваю API и веду проекты: embedded firmware, криптография, backend, своя IDE. Карта за $800 дала бы одну модель среднего уровня и шум вентиляторов.Нет, я не нашёл волшебную модель. Я научился считать. И начал с того, во что верит большинство.

продолжить чтение

Новый Grok 4.3: как использовать без подписки за 300$ и подключить выгодный API нейросети для бизнеса

Grok 4.3 от xAI вышел в апреле 2026 года и пока остаётся в стадии бета-версии — протестировать его могут только подписчики SuperGrok Heavy за 300 долларов в месяц.

продолжить чтение

Mode collapse в авто-блоге: четыре пятницы подряд LLM приносила нам один и тот же «спорный вопрос про ИИ»

Это история про открытый креативный промпт к LLM, оставленный без присмотра. Через месяц он превратил пятничную рубрику нашего блога в гимнастику парафразов одного и того же тезиса. Поймал я это не на первой пятнице и даже не на второй: каждая отдельная статья сама по себе выглядела нормально. На четвёртой стало очевидно.

продолжить чтение

DeepSeek выпустил V4 — открытую модель с контекстом в миллион токенов

Сегодня DeepSeek опубликовали две новые модели: V4-Pro и V4-Flash. Обе работают по архитектуре Mixture-of-Experts, веса доступны на Hugging Face под MIT-лицензией.

продолжить чтение

Compute crunch пришёл: как считать экономику LLM в 2026

Build, Buy или Hybrid - рассуждаем о подходах к TCO. Статья - приглашение к диалогу и обсуждению, не экспертный нарратив."Я говорил" или что случилось с тарифами на LLM APIДва крупнейших API-провайдера одновременно сменили риторику. Anthropic ввёл usage-based billing для агентных фреймворков — плата за токены вместо фиксированных подписок. Часть сторонних обёрток потеряла возможность работать через flat-rate тарифы. OpenAI параллельно ввёл гибкое корпоративное ценообразование для Enterprise, Business и EDU-планов

продолжить чтение

Бесплатный API для нейросетей от NVIDIA: 100+ моделей, OpenAI-совместимый эндпоинт и 40 запросов в минуту

NVIDIA раздаёт бесплатные API-ключи к 100+ моделям — DeepSeek R1, Llama, Mistral, GLM, Kimi и десятки других. Регистрация за 2 минуты, OpenAI-совместимый эндпоинт, без привязки карты.Звучит как маркетинговый трюк, и отчасти это он — NVIDIA хочет посадить разработчиков на свою инфраструктуру. Но бесплатный tier реальный, и для прототипирования и пет-проектов его хватает. Я пользуюсь уже два месяца — расскажу, что получается, а где подвох.Что конкретно даютПлатформа — build.nvidia.com. Регистрируешься в NVIDIA Developer Program, подтверждаешь номер телефона, генерируешь API-ключ. Всё.Что доступно бесплатно:100+ моделей

продолжить чтение

Plumb Messenger, или все-таки Titanium? Как я подсматривал у больших дядь и создавал бекэнд для самописного мессенджера

В прошлой статье я притащил на Хабр Plumb — свой самописный мессенджер, цифровой бункер, гаражную игрушку и личный способ не зависеть от чужой кнопки «сегодня мы вас немножко ограничим».Я тогда честно сказал: это не убийца Telegram, не pitch deck для инвестора и не стартап с парнишей в худи, который произносит слово «экосистема» так важно, будто сейчас вызовет дождь.Это моя штука.Мой велосипед.Мой бункер.Мой маленький Франкенштейн, который сначала лежал на столе, потом резко подпрыгнул, потом сел, посмотрел на меня и как будто сказал: «Ну что, папаша, теперь у нас real-time».

продолжить чтение

Показываю, как я заменил JSON на TOON в LLM-промптах и сэкономил 40% токенов

Привет! Меня зовут Андрей, я фронтенд-разработчик в Cloud.ru

продолжить чтение

Сотрудник Sola Security через настройки единого входа в ChatGPT получил более 400 файлов компании

Сотрудник небольшой компании Sola Security решил уточнить у ChatGPT настройки единого входа. В итоге за доли секунды ИИ успел получить доступ к сотням внутренних документов. 

продолжить чтение

MCP не умер: почему ИИ-агенты тонут в контексте

Год назад Model Context Protocol (MCP) казался решением всех проблем разом. Один протокол, чтобы связать ИИ-агентов с GitHub, Slack, Jira и внутренними базами данных. Никаких кастомных плагинов, только чистая стандартизация. И индустрия в это поверила: к

продолжить чтение

1...234567...17