Сотрудник «сжёг» токенов на $81 тыс. для пет-проекта, после того как компания попросила активнее использовать нейросети
Финтех-стартап Slash из Сан-Франциско рассказал, что один из сотрудников сжёг AI-токенов на 81 тыс. долларов после того, как руководство попросило активнее использовать нейросети. При этом ресурсы потратили не на рабочие задачи, а на разработку веб-шутера.
Пользователь обвинил Anthropic в занижении лимитов платных тарифов Claude
Подписчик Claude подал в суд на Anthropic, утверждая, что компания ввела потребителей в заблуждение относительно лимитов использования тарифных планов Max.
Что такое контекстное окно и почему модели забывают
Ты час разговариваешь с ChatGPT. Даёшь контекст, объясняешь задачу, уточняешь детали. А потом модель вдруг начинает противоречить тому, что говорила раньше. Забывает имя персонажа которое ты указал в самом начале. Спрашивает то, о чём вы уже договорились.Первая реакция - что-то сломалось. Но это не баг. Это фундаментальное ограничение архитектуры, у которого есть название и объяснение.Модель не помнит - она читаетГлавное заблуждение про языковые модели - что у них есть память. Что где-то внутри хранится история ваших разговоров, и модель к ней обращается.Это не так.
Гендиректор Coinbase рассказал, как наращивать использование нейросетей, не раздувая бюджеты на токены
Гендиректор криптобиржи Coinbase Брайан Армстронг
Uber ограничивает расходы сотрудников на ИИ после превышения годового бюджета на эти цели за 4 месяца
Uber ограничила расходы сотрудников на инструменты искусственного интеллекта после того, как компания превысила годовой бюджет на эту технологию за четыре месяца, пишет Bloomberg. Технологическая компания установила лимит в $1,5 тыс. на одного сотрудника и на каждый агентный инструмент кодирования, включая Claude Code или Cursor от Anthropic.
Новая система оплаты на основе токенов в Github Copilot вызвала негодование среди разработчиков
Github Copilot от Microsoft переходит с фиксированной абонентской платы на систему оплаты токенами, что потенциально может привести к значительному увеличению расходов пользователей. Это изменение вызвало возмущение среди разработчиков.
Американская компания потратила $500 млн на токены для Claude за месяц, так как не установила лимиты для сотрудников
Неназванная американская компания за месяц потратила $500 млн на токены для Claude от Anthropic, поскольку не установила лимиты для сотрудников, пишет Axios со ссылкой на консультанта по искусственному интеллекту.
Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать
В этой статье рассмотрим 7 распространенных ошибок, которые разработчики допускают при создании MCP‑серверов на FastMCP: от отсутствующих аннотаций инструментов и слабой обработки ошибок до ответов, расходующих слишком много токенов, и пробелов в безопасности. Поговорим о конкретных способах исправления каждой ошибки.
Короткий промпт ≠ дешёвый промпт: как оптимизация ломает prefix cache в LLM-агентах
Привет, Хабр! Меня зовут Сергей Нотевский, я AI Platform Lead в Битрикс24.Это третья статья серии про prefix caching: первая - про экономику кэширования и особенности разных провайдеров, вторая - про антипаттерны в простых сценариях. А здесь про то, как та же механика работает против вас в агентном цикле.TL;DRЕсли на каждом шаге менять tools, system prompt или ранние блоки context, prefix cache будет часто начинаться заново.Поэтому большой, но стабильный список tools иногда дешевле, чем маленький список, который постоянно пересобирается.

