Anthropic обнулила лимиты после сбоя в Claude Code
Компания сообщила (https://x.com/ClaudeDevs/status/2061501787769893055), что полностью сбросила пятичасовой и недельный лимиты для всех подписчиков тарифов Pro и Max.Это решение должно компенсировать платным пользователям повышенный расход ресурсов, вызванный программным сбоем.Причиной проблемы стало то, что некоторые сессии Claude Code ошибочно запускали большое число параллельных субагентов. Из-за этого квоты расходовались заметно быстрее, чем предполагалось.
Selectel добавил модели для ранжирования текстов в Foundation Models Catalog
Мы добавили модели для ранжирования текстов (реранкеры) в наш каталог готовых моделей. С ними поиск в ваших приложениях станет значительно точнее.
Пещера Аладдина для безопасника: 754 навыка для AI-агента и что будет, если использовать их для своего NGFW
Разбираемся с открытой библиотекой Agent Skills для кибербезопасности на 754 навыка, показываем, как она устроена, и проводим живой эксперимент: даём агенту Hermes два навыка и просим разобрать реальный IPS-лог и провести аудит правил файрвола – сначала на бесплатной модели Owl Alpha (из-за того что подобную модель при желании можно использовать локально), затем на платной Opus 4.8 (Cloude Security). Сравниваем, где проходит граница между «бесплатно» и «дорого, но качественно».Откуда взялась «пещера»В одну ночь у нас на столе оказались четыре вещи: открытый репозиторий
Почему Word Error Rate (WER) недостаточно: Семантическая декомпозиция ошибок ASR
ОглавлениеВступлениеБизнес-ценность и определение проблемыКак измеряется качество распознавания речи?Недостатки индустриального стандартаКак мы измеряем точность моделей у себяЗадача 1: Получить корректный датасет и сделать результаты сопоставимымиЗадача 2: Понять, где именно ошибка и к какой категории она относитсяЗадача 3: Объединить ошибки и семантику
Пока все смотрят на LLM: почему классический ML годами зарабатывает сотни миллионов?
В ленте сплошные языковые модели и агенты, а инвесторы спорят про окупаемость GenAI. Тем временем «скучный» классический ML: градиентный бустинг, аплифт модели, recsys, поведенческая биометрика, до сих пор тихо приносит реальную выручку. Я Senior Data Scientist, работаю в финтехе, а также являюсь спикером по карьере и аналитике/ML в ИТМО и ВШЭ. В статье решил разобрать на реальных примерах зрелых компаний, которые уже доказали окупаемость, и одной из новой волны, что классика все еще жива и нужно знать истоки ML.Почему стоит об этом говорить
ИИ-компаньоны и подростки: что показывают исследования и о чём стоит знать родителям
Пока обсуждают, имеет ли смысл задавать домашку, если её решает нейросеть, часть подростков нашла ИИ другое применение — как собеседника на несколько часов в день. Собрала ключевые цифры и выводы из недавних исследований на эту тему.
Evals для чайников. Как тестировать AI-агента, чтобы понимать, где именно он ломается
Большинство команд оценивают производительность AI-агентов через end-to-end метрики: success rate, количество токенов, tool usage, стоимость запроса, долю успешных задач. Это полезно для общего контроля ситуации, но почти бесполезно для реальной диагностики системы.
Hermes Agent сжигал 603M токенов за спиной — как я сократил фоновые расходы в 125 раз
Обложка: routing моделей в Hermes AgentНа днях я заметил, что квота Ollama Cloud Pro тратится быстрее обычного. Значительно быстрее. За семь дней я сжёг 603 миллиона токенов

