Машинное обучение. - страница 5

Anthropic обнулила лимиты после сбоя в Claude Code

Компания сообщила (https://x.com/ClaudeDevs/status/2061501787769893055), что полностью сбросила пятичасовой и недельный лимиты для всех подписчиков тарифов Pro и Max.Это решение должно компенсировать платным пользователям повышенный расход ресурсов, вызванный программным сбоем.Причиной проблемы стало то, что некоторые сессии Claude Code ошибочно запускали большое число параллельных субагентов. Из-за этого квоты расходовались заметно быстрее, чем предполагалось.

продолжить чтение

Selectel добавил модели для ранжирования текстов в Foundation Models Catalog

Мы добавили модели для ранжирования текстов (реранкеры) в наш каталог готовых моделей. С ними поиск в ваших приложениях станет значительно точнее.

продолжить чтение

Пещера Аладдина для безопасника: 754 навыка для AI-агента и что будет, если использовать их для своего NGFW

Разбираемся с открытой библиотекой Agent Skills для кибербезопасности на 754 навыка, показываем, как она устроена, и проводим живой эксперимент: даём агенту Hermes два навыка и просим разобрать реальный IPS-лог и провести аудит правил файрвола – сначала на бесплатной модели Owl Alpha (из-за того что подобную модель при желании можно использовать локально), затем на платной Opus 4.8 (Cloude Security). Сравниваем, где проходит граница между «бесплатно» и «дорого, но качественно».Откуда взялась «пещера»В одну ночь у нас на столе оказались четыре вещи: открытый репозиторий

продолжить чтение

Почему Word Error Rate (WER) недостаточно: Семантическая декомпозиция ошибок ASR

ОглавлениеВступлениеБизнес-ценность и определение проблемыКак измеряется качество распознавания речи?Недостатки индустриального стандартаКак мы измеряем точность моделей у себяЗадача 1: Получить корректный датасет и сделать результаты сопоставимымиЗадача 2: Понять, где именно ошибка и к какой категории она относитсяЗадача 3: Объединить ошибки и семантику

продолжить чтение

Пока все смотрят на LLM: почему классический ML годами зарабатывает сотни миллионов?

В ленте сплошные языковые модели и агенты, а инвесторы спорят про окупаемость GenAI. Тем временем «скучный» классический ML: градиентный бустинг, аплифт модели, recsys, поведенческая биометрика, до сих пор тихо приносит реальную выручку. Я Senior Data Scientist, работаю в финтехе, а также являюсь спикером по карьере и аналитике/ML в ИТМО и ВШЭ. В статье решил разобрать на реальных примерах зрелых компаний, которые уже доказали окупаемость, и одной из новой волны, что классика все еще жива и нужно знать истоки ML.Почему стоит об этом говорить

продолжить чтение

ИИ-компаньоны и подростки: что показывают исследования и о чём стоит знать родителям

Пока обсуждают, имеет ли смысл задавать домашку, если её решает нейросеть, часть подростков нашла ИИ другое применение — как собеседника на несколько часов в день. Собрала ключевые цифры и выводы из недавних исследований на эту тему.

продолжить чтение

Evals для чайников. Как тестировать AI-агента, чтобы понимать, где именно он ломается

Большинство команд оценивают производительность AI-агентов через end-to-end метрики: success rate, количество токенов, tool usage, стоимость запроса, долю успешных задач. Это полезно для общего контроля ситуации, но почти бесполезно для реальной диагностики системы.

продолжить чтение

Зачем backend разработчику Python, если он не собирается становиться data scientist

Начал смотреть в сторону Python не потому, что захотел стать data scientist.Мой основной опыт обычный back C#/.NET, банковские системы, REST API, микросервисы, Kafka, PostgreSQL, Docker/OpenShift, CI/CD и сопровождение. Позже добавилась Java/Spring Boot. То есть моя базовая картина мира это не notebooks и не обучение моделей а сервисы, интеграции, продакшен, логи и ответственность за результат.Но когда я начал разбираться с LLM быстро понял, вызвать модель можно почти из любого языка, а вот руками понять RAG, embeddings, локальные модели, чанкинг, evaluation и большинство новых AI инструментов проще всего через Python.

продолжить чтение

Hermes Agent сжигал 603M токенов за спиной — как я сократил фоновые расходы в 125 раз

Обложка: routing моделей в Hermes AgentНа днях я заметил, что квота Ollama Cloud Pro тратится быстрее обычного. Значительно быстрее. За семь дней я сжёг 603 миллиона токенов

продолжить чтение

Искусственный интеллект без магии: Гигачат, нейросети, профессии и риск «дешёвого апокалипсиса» — интервью с Сергеем

продолжить чтение

1...345678...2030...465