Онлайн-оценка рекомендательных систем: метрики, которые говорят сейчас
Всем привет! Меня зовут Василий Калинин, я senior-аналитик в отделе ML-аналитики музыкального сервиса Звук. Про то, чем занимается наша команда, мы уже писали ранее (можно почитать
Иск на $134 миллиарда: как ChatGPT теряет пользователей, пока Google и Илон Маск захватывают трон
Скорость сжигания денег, судебный процесс и вопрос на триллион долларов.
Мой тимлид не пишет код 3 года. Почему он — лучший тимлид, с которым я работал
На Хабре любят хейтить менеджеров, которые «забыли, как кодить». Мол, оторвались от реальности, не понимают сроков, не чувствуют боль разработчика. Я раньше тоже так думал. А потом попал в команду к человеку, который три года не открывал IDE, и за полгода понял, что был неправ.Контекст: что было доДо Серёги (это нынешний тимлид) у нас был Андрей. Андрей — зверь в техническом смысле. Кодовую базу знал так, что мог в голове прокрутить стек вызовов уровней на пять. Каждый PR ревьюил лично. Сам писал кучу кода.И команда его в итоге ненавидела. Не сразу — сначала было восхищение, потом привыкание, потом тихое раздражение.
SkillsBench: скиллы дают реальный буст, но только если их писал человек
Исследователи сделали первый бенчмарк, который измеряет, помогают ли «скиллы» ИИ-агентам решать задачи. Его назвали SkillsBench.Skill — это, по сути, папка с инструкциями, скриптами и подсказками, которую агент читает перед тем, как приступить к задаче. Что-то вроде методички для конкретной предметной области. Такие скиллы уже активно используются в Claude Code, Gemini CLI и Codex CLI, но до сих пор никто систематически не проверял, работают ли они вообще.
Как Anthropic убивает Биткоин?
Нативная валюта ИИ уже существует - она прячется у всех на виду, превосходя криптовалюты на шесть порядков.Мы находимся в начале эры тотальной машинной экономики - и вы держите в руках неправильные деньги.
Управляем поведением LLM: краткосрочные профили и их ограничения
В предыдущей части статьи
Андрей Карпаты только что создал полноценный GPT на 240 строках Python
Никакого PyTorch. Никакого TensorFlow. Только чистый Python и базовая математика.
Prompt injection для смелых духом: от zero-click атаки на 1.4B устройств до философского джейлбрейка
SQL-инъекцию мы лечили 20 лет и вылечили. Prompt injection — фундаментально нерешаема. Это не я придумал. OWASP ставит её на первое место второй год подряд. Найдена в 73% продакшн AI-систем при аудитах.Вы не за статистикой сюда пришли. Вы пришли за мясом. Ниже — 10 кейсов, которые не попали в типичный пересказ про Chevrolet за доллар. Тут пострашнее.
Apple добавит в CarPlay поддержку голосовых чат-ботов
Apple планирует расширить функциональность CarPlay за счет поддержки сторонних голосовых чат-ботов на базе искусственного интеллекта. Намеки на это были замечены в бета-версии iOS 26.4, сообщает портал MacRumors.

