статистика.

Доступность товара в «Магните»: от эвристик до CUSUM и GEE-тестов

продолжить чтение

Метрики упали в лужу

Нередкая ситуация, когда ваша модель спокойно себе крутится в проме, но внезапно прибегают аналитики с криками «у нас упало качество, посмотрите что может быть не так».Причин может быть множество, но сегодня я расскажу про одну из самых распространенных причин падения качества модели - Distribution shift.

продолжить чтение

Аналитика кибератак от Google

Компания Mandiant (дочка Google) подготовила довольно интересное исследование кибератак. Отчет основан на 500 тысячах часов расследований кибератак, проведенных Mandiant в 2025. Делимся с вами подробностями.Главное направления кибератак — эксплуатация уязвимостейПрочное первое место в отчёте в качестве первичных направлений кибератак — 32%. Всё больше становится инцидентов, связанных с социальной инженерией с использованием голосового фишинга и приложений для обмена сообщениями. Голосовой фишинг стал значительно опережать фишинг по электронной почте, на его долю пришлось 11% инцидентов, а вот на почту — только 6%.

продолжить чтение

Производящая функция моментов: что это и как она используется в анализе распределений

Производящая функция моментов (moment-generation functions) - это функция, которая служит альтернативным способом задания распределения вероятностей случайной величины. (Далее MGF - производящая функция моментов)Идея моментовДопустим, у нас есть случайная величина

продолжить чтение

Зависимости, которых не существует: как фильтрация искажает данные и что такое коллайдеры

Бабушкин телевизор работает уже сорок лет. Дед ездит на жигулях, видевших мороженое за пять копеек. Отцовский перфоратор пережил десяток ремонтов - и хоть бы что. А твой новый ноутбук умер на третий год, смартфон не держит заряд к концу дня, и Cloudflare лёг третий раз за месяц. Раньше делали на совесть. Это же очевидно.Нет.

продолжить чтение

70% новых статей по программной инженерии на ArXiv связаны с LLM

Данные о статьях, опубликованных с 2022 года на сервисе препринтов ArXiv, показывают, что в области программной инженерии лидирует тема LLM (больших языковых моделей). На них приходится 70% новых материалов.

продолжить чтение

У вас скорее всего не получится сделать статистически обоснованный подбор личных жизненных привычек и БАДов

Допустим, вас не устраивает ваше качество сна. Вы перестали делать очевидно вредные вещи (убрали кофе на ночь), и сон улучшился, но хотелось бы поработать над ним ещё. Коллега по работе даёт вам смесь трав со зверобоем и лавандой. Вы пробуете пить его на ночь вместо кофе, и вроде бы иногда сон действительно становится глубже, чем раньше. Но иногда нет. Вы готовы экспериментировать, но как бы проверить, действительно ли травы работают или это просто случайный разброс?

продолжить чтение

ИИ должен был облегчить работу людей — но на деле лишь увеличил нагрузку

продолжить чтение

Я позволил ИИ отслеживать мой телефон всю неделю. Вот что я потом узнал о себе

Я думал, что мои решения спонтанные. ИИ доказал, что каждое из них — это шаблон.

продолжить чтение

Рассчитать биологический возраст? Можно, а зачем?

Привет Хабр! На связи снова Дмитрий Крюков, руководитель группы «Исследования биомаркеров» лаборатории «Сильный ИИ в медицине» Института AIRI. Недавно мы с коллегами выпустили статью в npj Aging, в которой изрядно покритиковали калькуляторы биологического возраста (они же часы старения) и попытались поставить под сомнение саму возможность и даже необходимость расчёта биологического возраста. О некоторых проблемах часов старения я уже писал здесь

продолжить чтение