анализ данных. - страница 2

Чем же типичный заметковед занимается, когда работает со своими записями? Типизация деятельности заметковеда

Небольшое, но важное уточнение того, откуда этот исследовательский отчет.Меня зовут Рустам Агамалиев, я учитель и исследователь, автор нескольких книг и некоторого множества публикаций. На данный момент моя работа происходит на стыке педагогики, когнитивистики, лингвистики и психологии; я в основном работаю с детьми и студентами.Последние 7 лет занимаюсь развитием сообщества

продолжить чтение

Руководство по PyTorch для новичков: создаём модель множественной регрессии с нуля

TL;DRАвтор берёт датасет Abalone и проводит подробный EDA: проверяет распределения, выбросы, мультиколлинеарность и видит выраженную гетероскедастичность целевой переменной.Строится базовая линейная регрессия (c лог-преобразованием целевой), фильтруются выбросы, добавляются полиномиальные признаки — качество улучшается, но упирается в ограничения самой постановки.Далее реализуется полносвязная нейросеть в PyTorch с подбором гиперпараметров, обучением на mini-batch и валидацией по RMSE.

продолжить чтение

Как мы в Fix Price делегировали проверку договоров ИИ

С развитием нашей компании и выходом на новые рынки (а магазины Fix Price работают не только в России, но также в ряде стран ближнего зарубежья и даже в ОАЭ) значительно увеличилось число задач по согласованию первичных договоров аренды. За 2024 год на согласование контролёру поступило 919 новых договоров аренды, а за первую половину 2025 года — уже 438. Поскольку с первого раза договоры в большинстве случаев не согласовываются, они возвращаются на доработку, и количество задач специалиста возрастает в разы.

продолжить чтение

Нужно ли аналитику данных машинное обучение — и как его освоить

Нужно ли аналитику машинное обучение? Ответ неоднозначный: всё зависит от места работы и планов в профессии.Меня зовут Раф, я аналитик ценообразования в Авито (а раньше в Яндекс Лавке), преподаватель машинного обучения в Центральном университете, выпускник факультета компьютерных наук в НИУ ВШЭ и курса «Специалист по Data Science» в Яндекс Практикуме. В этой заметке я расскажу, зачем аналитику машинное обучение, когда без него можно обойтись и как его освоить, если этого потребуют задачи.

продолжить чтение

DCN-R: как объединить Deep & Cross-модель и ResNet-подход для улучшения рекомендаций

GitHubМотивация и постановка задачиВ индустрии путешествий выбор отеля определяется не только ценой или фотографиями, но и уровнем доверия к источнику рекомендаций. Официальные отзывы часто кажутся обезличенными, а алгоритмические подборки - слишком «машинными» и лишёнными человеческого контекста.

продолжить чтение

Сравнение инструментов разметки данных для CV: Label Studio & CVAT & Roboflow — опыт разметки 6000+ изображений

Если вы хоть раз обучали модель компьютерного зрения, вы знаете, как качество данных решает всё. На первый взгляд кажется, что задачи у всех инструментов одинаковые: поставить рамку, провести полигон, экспортировать данные, но в реальности всё упирается в детали:как быстро аннотатор может разметить тысячу изображений;удобно ли контролировать качество и правки;можно ли подключить модель для предразметки;как работает экспорт и интеграция с ML-пайплайном;где будут храниться данные - на сервере компании или в облаке;

продолжить чтение

What‑if анализ сегодня: от Excel‑зоопарка к ИИ‑агентам

Всем привет!Меня зовут Александр Костюков, я занимаюсь стратегическим развитием ИИ-аналитика EasyReport. Сегодня хочу поделиться с вами своими размышлениями о том, как анализ “что если” превращается из экселевской игрушки в реальный управленческий инструмент, который теперь можно автоматизировать.“Что если” и с чем его едятВыравниваем инфо-поле:What-if анализ — это метод оценки последствий изменения входных параметров какой-то рассчитываемой модели, например: - “Что произойдет с себестоимостью единицы продукции и маржой, если тариф на э/э вырастет на 3%?”; - “

продолжить чтение

Наука для бизнеса: что внедрять завтра (анализ 134 195 научных работ 2025 года)

Почему научные статьи?Чтобы понять, какие технологии будут определять рынок завтра, компании опираются на прогнозы/отчёты аналитиков или (за рубежом) анализируют патенты. Но есть источник, который часто опережает и патенты - научные публикации. Именно в лабораториях и университетах появляются методы, которые через год-два становятся основой RnD бизнеса, а затем - реальными продуктами.

продолжить чтение

Безопасность — это не отсутствие структуры, а наличие правильной структуры: топология как новый язык науки

"Геометрия — это искусство правильно рассуждать на incorrectly drawn figures" — Анри Пуанкаре "Криптография — это искусство обеспечения безопасности через правильную топологию" — современная формулировкаВведениеМы привыкли думать о безопасности как о чем-то случайном: "чем больше случайности, тем безопаснее". Но что если это заблуждение? Что если настоящая безопасность — не в отсутствии структуры, а в наличии правильной структуры?

продолжить чтение

«Нанософт» сказал — «Нанософт» сделал. Представляем новые ИИ-модули NSR Specification для инженеров и проектировщиков

Команда NSR SpecificationАнонсируем обещанную осеннюю премьеру обновления цифровой платформы NSR Specification для автоматизации проектирования с модулями семантического анализа и семантического поиска. 23 октября приглашаем присоединиться к 

продолжить чтение

Rambler's Top100