pandas.

Ускоряем и оптимизируем numpy, pandas, scipy и sklearn

С момента публикации статьи на Хабре «Импортозамещаем numpy, pandas, scipy и sklearn» прошло почти три года. В течение этого времени я приостановил работу над проектом из-за нехватки времени, ресурсов и сил. К тому же, меня расстроило, что не смог выполнить просьбу пользователя @N-Cube, который активно интересовался моей библиотекой и хотел ускорить работу своего Jupyter Notebook.

продолжить чтение

Оставлено в

Почему не всегда Pandas — лучший выбор (и когда стоит попробовать Polars)

Привет, Хабр! Меня зовут Данила Ляпин, я Senior Data Scientist в Яндексе и автор курса «Специалист по Data Science» в Яндекс Практикуме.В современном мире анализа данных пользу библиотеки Pandas трудно переоценить — она используется везде экспертами любого уровня: от стажёров до техлидов, а последние годы это де-факто стандарт в аналитике.

продолжить чтение

Оставлено в

Анализируем финансовые рынки с помощью Python

Современный финансовый анализ немыслим без качественных данных и для частного инвестора, трейдера или аналитика умение получать и обрабатывать рыночную информацию становится таким же базовым навыком, как когда‑то работа с Excel. Python с его экосистемой финансовых библиотек превратился в стандартный инструмент для решения этих задач. В этой статье мы поговорим о том, как работать с мировыми финансовыми данными через Yahoo Finance и как получать котировки с российских площадок — Московской биржи и Тинькофф Инвестиций.Почему Python?

продолжить чтение

Оставлено в

Метрики упали в лужу

Нередкая ситуация, когда ваша модель спокойно себе крутится в проме, но внезапно прибегают аналитики с криками «у нас упало качество, посмотрите что может быть не так».Причин может быть множество, но сегодня я расскажу про одну из самых распространенных причин падения качества модели - Distribution shift.

продолжить чтение

Оставлено в

Рейтинг языков программирования на GitHub: анализ 2024–2025 в JupyterLab и Anaconda

Автор: Иван Богданов, Технический писатель Каждый раз, когда выходит новый рейтинг языков программирования типа TIOBE или RedMonk, в комментариях начинается одно и то же. Python не может быть первым, Rust переоценен, TypeScript вообще непонятно где. Рейтинги считают по-разному: одни смотрят на поисковые запросы, другие — на упоминания в репозиториях и на форумах, третьи проводят опросы среди разработчиков. Каждый метод дает свой результат, и у каждого найдутся критики.

продолжить чтение

Оставлено в

Одна функция, которая заменила аналитика

Алексей — финансовый директор. Умный, занятой, не любящий ждать. Каждый понедельник он открывает Excel с продажами за прошлую неделю и задаёт вопросы.Но Excel — не собеседник. Алексей идёт к аналитику.Аналитик строит сводную, ищет причины, пишет письмо. Иногда это занимает полдня. Иногда — до вторника.Я посчитал: среднее время от вопроса Алексея до ответа было 2 часа 17 минут. Сейчас — 4 минуты 30 секунд. Алексей пишет вопрос в чат, получает ответ с цифрами и объяснением.Расскажу, как это работает. Без BI-систем, без баз данных, без аналитика в цепочке — просто Python и Claude API.Что за задача

продолжить чтение

Оставлено в

Pandas на Python: От чтения CSV до сложной аналитики за 1 статью

1. Введение и быстрый старт: Excel на максималкахДавайте начистоту. Если вы когда-нибудь пытались анализировать табличные данные с помощью стандартных списков и словарей Питона, вы знаете, какая это боль. Циклы внутри циклов, куча проверок на пустоту, простыни кода ради простейшей группировки...А если вы пробовали открыть CSV-файл на пару-тройку миллионов строк в обычном Excel — ну, вы наверняка помните этот зависший белый экран и звук взлетающего кулера.Так вот, Pandas

продолжить чтение

Оставлено в

Зачем аналитику математика

Если ваша работа ограничивается построением дашбордов в Excel и ответами на вопрос «сколько заработали вчера» – матан вам и правда не нужен, но если вы хотите понимать, почему метрики ведут себя именно так, а не иначе, и тем более – прогнозировать их поведение, то без производных, логарифмов и пределов вы не обойдетесь. В интернете тонны статей «Математика для аналитиков», но они либо уходят в дебри интегрирования по частям, либо ограничиваются уровнем «логарифм – это штука, которая делает большие числа маленькими». Давайте попробуем найти золотую середину.1 Логарифмы

продолжить чтение

Оставлено в

Книга «Python для инженерных задач»

Приветствуем, коллеги.Расскажем вам о нашей долгожданной новинке – «Python для инженерных задач». Эту книгу написал уважаемый Евгений Ильин @jenyay, кандидат технических наук, преподаватель Московского Авиационного Института. В основу книги легли его университетские наработки, объём более чем внушительный – 672 страницы. Тем не менее, поскольку эта книга ориентирована на самую широкую аудиторию инженеров, мы решили выпустить её в серии «Самоучитель», из которой вам также может быть известен знаменитый «

продолжить чтение

Оставлено в

5 техник, применяемых в анализе временных рядов, которые должен знать каждый. Часть 2

В этом руководстве мы будем разбираться, как повысить качество прогнозирования с помощью машинного обучения, используя точные методы разделения данных, перекрестную проверку временных рядов, конструирование признаков и многое другое!Конструирование признаков для временных рядов: создание идеального рецепта данныхВ отличие от традиционных наборов данных, где объекты часто остаются статичными, данные временных рядов обладают уникальными временными паттернами, которые необходимо использовать для извлечения значимых признаков.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

pandas.

Ускоряем и оптимизируем numpy, pandas, scipy и sklearn

Почему не всегда Pandas — лучший выбор (и когда стоит попробовать Polars)

Анализируем финансовые рынки с помощью Python

Метрики упали в лужу

Рейтинг языков программирования на GitHub: анализ 2024–2025 в JupyterLab и Anaconda

Одна функция, которая заменила аналитика

Pandas на Python: От чтения CSV до сложной аналитики за 1 статью

Зачем аналитику математика

Книга «Python для инженерных задач»

5 техник, применяемых в анализе временных рядов, которые должен знать каждый. Часть 2

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

pandas.