- BrainTools - https://www.braintools.ru -
Сегодня ни один крупный проект в области машинного обучения [1] (ML) не обходится без фреймворков — готовых наборов библиотек, в которых базовые алгоритмы уже оптимизированы для различных архитектур. Выбор правильного фреймворка не только упрощает разработку, но и определяет успех проектов по внедрению искусственного интеллекта [2].
В этой статье эксперты лаборатории искусственного интеллекта российской ИТ-компании «Криптонит» рассматривают самые актуальные фреймворки для машинного обучения, анализируют причины их популярности, ключевые области применения и тенденции развития. Аналитика строится как на собственном опыте [3], так и на данных специализированных источников, таких как GeeksforGeeks, Upgrad, Octal Software и других, чтобы предоставить аргументированный и непредвзятый обзор.
Мы разделили обзор на две части. В первой рассматриваются фреймворки для глубокого обучения. Они ориентированы на построение и обучение нейронных сетей, в том числе сложных архитектур, таких как свёрточные модели и трансформеры. Вторая часть посвящена фреймворкам для классического машинного обучения. Они используются для работы с моделями, основанными на регрессии, решающих деревьях, методах ансамблирования (например, бустинг) и других алгоритмах без использования глубоких нейросетей.
PyTorch разработан Meta AI. Её головная компания признана экстремистской организацией в России, но статус самого дочернего подразделения остаётся неясным. Официально PyTorch никто не запрещал. Он известен своим интуитивно понятным API и императивным стилем программирования. В PyTorch используются динамические графы вычислений, что упрощает прототипирование и отладку моделей, что особенно важно в исследованиях. Если в вашей компании есть подразделение R&D, наверняка оно уже использует PyTorch.
В 2025 году PyTorch занимает первое место по популярности в России (об этом подробнее ниже) и второе в США и ЕС [4] [4]. Его динамический граф вычислений делает PyTorch любимцем исследователей, а поддержка облачных сервисов (например, Microsoft Azure) упрощает решение производственных задач [3] [5]. Недавние улучшения PyTorch включают в себя расширенные возможности распределённого обучения и интеграцию с облачными платформами [3] [5].
PyTorch активно используется в задачах глубокого обучения, таких как компьютерное зрение [6], обработка естественного языка (NLP) и различные исследования в области ИИ. Его гибкость делает PyTorch идеальным для экспериментов с новыми архитектурами нейронных сетей.
Гибкость PyTorch делает его основой для мощных библиотек, таких как PyTorch Lightning и Fastai, которые упрощают разработку моделей глубокого обучения. Эти фреймворки созданы для ускорения рабочих процессов, минимизации рутинного кода и повышения доступности глубокого обучения как для исследователей, так и для бизнеса.
PyTorch Lightning — это обёртка над PyTorch, которая структурирует код и автоматизирует рутинные задачи, сохраняя гибкость базового фреймворка. Она стандартизирует процесс обучения моделей, разделяя исследовательскую логику [7] (архитектура модели) от инженерной (циклы обучения, логирование, распределённое обучение). Это особенно полезно для команд, где исследователи хотят сосредоточиться на экспериментах, а инженеры — на масштабировании и других технических задачах.
PyTorch Lightning идеально подходит для R&D-команд, разрабатывающих сложные модели, например, для компьютерного зрения или NLP, где важна скорость выполнения экспериментов и воспроизводимость результатов.
Fastai — это высокоуровневая библиотека, построенная поверх PyTorch, ориентированная на простоту и быстрый старт. Она предлагает готовые решения для стандартных задач глубокого обучения, таких как классификация изображений или обработка текстов, с минимальным количеством кода. Fastai идеально подходит для молодых специалистов и бизнеса, которые хотят быстро внедрить ИИ без глубокого погружения в детали.
“В нашей лаборатории большой популярностью пользуется фреймворк PyTorch. Мы применяем его для решения широкого спектра задач в области компьютерного зрения (CV), обработки аудиосигналов и естественного языка (NLP). PyTorch обеспечивает высокий уровень гибкости и интуитивно понятный интерфейс, что особенно важно на этапе прототипирования и проверки гипотез. Вместе с тем модели, обученные на PyTorch, достаточно легко конвертируются в форматы, которые мы используем при инференсе в продакшене. Для ускорения и стандартизации процесса обучения и сборки моделей часть команды использует PyTorch Lightning. Он позволяет упростить код, отделить логику модели от инфраструктурных аспектов (таких как логирование, сохранение чекпоинтов, работа с multi-GPU и др.), а также легко интегрировать трекинг экспериментов с помощью сторонних сервисов. Благодаря этому время на подготовку эксперимента и его отладку сокращается, а воспроизводимость результатов повышается. Но вместе с тем некоторые коллеги отмечают потерю гибкости и контроля, поскольку Lightning прячет многое «под капотом», что усложняет отладку нестандартных моделей и пайплайнов. Также мы не рекомендуем Lightning младшим коллегам, которые только начинают обучать модели. Высокий уровень абстракции затрудняет понимание того, что реально происходит в процессе обучения”, — сказал руководитель лаборатории искусственного интеллекта компании “Криптонит” Виталий Пирожников.
TensorFlow, разработанный командой Google Brain, остаётся одним из самых популярных и универсальных фреймворков для машинного обучения. Он поддерживает широкий спектр задач, включая глубокое обучение, и предлагает версии для мобильных устройств (TensorFlow Lite) и веб-приложений (TensorFlow.js). Поддержка GPU/TPU и статические графы вычислений обеспечивают высокую скорость и масштабируемость.
По данным GeeksforGeeks, TensorFlow лидирует по количеству упоминаний в научных публикациях и активности в сообществе GitHub [2] [8]. В 2025 году TensorFlow продолжает доминировать благодаря поддержке Google, интеграции с облачными платформами (например, Google Cloud) и универсальности [3] [5]. Новые оптимизации TensorFlow, выполненные в 2024 – 2025 годах, улучшают его производительность и скорость обучения, а расширенная поддержка оборудования (GPU и TPU) позволяет быстрее развёртывать модели [3] [5].
TensorFlow идеально подходит для задач компьютерного зрения, распознавания речи и рекомендательных систем. Его экосистема включает TensorFlow Extended (TFX) для создания конвейеров ML.
Для корпоративных решений часто выбирают TensorFlow, в том числе и благодаря лёгкости его интеграции с облачными платформами. Также он востребован в производственных системах, в которых требуется масштабируемость и скорость.
Говоря о TensorFlow, стоит упомянуть и его «обёртку» Keras.
Изначально созданный Франсуа Шолле, с 2017 года Keras интегрирован в экосистему TensorFlow как высокоуровневый API. Сейчас он также поддерживает другие бэкенды, такие как PyTorch и JAX (о нём поговорим отдельно).
Как часть экосистемы TensorFlow, Keras наследует его мощь: поддержку GPU/TPU, распределённое обучение и интеграцию с TensorFlow Extended (TFX) для создания мощных конвейеров.
Keras предлагает лаконичный и понятный интерфейс, который позволяет создавать нейронные сети в несколько строк кода. Это снижает порог входа для новичков и ускоряет прототипирование. Он предоставляет готовые строительные блоки (слои, оптимизаторы, функции активации), которые легко комбинировать для создания сложных архитектур. Это делает Keras универсальным для задач от классификации изображений до обработки текстов.
В целом Keras ориентирован на простоту, гибкость и быстрый старт, что делает его разумным выбором для молодых специалистов и компаний, внедряющих ИИ в свои бизнес-процессы.
JAX — это фреймворк для высокопроизводительных вычислений и машинного обучения, разработанный Google Research. Он сочетает гибкость Python с мощью аппаратного ускорения, предлагая уникальный подход к построению моделей глубокого обучения.
В частности, JAX использует XLA (Accelerated Linear Algebra), что обеспечивает оптимизацию вычислений на GPU и TPU. Это позволяет достичь высокой скорости обучения, сравнимой с TensorFlow, но с большей гибкостью.
Однако, в отличие от императивного стиля PyTorch, JAX использует чисто функциональное программирование, где модели описываются как неизменяемые функции.
В JAX используется библиотека autograd для автоматического вычисления градиентов, что делает его идеальным для задач оптимизации и глубокого обучения. Его функциональный стиль программирования упрощает работу с градиентами. Также JAX поддерживает JIT (Just-In-Time) компиляцию через jax.jit, что оптимизирует код для конкретного оборудования. Экосистема JAX включает библиотеки Flax и Haiku, которые упрощают создание нейронных сетей.
В целом JAX ориентирован на продвинутых исследователей и специалистов, работающих над передовыми задачами ИИ, а также на сложные задачи бизнеса, требующие высокой производительности.
Разница между фреймворком и большой библиотекой довольно условна. Поэтому для полноты картины стоит упомянуть scikit-learn. Это библиотека Python для классического машинного обучения. Она поддерживает широкий спектр алгоритмов, включая регрессию, классификацию,кластеризацию, понижение размерности и препроцессинг. Её выбирают для быстрого прототипирования и других задач классического ML, где не требуется глубокое обучение.
Библиотека scikit-learn имеет хорошую совместимость с другими библиотеками Python, такими как NumPy, XNumPy [9] и pandas. Её часто используют на первом этапе конвейера для предобработки данных.
Несмотря на растущее число конкурентных решений, scikit-learn остаётся лидером в задачах классического ML благодаря своей простоте и обширной документации [2] [8][4] [4]. Эту библиотеку особенно любят специалисты по анализу данных [5] [10].
XGBoost — это фреймворк для градиентного бустинга (постепенного повышения точности предсказаний деревьев решений), оптимизированный для максимальной производительности и лёгкой масштабируемости. Он особенно популярен в задачах прогнозирования и часто используется в соревнованиях по машинному обучению. Если вы участвовали в хакатонах по ML, то наверняка сталкивались с ним.
По данным Octal Software, XGBoost является одним из лучших инструментов для градиентного бустинга на структурированных данных [5] [10]. Он остаётся популярным благодаря своей скорости, точности и простоте использования.
XGBoost идеален для задач классического машинного обучения, таких как классификация, регрессия и ранжирование. Он широко используется в финансовых моделях, системах рекомендаций и анализе данных.
Традиционно XGBoost выбирают для задач, где требуется высокая точность на структурированных данных.
CatBoost — ещё один популярный фреймворк для градиентного бустинга, разработанный специалистами компании «Яндекс». Его можно рассматривать как эволюционное продолжение XGBoost. Оба фреймворка используют деревья решений и градиентный бустинг для построения моделей, но CatBoost вносит качественные улучшения.
В отличие от XGBoost, который требует ручного кодирования категориальных признаков, CatBoost автоматически обрабатывает их с помощью алгоритма ordered boosting. Это упрощает подготовку данных и снижает риск переобучения, обеспечивая более надёжные результаты на новых данных.
CatBoost завоевал популярность среди специалистов по машинному обучению (особенно российских) благодаря своей способности эффективно работать с категориальными данными. Он выполняет их автоматическое преобразование в числовые, что улучшает качество моделей и экономит время. Оптимизированный алгоритм и поддержка GPU позволяют CatBoost быстро обучать модели даже на больших наборах данных. Он хорошо подходит для задач классификации, регрессии и ранжирования.
Как XGBoost, так и CatBoost легко интегрируются с Python. Также они поддерживают интеграцию с pandas и scikit-learn. У обоих фреймворков есть подробная документация и развитое сообщество, что помогает быстрее их освоить.
LightGBM — это высокопроизводительный фреймворк для градиентного бустинга, разработанный Microsoft. Он использует алгоритм Histogram-based Gradient Boosting, который группирует данные в гистограммы, значительно снижая объём памяти [11] и ускоряя обучение.
Это особенно важно для работы с большими данными. Фреймворк оптимизирован для обработки миллионов строк и тысяч признаков, что актуально для многих бизнес-приложений из сферы BigData, таких как прогнозирование спроса, многофакторная оценка рисков и глубокий анализ клиентских данных.
LightGBM строит деревья по принципу leaf-wise (разделение листьев с максимальным снижением функции потерь), в отличие от level-wise подхода XGBoost и CatBoost. Это позволяет создавать более глубокие и сложные деревья. Такой подход повышает точность предсказаний, но требует более тщательной настройки для предотвращения переобучения.
В отличие от XGBoost, у которого категориальные признаки требуют предварительного кодирования, LightGBM поддерживает их напрямую, разбивая категории на основе гистограмм. Однако, по сравнению с CatBoost, LightGBM применяет более простое разбиение, что менее эффективно с наборами данных, имеющих большое количество категорий.
Дополнительно LightGBM использует технику Gradient-based One-Side Sampling (GOSS), которая отбирает данные с большими градиентами для обучения, игнорируя менее информативные. Это отличает его от XGBoost, который обрабатывает все данные. GOSS ускоряет обучение ценой незначительной потери точности.
Часто LightGBM применяется в рекомендательных системах, кредитном скоринге и маркетинге. Его способность работать с категориальными признаками без предварительного кодирования упрощает подготовку данных и экономит время.
Среди ключевых трендов развития фреймворков машинного обучения можно выделить следующие:
Доминирование TensorFlow и PyTorch
Анализ HashDork за 2025 год подтверждает доминирование TensorFlow и PyTorch среди фреймворков глубокого обучения. TensorFlow выделяется своей масштабируемостью и всесторонними инструментами для производственных сред, тогда как PyTorch ценится за гибкость и динамические вычислительные графы в исследовательских задачах.
TensorFlow продолжит лидировать благодаря поддержке Google, интеграции с облачными платформами и универсальности. PyTorch укрепит позиции в исследованиях благодаря гибкости и удобству.
Облачные платформы как фактор выбора
Облачные платформы (Azure, AWS, Google Cloud и другие) будут продолжать поддерживать TensorFlow, PyTorch и scikit-learn, делая их основными инструментами для корпоративных решений.
Снижение популярности менее гибких инструментов
Фреймворки, ориентированные на экосистемы отдельных разработчиков (такие как СТЕЛ и MXNet), снизят популярность из-за менее активного сообщества и ограниченной поддержки, оставаясь в узкоспециализированных нишах.
Рост AutoML и MLOps
Инструменты автоматизации машинного обучения (AutoML) и операционализации ML (MLOps) станут ещё более важными для бизнеса. Продолжат набирать популярность облачные платформы для машинного обучения (такие как H2O.ai [12] и Amazon SageMaker). Однако в России их применение может быть ограничено из-за санкционного давления и запрета размещения некоторых данных на зарубежных серверах.
Согласно обзору Unite.AI [13] за 2025 год, облачные платформы машинного обучения, такие как Azure Machine Learning, Google Cloud Vertex AI и Amazon SageMaker, находятся в авангарде, обеспечивая надёжную поддержку популярных фреймворков [6] [14]. Эта интеграция позволяет упростить развёртывание и масштабирование моделей машинного обучения, удовлетворяя потребности [15] как исследований, так и производственных задач.
Интеграция с квантовыми вычислениями
С развитием квантовых компьютеров ожидается рост интеграции ML с квантовыми вычислениями. Фреймворки, такие как TensorFlow Quantum, могут стать ключевыми инструментами в этой области.
Мы также провели исследование популярности фреймворков в вакансиях ML/DL-специалистов на платформе Head Hunter [7] [16]. Поиск производился по упоминанию фреймворка в описании к вакансии. Рассматривались вакансии в РФ.

Российская специфика в том, что наши специалисты по ML/DL почти не используют зарубежные облачные сервисы, с которыми тесно интегрированы популярные в США и ЕС фреймворки [4] [4]. Поэтому в тройку лидеров по России вошли фреймворки с открытым исходным кодом, из которых можно выжать максимум на своей инфраструктуре (on premise).
«На мой взгляд, TensorFlow среди российских специалистов постепенно теряет свою популярность. Сегодня его применение чаще связано с поддержкой legacy-проектов, чем с разработкой новых решений. Дополнительным подтверждением этого тренда служит тот факт, что в университетских курсах, связанных с ИИ, все чаще обучают именно работе с PyTorch. Гибкость, простота и сильное сообщество становятся сегодня ключевыми факторами выбора – особенно для тех, кто вскоре будет задавать тон в индустрии», — пояснила старший специалист-исследователь лаборатории искусственного интеллекта компании «Криптонит» Анна Холькина.
|
Фреймворк |
Основные задачи |
Преимущества |
Недостатки |
|
PyTorch |
Исследования, глубокое обучение, компьютерное зрение, обработка естественного языка |
Гибкость, удобство отладки, динамический граф, обёртки PyTorch Lightning и fastai |
Меньше инструментов для развёртывания в продакшене, мониторинга и визуализации экспериментов |
|
TensorFlow |
глубокое обучение, компьютерное зрение, обработка естественного языка |
Масштабируемость, готовые модели, поддержка Google, облачная интеграция, обёртка Keras
|
Сложен в освоении, статический граф |
|
JAX |
Генеративный ИИ, физическое моделирование, HPC, обучение нейронных сетей |
функциональное программирование, глубокая оптимизация на TPU |
Сложен в освоении, мало готовых решений |
|
XGBoost |
Классическое ML, градиентный бустинг, прогнозирование |
Высокая точность, скорость, простота использования |
Ограничен структурированными данными |
|
LightGBM |
BigData, градиентный бустинг |
Прямая поддержка категориальных признаков |
Упрощённая разбивка категорий |
|
scikit-learn |
Классическое ML, анализ данных |
Простота, обширная документация и большой набор алгоритмов, интеграция с Python |
Нет поддержки глубокого обучения. Больше ограничений для BigData |
Выбор фреймворка для машинного обучения как и прежде зависит от конкретных потребностей проекта. При этом представителям бизнеса и ИТ-специалистам важно учитывать не только текущую популярность фреймворков, но и их потенциал для интеграции с будущими технологиями.
Для задач глубокого обучения TensorFlow и PyTorch являются наиболее предпочтительными вариантами. При этом TensorFlow идеален для производственных систем, а PyTorch — для исследований.
В случае классического машинного обучения scikit-learn остаётся лучшим выбором. XGBoost/CatBoost и LightGBM отлично подходят для градиентного бустинга.
Мы ожидаем не только дальнейшего развития этих фреймворков, но и появления новых инструментов, интегрированных с квантовыми вычислениями и отечественными облачными платформами.
GeeksforGeeks: Top 10 Machine Learning Frameworks in 2025 [8]
Upgrad: Top Deep Learning Frameworks You Should Know in 2025 [5]
Hackr.io [18]: Best Machine Learning Frameworks(ML) for Experts in 2025 [19]
Octal Software: Top 15+ Machine Learning Frameworks in 2025 [10]
HeadHunter ( [16]hh.ru [20]) [16]
Автор: AI-SHA
Источник [21]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/19898
URLs in this post:
[1] обучения: http://www.braintools.ru/article/5125
[2] интеллекта: http://www.braintools.ru/article/7605
[3] опыте: http://www.braintools.ru/article/6952
[4] [4]: https://hackr.io/blog/machine-learning-frameworks
[5] [3]: https://www.upgrad.com/blog/top-deep-learning-frameworks/
[6] зрение: http://www.braintools.ru/article/6238
[7] логику: http://www.braintools.ru/article/7640
[8] [2]: https://www.geeksforgeeks.org/blogs/machine-learning-frameworks/
[9] XNumPy: https://kryptonite.ru/articles/accuracy-of-calculations-big-data-fluctuation/
[10] [5]: https://www.octalsoftware.com/blog/machine-learning-frameworks
[11] памяти: http://www.braintools.ru/article/4140
[12] H2O.ai: http://h2o.ai
[13] Unite.AI: http://Unite.AI
[14] [6]: https://www.unite.ai/10-best-machine-learning-software/
[15] потребности: http://www.braintools.ru/article/9534
[16] [7]: https://hh.ru/
[17] Grand View Research: Machine Learning Market: https://www.grandviewresearch.com/industry-analysis/machine-learning-market
[18] Hackr.io: http://Hackr.io
[19] : Best Machine Learning Frameworks(ML) for Experts in 2025: https://ttps://hackr.io/blog/machine-learning-frameworks
[20] hh.ru: http://hh.ru
[21] Источник: https://habr.com/ru/companies/kryptonite/articles/950236/?utm_campaign=950236&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.