spark.

Только Сигма выбирают Delta Lake

Привет, Хабр! Меня зовут Дмитрий Кравчук, я занимаюсь всем, что связано с данными в блоке AI&ML MAGNIT TECH. Расскажу про фундамент прибыльных проектов, которыми мы занимаемся в департаменте. Это начало цикла статей о наших достижениях за 5 лет и планах на будущее.

продолжить чтение

Оставлено в

Когда автоматизация становится умнее: как трансформеры изменили AutoDL в Альфа-Банке

Всем привет! С вами Артемий Лямин (@lyaminartemiy) и Иван Тренёв (@123-39

продолжить чтение

Оставлено в

Простой Python, автоматический Spark: минус Kubernetes, плюс продуктивность

продолжить чтение

Оставлено в

«Персональный ИИ-суперкомпьютер» от Nvidia поступит в продажу 15 октября

Nvidia 15 октября начнёт продавать «персональный суперкомпьютер для искусственного интеллекта» DGX Spark. Он позволит пользователям работать со сложными моделями искусственного интеллекта.

продолжить чтение

Оставлено в

SRE в инженерии данных: профессия и ее перспективы

Всем привет! Меня зовут Александр Андреев, я SRE дата-инженер. Сегодня я хочу рассказать о необычной, но набирающей обороты роли в области обработки данных - SRE Data Engineer: кто это такой, чем занимается, как им стать, куда развиваться и какие перспективы у этой профессии. ВведениеПредставьте ситуацию: пайплайн данных, который должен готовить критически важные отчеты, внезапно сломался. Есть всего несколько часов (в самом лучшем случае - дней), чтобы понять, что произошло, исправить проблему и убедиться, что данные будут готовы вовремя. А затем нужно автоматизировать процесс так, чтобы эта проблема больше не повторялась.

продолжить чтение

Оставлено в

Почему Apache Spark становится ядром аналитических платформ в России: тренды, особенности и прогнозы для бизнеса

Эксперты компании «Криптонит» проанализировали главные тренды использования Apache Spark в бизнесе, выделили особенности его применения в России и спрогнозировали дальнейшее развитие на основе выявленных тенденций.Растущая востребованность Spark объясняется не только открытым исходным кодом и гибкостью, но и лёгкостью интеграции с современными технологиями — от машинного обучения до облачных платформ.

продолжить чтение

Оставлено в

Секреты Spark в Arenadata Hadoop: как мы ускорили построение витрин для задач ML

Привет, Хабр! Я Дмитрий Жихарев, CPO Платформы искусственного интеллекта RAISA в Лаборатории ИИ РСХБ-Интех. В этой статье я и архитектор нашей платформы Александр Рындин @aryndin9999расскажем о том, как мы построили взаимодействие Платформы ИИ и Озера данных для работы с витринами данных моделей машинного обучения с использованием Spark.

продолжить чтение

Оставлено в

Apache Spark Catalyst: секреты оптимизатора запросов, который должен знать каждый Data Engineer

продолжить чтение

Оставлено в

Apache Kyuubi + Spark: как приручить большие данные

Привет, Хабр! Меня зовут Станислав Габдулгазиев, и я архитектор департамента поддержки продаж Arenadata. В этом материале поделюсь впечатлениями от использования Kyuubi — инструмента, который значительно упрощает работу пользователей с SQL, а также затрону вопросы его сравнения с другими решениями для обработки больших данных.Небольшая справкаKyuubi — распределённый многопользовательский шлюз для предоставления serverless SQL для хранилищ, озёр данных и lakehouse.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

spark.

Только Сигма выбирают Delta Lake

Когда автоматизация становится умнее: как трансформеры изменили AutoDL в Альфа-Банке

Простой Python, автоматический Spark: минус Kubernetes, плюс продуктивность

«Персональный ИИ-суперкомпьютер» от Nvidia поступит в продажу 15 октября

SRE в инженерии данных: профессия и ее перспективы

Почему Apache Spark становится ядром аналитических платформ в России: тренды, особенности и прогнозы для бизнеса

Секреты Spark в Arenadata Hadoop: как мы ускорили построение витрин для задач ML

Apache Spark Catalyst: секреты оптимизатора запросов, который должен знать каждый Data Engineer

Apache Kyuubi + Spark: как приручить большие данные

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

spark.