Салют, Хабр! Время летит незаметно. Будто совсем недавно мы знакомили вас с GigaChat MAX, но мы не стоим на месте и сегодня готовы представить вам обещанный апгрейд. За полгода мы значительно улучшили обучающие данные, поработали над инфраструктурой обучения моделей, а также уделили особое внимание всему процессу Alignment-а, в том числе RLHF.

Оставлено в

BareMetal 2.0: разбираемся, какие GPU выбрать

Недавно мы обновили BareMetal 2.0 в составе нашего «Публичного облака». Теперь в инфраструктуре есть выделенные физические серверы с высокопроизводительными GPU-картами. Они позволяют работать с задачами, где критична скорость вычислений. Расскажем, что именно изменилось и какие задачи можно теперь решать быстрее. Но сначала небольшая справка.Когда нужны графические ускорители?

продолжить чтение

Оставлено в

Код, который дышит: создание виртуальной вселенной на NestJS и своим AI на Tensorflow.js

Представьте мир, где каждый персонаж живёт своей жизнью: принимает решения, взаимодействует с окружающей средой и даже эволюционирует. Где почва, растения и ресурсы подчиняются сложным алгоритмам, а нейронные сети управляют поведением тысяч существ. Это не сценарий для нового блокбастера — это проект, над которым я работаю.В этой статье я расскажу, как с помощью NestJS, TypeORM и Tensorflow.js создаю виртуальную вселенную, которая “дышит” и развивается. Мы разберём:Как моделировать сложные системы: от почвы до социальных взаимодействий.Как обучать нейронные сети, чтобы мир менялся реалистично

продолжить чтение

Оставлено в

База об организации процесса разметки: команда, онбординг, метрики

Привет! Меня зовут Сизов Виктор, я занимаюсь данными, их сбором, анализом и разметкой последние 5 лет. Сейчас отвечаю за разметку в Альфа-Банке. Эту статьи мы писали всей командой и старались осветить подробно детали того, как устроены процессы разметки с технической и административной стороны. В статье мы рассмотрели:работу команд разметки, их взаимодействие с Заказчиком и Продуктом;отдельно разобрали аналитику, которая позволяет повышать качество разметки;поведение людей (разметчиков), паттерны их работы.Часть 1. Заказчики, участники и исполнители

продолжить чтение

Оставлено в

Куда расти Data Scientist и какие навыки для этого нужны

Привет! Меня зовут Никита Зелинский, я Chief Data Scientist МТС, руководитель центра компетенций Data Science и ML-платформ МТС Big Data. На конференциях я часто слышу один и тот же вопрос от начинающих дата-сайентистов: как развиваться в своей сфере и прийти к успеху? Тут сразу напрашивается одно сравнение — рост в профессии напоминает тренировки в качалке. Чтобы добиться результата, нужен четкий план: что конкретно и когда прокачивать. Вот и в работе важно понимать, какие навыки развивать и как составить стратегию роста — от стажера до ведущего специалиста или Chief Data Scientist.

продолжить чтение

Оставлено в

Расставим точки над i: как подготовить разметку для задач Keypoint Detection

продолжить чтение

Оставлено в

Обучить модель RoBERTa расстановке запятых на балконе для продакшена

RoBERTa — улучшенная версия модели BERT, разработанная Facebook AI. Она показывает отличные результаты в задачах обработки естественного языка, таких как классификация текстов и генерация ответов.

продолжить чтение

Оставлено в

Русские тексты. Работа с текстами. Предварительная обработка русских текстовых данных

Предварительная обработка текстовых данных: ключевые этапы и методыТекстовые данные — один из самых сложных типов данных для анализа из-за их неструктурированной природы и высокой вариативности. Чтобы превратить "сырой" текст в информацию, пригодную для машинного обучения или лингвистического анализа, требуется предварительная обработка. Этот процесс включает стандартизацию, очистку и преобразование текста, что повышает качество моделей NLP (Natural Language Processing). Рассмотрим основные этапы и методы.

продолжить чтение

Оставлено в

Удивительный мир хакатонов: как я придумал для студентов задачку и что они с ней натворили

Привет, Хабр! Меня зовут Владимир Казаков, я руковожу продуктом «Обучение» в МТС Линк. А еще я с удовольствием помогаю организовывать и проводить хакатоны — это всегда десятки свежих идей, передающийся от участников драйв, новые контакты и море опыта для будущих разработчиков. Полгода назад в наш рабочий чат внезапно прилетело сообщение: «Ребят, срочно! МИФИ организуют хакатон, нужна задача, желательно отправить сегодня!». Вызов был принят, и мы подготовили задание по работе с большими данными. В этом посте расскажу, чем студенты могут удивить разработчика с 15-летним стажем, в чем их сильные стороны, а что еще надо подтянуть.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Big Data.

BI-Ассистент для создания аналитических дашбордов и автоматизированного анализа данных

GigaChat 2.0 в API

BareMetal 2.0: разбираемся, какие GPU выбрать

Код, который дышит: создание виртуальной вселенной на NestJS и своим AI на Tensorflow.js

База об организации процесса разметки: команда, онбординг, метрики

Куда расти Data Scientist и какие навыки для этого нужны

Расставим точки над i: как подготовить разметку для задач Keypoint Detection

Обучить модель RoBERTa расстановке запятых на балконе для продакшена

Русские тексты. Работа с текстами. Предварительная обработка русских текстовых данных

Удивительный мир хакатонов: как я придумал для студентов задачку и что они с ней натворили

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Big Data.