ml. - страница 7

ml.

Машинное обучение для работы с текстами: подборка бесплатных курсов и материалов

Привет! Это Данила Ляпин, наставник курса «Специалист по Data Science». Собрал подборку материалов по обработке естественного языка — она охватывает путь от базовых концепций NLP до трансформеров и BERT. Все материалы бесплатны и проверены на практике. Главное — двигаться последовательно, не пропускать основы и обязательно практиковаться на реальных задачах.Сourse in Natural Language Processing, YSDA

продолжить чтение

«Т-Банк» открыл новый набор на программу «Мини-CEO» для студентов и выпускников вузов

«Т-Банк» запустил новый набор на программу карьерного развития «Мини-CEO». Это карьерная программа, где студенты и выпускники вузов работают под прямым руководством топ-менеджеров над стратегически важными проектами компании. Участие в программе оплачивается и длится шесть месяцев. Программа включает индивидуальную работу над масштабным проектом с регулярными личными встречами с наставником уровня вице-президента.

продолжить чтение

Как устроена архитектура факторов ранжирования в runtime поиска Ozon

Привет, Хабр! Меня зовут Лев. Я работаю в поиске Ozon. Сегодня я буду рассказывать про одну из составляющих поиска, а именно про ранжирование.В этой статье расскажу:

продолжить чтение

Новые Организации в стиле мета-модерна, или как мы стали нейро-артелью

Что такое метамодерн (или метамодернизм)? Его можно описать как состояние колебания между двумя противоположностями. Это обобщающий термин, который определяет культуру, пришедшую на смену постмодернизму.В эпоху развития искусственного интеллекта новые организации, которые появляются на рынке, приходят к новому формату, который до этого не существовал. Нейро-артель — это сообщество инженерных ремесленников и технологических энтузиастов, цель которого — сделать цифры полезными, превратить их в инструмент, который служит человеку, бизнесу, обществу.Как мы пришли к идее создать нейро-артель?

продолжить чтение

Работа с несбалансированными данными: SMOTE мёртв, что работает

Бывали у вас датасеты, где класс «1» встречается в 100 раз реже класса «0»? У меня — постоянно. Модель радуется высокой точности, а на деле совершенно промахивается по редкому классу. Давайте обсудим, почему старый добрый SMOTE уже не торт, и что помогает в таких случаях. Дисбаланс данных как проблемаЕсли у вас 99 кошек и 1 собака, алгоритм, который всегда угадывает «кошка», получит 99% точности — и это ловушка. Классическая метрика accuracy тут бессмысленна, модель может совсем не узнавать собак, но всё равно быть якобы точной.

продолжить чтение

Линейная регрессия, встряска рейтинга и первое место. Часть 1: Ёлочка, живи

CatBoost строит модель "выживаемости" ёлки (в представлении GigaChat)ВведениеВ то время как космические корабли бороздят.

продолжить чтение

Как прийти к использованию Airflow, и причём тут Data Version Control (DVC)

Всем доброго времени суток! Меня зовут Никифоров Сергей, я ML-инженер из команды рекомендательных систем в компании ТехВилл.

продолжить чтение

Роль хранилищ и платформ данных в развитии ИИ

продолжить чтение

ИИ в промышленном IT: где заканчивается хайп и начинается измеримый эффект

В этом обзоре мы собрали ключевые идеи и практические инсайты из серии подкастов, записанных на конференции Industrial++. С руководителями AI- и IT-направлений из крупных промышленных компаний на мероприятии пообщались Василий Саутин, коммерческий директор платформы «Сфера» (ИТ-холдинг Т1) и его коллега, директор по продуктам платформы «Сфера», Сергей Полиненко.

продолжить чтение

Как изменились хакатоны в 2025 году: исследование Codenrock

Работа с данными стала критически важной на хакатонах — рынок IT-соревнований в прошлом году заметно изменился. Конкурсы теперь практичнее, технологичнее и сложнее, как по задачам, так и по составу команд.

продолжить чтение

1...5678910...2030...46
Rambler's Top100