data science.

Разбираемся в ML без воды: от базы до Attention. Часть 7: SVM и SGD

В шестой части мы разобрали логистическую регрессию и увидели, как линейная модель может разделять классы с помощью вероятностного подхода. В этой части поговорим о SVM — алгоритме, который ищет не просто разделяющую гиперплоскость, а оптимальную границу с максимальным зазором между классами. Если логистическая регрессия отвечала на вопрос "с какой вероятностью объект принадлежит классу?", то философия SVM звучит иначе "где провести наиболее устойчивую границу между классами?".Support vector machineSupport vector machine (SVM), или же метод опорных векторов

продолжить чтение

Оставлено в

Inside AI Meetup — как это было? Делимся записями докладов, фото и атмосферой

Привет! 20 мая прошел Inside AI Meetup от Wildberries & Russ — про практические кейсы внедрения ИИ: векторный поиск и модерация с 200+ моделями, AIOps для ML/GenAI-сервисов, RAG без галлюцинаций, запуск LLM-продуктов, генерация текстов из видео, поиск и рекомендации. В программе были кейсы от опыт Wildberries & Russ, MWS, Avito, VK, M2, МФТИ, Сбера, red_mad_robot и Альфа-Банка, а еще новые знакомства и полезный нетворкинг. В статье вы найдете видеозаписи с ивента и фото.Доклад «О применении AI в Wildberries & Russ» — Павел Раваев, CDO Wildberries & Russ

продолжить чтение

Оставлено в

Новинка: Прикладные API для искусственного интеллекта и Data Science

В течение последних двух лет мы проделали большую работу по изданию неустаревающих книг, связанных с проектированием и развитием API. Как известно, сам вопрос «Что такое API?» довольно многогранен, и в своё время на Хабре развёрнутый ответ на него дала одна из наших топовых авторов Ольга Назина @Molechka – к настоящему моменту её статья собрала почти 1 350 000 просмотров и 1555 закладок. Книги Ольги Назиной не относятся к этой статье напрямую, но, если вы их ещё не читали, рекомендуем посмотреть все четыре

продолжить чтение

Оставлено в

Save the date: 20 мая встретимся на Inside AI Meetup от Wildberries & Russ

Что происходит, когда AI выходит за пределы прототипа и попадает в прод? На митапе обсудим реальные кейсы: от высоконагруженной модерации с векторным поиском и AIOps-подходов к управлению ML-сервисами до практики построения RAG-систем, тонкостей реранкинга и реальных этапов запуска LLM-продуктов. Среди спикеров эксперты Wildberries & Russ, MWS, МФТИ, Avito, VK, M2, Сбера, Альфа-Банка, red_mad_robot.Когда: 20 мая, старт в 15:00Где: Москва + онлайн-трансляция Регистрация открыта —> здесьInside AI: Main Track. Доклады на 30 минут от Wildberries & Russ, MWS, МФТИ

продолжить чтение

Оставлено в

Изучаем машинное обучение scikit-learn за одну статью: от понимания API до боевого пайплайна

1. Введение: что за зверь этот scikit-learn и зачем он вамЕсли вы начинаете погружаться в машинное обучение на Python, scikit-learn (в народе просто sklearn) — это ваша отправная точка. Это абсолютный индустриальный стандарт и швейцарский нож для классического ML.Для чего он идеален:Табличные данные. Всё, что можно представить в виде CSV-файла или таблицы в базе данных.Классические задачи. Предсказать цену подержанного авто (регрессия), определить, болен пациент или здоров (классификация), или разбить покупателей на сегменты для маркетинга (кластеризация).

продолжить чтение

Оставлено в

Почему не всегда Pandas — лучший выбор (и когда стоит попробовать Polars)

Привет, Хабр! Меня зовут Данила Ляпин, я Senior Data Scientist в Яндексе и автор курса «Специалист по Data Science» в Яндекс Практикуме.В современном мире анализа данных пользу библиотеки Pandas трудно переоценить — она используется везде экспертами любого уровня: от стажёров до техлидов, а последние годы это де-факто стандарт в аналитике.

продолжить чтение

Оставлено в

Топ вопросов по математике для ML и Data Science собесов: линейная алгебра и матан

Математикой часто пугают новичков ML и Data Science. В этой статье разберем, что спрашивают и до какой глубины изучать математику для собеседований.Статья не рассчитана на изучение математики до уровня вышмата в вузе - но для трудоустройства это и не является обязательным критерием. Тем не менее материал может послужить отправной точкой изучения математики и неким роадмапом, что важно, а что нет.Содержание:Линейная алгебравектора, матрицы, операции над ними и дрМатематический анализпространство, градиент, апроксимация и дрПолезные материалы

продолжить чтение

Оставлено в

Волков бояться — uplift в прод не катить, или AUF 2.0

Всем привет! Меня зовут Мельников Виктор, я middle data scientist в Альфа-Банке в Управлении по разработке инструментов автоматизации моделирования.Год назад вышла статья о первой open source библиотеке Альфа-Банка для автоматического построения uplift-моделей Automatic Uplift Framework или же, сокращённо, AUF🐺. В ней мы рассмотрели основной функционал библиотеки с примерами кода. Также в ней можно найти ссылку на ноутбук с примером кода на открытом датасете.

продолжить чтение

Оставлено в

Искусственный интеллект в Data Science: инструменты и границы возможностей

Нейросети ещё не стали обязательным пунктом в требованиях работодателей, но на практике многие дата-сайентисты уже используют LLM в работе: генерируют код в Cursor, пишут SQL-запросы в DataGrip и спрашивают совета у ChatGPT.Хабр, привет! Меня зовут Вячеслав Демин, я больше пяти лет работаю в сфере Data Science. Сейчас я руководитель направления аналитики данных в Сбере и эксперт на курсе «Специалист по Data Science» в Яндекс Практикуме. Начинал с этого же курса в 2020 году, после чего работал в сфере страхования и нефтехимии.

продолжить чтение

Оставлено в

Почему ваш LLM-сервис ведёт себя как хочет, а не как вы просите

Вы пишете промпт. Подробно, вдумчиво, с примерами. Деплоите в сервис. Запускаете — и получаете markdown-обёртку вокруг JSON, который вы просили.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

data science.

Разбираемся в ML без воды: от базы до Attention. Часть 7: SVM и SGD

Inside AI Meetup — как это было? Делимся записями докладов, фото и атмосферой

Новинка: Прикладные API для искусственного интеллекта и Data Science

Save the date: 20 мая встретимся на Inside AI Meetup от Wildberries & Russ

Изучаем машинное обучение scikit-learn за одну статью: от понимания API до боевого пайплайна

Почему не всегда Pandas — лучший выбор (и когда стоит попробовать Polars)

Топ вопросов по математике для ML и Data Science собесов: линейная алгебра и матан

Волков бояться — uplift в прод не катить, или AUF 2.0

Искусственный интеллект в Data Science: инструменты и границы возможностей

Почему ваш LLM-сервис ведёт себя как хочет, а не как вы просите

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

data science.