Изучаем машинное обучение scikit-learn за одну статью: от понимания API до боевого пайплайна
1. Введение: что за зверь этот scikit-learn и зачем он вамЕсли вы начинаете погружаться в машинное обучение на Python, scikit-learn (в народе просто sklearn) — это ваша отправная точка. Это абсолютный индустриальный стандарт и швейцарский нож для классического ML.Для чего он идеален:Табличные данные. Всё, что можно представить в виде CSV-файла или таблицы в базе данных.Классические задачи. Предсказать цену подержанного авто (регрессия), определить, болен пациент или здоров (классификация), или разбить покупателей на сегменты для маркетинга (кластеризация).
Как выучить Python и не разориться: 5 лучших бесплатных курсов для новичков
Привет, Хабр!Если вы сегодня решите вбить в поисковик «как выучить Python», вас моментально накроет лавиной таргетированной рекламы. Из каждого баннера будут кричать лозунги про «гарантированное трудоустройство», «успешный ИТ-успех» и выход на зарплату в 300к в наносекунду уже через пару месяцев обучения. Из-за такого агрессивного инфоцыганства у человека, который только присматривается к разработке, складывается стойкая иллюзия: чтобы выучить базу и написать первый рабочий код, нужно обязательно оформить рассрочку на пару сотен тысяч рублей.
SQL за одну статью: от «SELECT *» до оконных функций и сложных JOIN-ов
1. Введение: Почему SQL всё еще «база»?Кажется, что в ИТ всё меняется каждые пару лет. Фреймворки рождаются и умирают, архитектурные подходы сменяют друг друга, но SQL стабильно остается на месте. Он спокойно пережил хайп вокруг NoSQL, эпоху Big Data и повсеместное внедрение нейросетей.Почему так происходит? Потому что SQL давно перестал быть просто «языком запросов реляционных баз». Сегодня это универсальный стандарт общения с данными. Неважно, что именно стоит у вас на проекте: классический PostgreSQL, аналитический ClickHouse или распределенная система — скорее всего, вы будете общаться с ней через диалект SQL.
S.U.P.P.O.R.T. — Гайд по выживанию в Пустоши пользовательских проблем
Всем привет! Решил я тут собрать в кучу все свои знания по онбордингу новых сотрудников поддержки. За свою карьеру я построил несколько отделов саппорта с нуля и, признаться, порядком устал от бездушных корпоративных регламентов, от которых клонит в сон уже на третьей странице. Писать очередной талмуд «делай хорошо — не делай плохо», который никто не дочитает, — гиблое дело, особенно для молодого поколения, выросшего в эпоху TikTok.
Основы очистки данных в data science
В реальной жизни данные, к сожалению, не идеальны и требуют тщательной предобработки. Проблемы с данными могут возникать по разным причинам: из-за их природы, способа сбора или ошибок при вводе. Очистка данных позволит сделать анализ более точным, а в случае машинного обучения — улучшить качество моделей.

