Data Engineering. - страница 4

Как работать с нейросетями эффективно: теория и практика

продолжить чтение

Data Governencе – это про ответственность за данные и их качество

В статье очень кратко расскажу, что такое регулирование данных и почему в организациях сейчас к этой теме очередная волна интереса.

продолжить чтение

Полезные задачи на Kaggle ( LLM, Diffusion Models)

В мире Data Science и Data Engineering ценится не только теория, но и практический опыт: умение работать с реальными данными, строить модели и доводить решения до результата. Однако получить такой опыт непросто: рабочие проекты часто закрыты NDA, а учебные кейсы не отражают сложность реальных задач.Именно поэтому платформа Kaggle заняла особое место в индустрии. Это крупнейшее мировое сообщество специалистов по данным:🌍 более 13 миллионов участников из разных стран;🏆 сотни активных соревнований ежегодно;📊 миллионы доступных датасетов и готовых ноутбуков.

продолжить чтение

AI-ассистент в мире кода: как стать пилотом, а не пассажиром

Сегодня невозможно игнорировать тот факт, что AI-ассистенты, такие как ChatGPT, GitHub Copilot или Gemini, стали частью рабочего процесса. Но использовать их бездумно — значит обесценить собственное обучение и будущие карьерные перспективы. Меня зовут Дмитрий Махортов, я специалист по машинному обучению и ревьюер на курсе «Специалист по Data Science»

продолжить чтение

Готовим данные для LLM: открытые инструменты для нормализации, очистки и не только

Компании активно внедряют у себя решения на основе больших языковых моделей: боты техподдержки, умный поиск по базе знаний, выявление мошенников в диалоге или HR-ассистенты.

продолжить чтение

DataHub: Как интеллектуальный хаб данных меняет правила игры на рынке кредитования и займов

Финансовый рынок цифровизируется с невероятной скоростью: клиенты ждут персональных предложений за пару кликов, банки и МФО ищут качественных заемщиков, а партнеры — удобные и технологичные инструменты для монетизации трафика. На стыке этих интересов возникает потребность в принципиально новых решениях. Старые методы лидогенерации и скоринга уже не справляются: они либо не дают нужной глубины анализа.Именно этот разрыв между потребностями рынка и существующими возможностями закрывает платформа DataHub

продолжить чтение

Вывести EdTech из кризиса: сыграет ли ставка на AI

продолжить чтение

Умный вайб-кодинг или семь раз отмерь, один раз сгенерь

Помните старую поговорку про семь раз отмерь? В мире AI-кодинга она обрела новый смысл.Сегодня расскажу о практике AI-Driven разработки (AIDD), которую мы у себя в команде ежедневно применяем для разработки ИИ-решений. Она успешно зарекомендовала себя в различных проектах и задачах — будь то стартапы или легаси, приложения на Python, Java или даже 1C.Демонстрировать практику будем в AI редакторе Cursor, но повторить методику вы сможете в любой подобной IDE.Поехали.AI Driven Development (AIDD)Наш подход основан на простом понимании: AI — это не замена программиста, а его усилитель.

продолжить чтение

Воспроизводимый рейтинг: можно ли с помощью краудсорсинга предсказать выбор пользователей LLM?

Всем привет! Сегодня хотим поделиться историей нашего эксперимента, который начался с простого вопроса: а можно ли с помощью краудсорсинга воссоздать рейтинг нейросетей, который мы получаем от тысяч реальных пользователей на нашем сайте LLM Arena? Причём не в жёсткой парадигме «оцени по инструкции», а приближаясь к реальному user preference, когда пользователь выбирает то, что ему субъективно больше нравится.TL/DR: Мы можем за 3 дня воспроизвести пользовательский рейтинг LLM с точностью 90%+;

продолжить чтение

Собрать команду ИИ-агентов: инструменты для дата-сайентистов, разработчиков, тестировщиков и инженеров

Мы запустили собственную платформу полного цикла производства ПО с ИИ‑агентами —

продолжить чтение

1...234567...11
Rambler's Top100