валидация данных.

Data Gravity и отравление выборки

Любой, кто хоть немного знаком с ИИ знает, что для эффективной работы искусственного интеллекта необходимы качественные данные

продолжить чтение

Оставлено в

Список литературы тоже умеет галлюцинировать: как я делаю систему проверки научных источников

продолжить чтение

Оставлено в

Как мы сделали полезным крупнейший русскоязычный датасет запросов к LLM

Привет! Меня зовут Роман Куцев, я основатель LLM Arena. У нас каждый день сотни людей общаются с языковыми моделями, тестируют, сравнивают, задают вопросы. В какой-то момент стало ясно: в этих логах — не просто сессии пользователей. Это — живая картина того, как люди используют LLM в реальности.Так родилась идея: собрать открытый, структурированный датасет промптов и дать AI-комьюнити инструмент, с которым можно не просто смотреть, но и исследовать, фильтровать, понимать логику запросов юзеров к LLM.

продолжить чтение

Оставлено в

fit() для новичков

Привет, Хабр! Эта статья для тех, кто только‑только погружается в машинное обучение и ещё не до конца понимает, что скрывается за интересным вызовом model.fit(). Вы, возможно, уже настраивали ноутбуки, пробовали разные датасеты и, может, даже словили пару неожиданных ошибок — и это нормально. Зачем копать глубже за fit()На старте может казаться, что достаточно написать:model = RandomForestClassifier(n_estimators=100) model.fit(X_train, y_train)— и всё заработает. Но стоит проекту вырасти, можно столкнуться с подвохами:Неожиданные NotFittedError при predict()Упавшая память на больших выборках

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

валидация данных.

Data Gravity и отравление выборки

Список литературы тоже умеет галлюцинировать: как я делаю систему проверки научных источников

Как мы сделали полезным крупнейший русскоязычный датасет запросов к LLM

fit() для новичков

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

валидация данных.

Data Gravity и отравление выборки

Список литературы тоже умеет галлюцинировать: как я делаю систему проверки научных источников

Как мы сделали полезным крупнейший русскоязычный датасет запросов к LLM

fit() для новичков