ml. - страница 44

ml.

Организация датасетов с ClearML

Привет, хабр! Это уже 3-я статья про ClearML. В этой статье я рассказывал про базовый функционал ClearML, а в этой - про то, как настраивать и запускать эксперименты обучения и тестирования через веб-браузер. А теперь я бы хотел затронуть менее популярную тему — организацию датасетов.Версионирование датасетовВ ML есть такой важный тезис: "Данные — это душа модели"

продолжить чтение

Как я стал AI-специалистом: путь от студенческой лабораторной до оргкомитета AiConf Х

Привет! Меня зовут Александр Абрамов, я руковожу AI-командами  в R&D для b2c в SberDevices, веду канал

продолжить чтение

Разработка CLI с помощью пакета Cobra: как не наступить на змею при написании

Привет, Хабр. Меня зовут Иван Добряев, я разработчик программного обеспечения в Центре технологий VK. Сегодня хочу поделиться опытом по одной достаточно прикладной, но весьма увлекательной теме — разработке командной строки (CLI) на Go.Платформа для инференса ML-моделей (inference platform) у нас молодая, ей всего лишь полгода, и мы активно расширяем команду. Так что, если вы хотите писать сервисы на Go с нуля, то приходите к нам, у нас найдутся задачи на любой вкус.

продолжить чтение

Как я сделала свой первый AI-продукт с ChatGPT и капелькой любви

В этой статье я расскажу о моем опыте самостоятельного изучения основ Python и Machine Learning и создании первого проекта OneLove на базе собственной модели искусственного интеллекта.Кто я и зачем мне это было нужноМне 51 год, и я работаю тестировщицей в банке. По образованию я экономист. У меня нет особых навыков программирования. Были попытки учить Python и Java, но без практического применения. По работе немного пишу на JS для авто-тестов в Cypress фреймворке, тестирую UI и API — так что базовое понимание, как всё устроено, у меня есть.

продолжить чтение

Популярные API для работы с искусственным интеллектом

API для искусственного интеллекта предоставляют разработчикам доступ к мощным предобученным моделям и при этом не требуют глубоких знаний в области машинного обучения. В статье представлен обзор самых популярных API для работы с искусственным интеллектом. Давайте рассмотрим, как эффективно использовать их в своих проектах.В статье рассмотрим: OpenAI API · · Anthropic · · Google Vertex AI · · AWS Bedrock · · Groq · · Cerebras Зачем использовать API для ИИ?

продолжить чтение

Мультизадачность на максимуме: как мы одновременно решали 5 задач на хакатоне и заняли второе место

Привет, Хабр! Меня зовут Максим Хандусь, я ML-инженер в лаборатории машинного обучения Альфа-Банка. Недавно наша команда «Мы МИСИС 177!!!» (Назарий Карпов, Кузнецов Данил, Павел Смирнов, Душенёв Даниил — как вы могли догадаться, все мы студенты НИТУ МИСИС) участвовала в хакатоне PurpleHack2025 с достаточно необычным форматом и заняла там второе место.

продолжить чтение

Как мы собираем SWE-bench на других языках

Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки ИИ-агентов, способных помогать в написании и исправлении кода, мы часто упираемся в ограничения. Популярный бенчмарк SWE-bench, например, долгое время поддерживал только Python. Чтобы преодолеть разрыв между реальностью разработки и возможностями оценки ИИ, наша команда в Doubletapp

продолжить чтение

Рекомендательная система для вашего каталога научных работ (и не только!)

Используем обработку естественного языка и теорию графов для сравнения и рекомендации различных типов документов. ВведениеПочти все проекты начинаются с одного важного этапа — активных исследований. Инвестировать в то, что уже было сделано другими, в развитие их работы — это один из путей к повышению ценности вашего проекта. Важно не только извлечь уроки из опыта других, но и понять, чего не стоит делать в своем проекте, чтобы повысить его шансы на успех.

продолжить чтение

Исследователи T-Bank AI Research разработали метод, показывающий, как модель принимает решения на разных слоях

Исследователи из T‑Bank AI Research представили

продолжить чтение

Когда обучение не идет. Loss is NaN. Причины и решения

Привет, это моя первая статья на Хабре. И я хочу рассказать вам о проблеме, на решение которой когда-то давно у меня ушло довольно много времени.Часто бывает, что при обучении (или тестировании) модели нейронной сети (NN) функция потерь (loss) возвращает значение NaN (Not a Number). Это приводит к тому, что фаза обучения "срывается". Обычно неясно, почему это происходит. Я расскажу вам о возможных причинах и рекомендациях по решению этой проблемы.Взрыв градиентаСуществует две основные проблемы с градиентами на этапе обучения: исчезновение (vanishing) и взрыв (explosion) градиент. Первая описана в этих статьях:

продолжить чтение