разметка данных.

Сравнение инструментов разметки данных для CV: Label Studio & CVAT & Roboflow — опыт разметки 6000+ изображений

Если вы хоть раз обучали модель компьютерного зрения, вы знаете, как качество данных решает всё. На первый взгляд кажется, что задачи у всех инструментов одинаковые: поставить рамку, провести полигон, экспортировать данные, но в реальности всё упирается в детали:как быстро аннотатор может разметить тысячу изображений;удобно ли контролировать качество и правки;можно ли подключить модель для предразметки;как работает экспорт и интеграция с ML-пайплайном;где будут храниться данные - на сервере компании или в облаке;

продолжить чтение

Оставлено в

ИИ-стартап уволил тысячи подрядчиков и нанял назад на четверть дешевле

Стартап Mercor, помогающий некоторым крупнейшим технологическим компаниям обучать модели искусственного интеллекта, на этой неделе уволил подрядчиков. Затем их наняли в новый проект, но уже за меньшие деньги.

продолжить чтение

Оставлено в

«Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

Проект реализуется командой: Константин Кожин — руководитель проекта; Павел Шерстнев — ML-инженер; Антон Михалев — ML-инженер; Анна Пятаева — научный руководитель проекта; Владислава Жуковская — специалист по разметке данных; Алина Нуриманова — специалист по разметке данных. Работа ведётся при поддержке гранта (Фонд содействия инновациям, конкурс «Код-ИИ», VII очередь, декабрь 2024 – декабрь 2025).Manuscript OCR — это open-source проект, опубликованный на GitHub и GitVerse.

продолжить чтение

Оставлено в

Балконы и полигоны: как мы разметили 12 000 квартир для генерации 3D-туров

продолжить чтение

Оставлено в

Данные не кончатся: как LLM навсегда изменили сбор и разметку мультимодальных данных и привели нас к SynthOps

Привет! Эта статья посвящена синтетическим данным и тому, как сбор данных и их разметка изменились навсегда. Поговорим про мультимодальную синтетику (аудио и изображения), генераторы, валидаторы, примеры классных генераций, датасеты, роль LLMок в этих процессах и трансформацию привычных пайпланов в концепцию SynthOps, которая требует других подходов по работе с данными. Я достаточно долгое время разрабатывал софт для разметки всего и вся любой сложности, рассказывал про то как LLMки пришли на замену (или помощь) людям в текстовых и мультимодальных данных

продолжить чтение

Оставлено в

xAI назначила 20-летнего студента главой команды аннотации данных

Стартап Илона Маска xAI назначил 20-летнего студента Диего Пачини руководителем команды аннотации данных, которая отвечает за обучение искусственного интеллекта Grok.

продолжить чтение

Оставлено в

Как данные влияют на качество ML-фичи. Виртуальный фон для Контур.Толк

Привет, Хабр! Меня зовут Павел Кузнецов, и я ML-разработчик в лаборатории компьютерного зрения Центра ИИ Контура. Мы занимаемся созданием AI-фич для продуктов компании. Один из наших ключевых заказчиков — сервис видео-конференц-связи Контур.Толк. Для него мы разрабатываем такие фичи, как бьютификация, улучшение освещённости, детекция дипфейков и, конечно же, сегментация фона.

продолжить чтение

Оставлено в

xAI уволит 500 сотрудников из команды по аннотации данных

Стартап Илона Маска xAI увольняет 500 сотрудников команды по аннотации данных. Таким образом, сокращения затронут примерно треть работников этого отдела.

продолжить чтение

Оставлено в

Uber предложила таксистам из Индии учить ИИ-помощника в качестве подработки

Глава Uber AI Solutions Мега Йетадка сообщила, что таксисты Uber в Индии могут в «свободное от заказов время» зарабатывать на выполнении «цифровых заданий». Так, они могут заниматься разметкой данных.

продолжить чтение

Оставлено в

Когда YOLO не спасает: как один параметр может испортить всё

История о том, почему в ML побеждают не те, у кого самая большая модель, а те, кто понимает, что они делают.ВведениеСовременные object detection-модели достаточно мощные, чтобы «из коробки» выдавать приемлемую точность. Особенно если задача выглядит простой — например, определить, где на покерном столе лежат карты.Но «приемлемо» и «надёжно» — не одно и то же.В одном из проектов заказчик обучил модель, которая показывала 93% точности на валидной выборке, но на практике её приходилось постоянно подчищать вручную. Модель теряла карты в нужных моментах, срабатывала на графику трансляции и мешала, а не помогала аналитике.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

разметка данных.

Сравнение инструментов разметки данных для CV: Label Studio & CVAT & Roboflow — опыт разметки 6000+ изображений

ИИ-стартап уволил тысячи подрядчиков и нанял назад на четверть дешевле

«Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

Балконы и полигоны: как мы разметили 12 000 квартир для генерации 3D-туров

Данные не кончатся: как LLM навсегда изменили сбор и разметку мультимодальных данных и привели нас к SynthOps

xAI назначила 20-летнего студента главой команды аннотации данных

Как данные влияют на качество ML-фичи. Виртуальный фон для Контур.Толк

xAI уволит 500 сотрудников из команды по аннотации данных

Uber предложила таксистам из Индии учить ИИ-помощника в качестве подработки

Когда YOLO не спасает: как один параметр может испортить всё

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

разметка данных.