ИИ-стартап уволил тысячи подрядчиков и нанял назад на четверть дешевле
Стартап Mercor, помогающий некоторым крупнейшим технологическим компаниям обучать модели искусственного интеллекта, на этой неделе уволил подрядчиков. Затем их наняли в новый проект, но уже за меньшие деньги.
«Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»
Проект реализуется командой: Константин Кожин — руководитель проекта; Павел Шерстнев — ML-инженер; Антон Михалев — ML-инженер; Анна Пятаева — научный руководитель проекта; Владислава Жуковская — специалист по разметке данных; Алина Нуриманова — специалист по разметке данных. Работа ведётся при поддержке гранта (Фонд содействия инновациям, конкурс «Код-ИИ», VII очередь, декабрь 2024 – декабрь 2025).Manuscript OCR — это open-source проект, опубликованный на GitHub и GitVerse.
Данные не кончатся: как LLM навсегда изменили сбор и разметку мультимодальных данных и привели нас к SynthOps
Привет! Эта статья посвящена синтетическим данным и тому, как сбор данных и их разметка изменились навсегда. Поговорим про мультимодальную синтетику (аудио и изображения), генераторы, валидаторы, примеры классных генераций, датасеты, роль LLMок в этих процессах и трансформацию привычных пайпланов в концепцию SynthOps, которая требует других подходов по работе с данными. Я достаточно долгое время разрабатывал софт для разметки всего и вся любой сложности, рассказывал про то как LLMки пришли на замену (или помощь) людям в текстовых и мультимодальных данных
xAI назначила 20-летнего студента главой команды аннотации данных
Стартап Илона Маска xAI назначил 20-летнего студента Диего Пачини руководителем команды аннотации данных, которая отвечает за обучение искусственного интеллекта Grok.
Как данные влияют на качество ML-фичи. Виртуальный фон для Контур.Толк
Привет, Хабр! Меня зовут Павел Кузнецов, и я ML-разработчик в лаборатории компьютерного зрения Центра ИИ Контура. Мы занимаемся созданием AI-фич для продуктов компании. Один из наших ключевых заказчиков — сервис видео-конференц-связи Контур.Толк. Для него мы разрабатываем такие фичи, как бьютификация, улучшение освещённости, детекция дипфейков и, конечно же, сегментация фона.
xAI уволит 500 сотрудников из команды по аннотации данных
Стартап Илона Маска xAI увольняет 500 сотрудников команды по аннотации данных. Таким образом, сокращения затронут примерно треть работников этого отдела.
Uber предложила таксистам из Индии учить ИИ-помощника в качестве подработки
Глава Uber AI Solutions Мега Йетадка сообщила, что таксисты Uber в Индии могут в «свободное от заказов время» зарабатывать на выполнении «цифровых заданий». Так, они могут заниматься разметкой данных.
Когда YOLO не спасает: как один параметр может испортить всё
История о том, почему в ML побеждают не те, у кого самая большая модель, а те, кто понимает, что они делают.ВведениеСовременные object detection-модели достаточно мощные, чтобы «из коробки» выдавать приемлемую точность. Особенно если задача выглядит простой — например, определить, где на покерном столе лежат карты.Но «приемлемо» и «надёжно» — не одно и то же.В одном из проектов заказчик обучил модель, которая показывала 93% точности на валидной выборке, но на практике её приходилось постоянно подчищать вручную. Модель теряла карты в нужных моментах, срабатывала на графику трансляции и мешала, а не помогала аналитике.
Вот так подкрути геймификацию и мотивация болеть не будет
В учебнике обществознания за 9 класс есть определение экономики как науки: «Экономика — наука о том, как люди удовлетворяют свои постоянно растущие потребности в условиях ограниченности ресурсов». Точно так и в разметке — нам нужно удовлетворить свои постоянно растущие потребности в объёмах и качестве разметки, а бюджет ограничен. Помочь нам в этом может система мотивации.

