сбор данных.

Архитектура PhysicalAgent: как универсальные VLA-агенты могут стать альтернативой дорогому обучению

продолжить чтение

Инструмент OpenAI получит доступ к фотографиям детей в игре отслеживания Санта-Клауса

В это Рождество OpenAI объединится с Американским командованием воздушно-космической обороны (North American Aerospace Defense Command, NORAD), чтобы предложить детям и их родителям несколько игр для отслеживания Санта-Клаус. Однако в рамках этого проекта компания получит доступ к фотографиям детей.

продолжить чтение

Сравнение инструментов разметки данных для CV: Label Studio & CVAT & Roboflow — опыт разметки 6000+ изображений

Если вы хоть раз обучали модель компьютерного зрения, вы знаете, как качество данных решает всё. На первый взгляд кажется, что задачи у всех инструментов одинаковые: поставить рамку, провести полигон, экспортировать данные, но в реальности всё упирается в детали:как быстро аннотатор может разметить тысячу изображений;удобно ли контролировать качество и правки;можно ли подключить модель для предразметки;как работает экспорт и интеграция с ML-пайплайном;где будут храниться данные - на сервере компании или в облаке;

продолжить чтение

Веб-скрапинговые ИИ-боты вызывают сбои в работе научных баз данных и журналов

Автоматизированные программы, собирающие данные для обучения инструментов искусственного интеллекта, перегружают академические веб-сайты. В результате возникают сбои в работе ресурсов.

продолжить чтение

КОНФИДЕНЦИАЛЬНОСТЬ МЁРТВА: ЯНДЕКС И ВК ОБУЧАЮТ ИИ НА ВАШИХ ЛИЧНЫХ ДАННЫХ?

Счёт производства индусов идёт на секунды по мнению Алисы ПРОНедавно Яндекс "подарил" мне месячную подпись

продолжить чтение

В Bluesky предложили «новый стандарт» сбора данных для обучения ИИ

В первой половине марта социальная сеть Bluesky опубликовала на GitHub предложение с опциями, которые предоставили бы пользователям возможность давать разрешения на извлечение их постов и данных для обучения моделей искусственного интеллекта и публичного архивирования. Генеральный директор компании Джей Грейбер сообщила о намерении создать «новый стандарт» для управления сбором данных, аналогичный файлу robots.txt, который сайты применяют для передачи разрешений веб-сканерам.

продолжить чтение

Нейросеть против ДТП: как мы разработали искусственный интеллект, чтобы обезопасить поездки в автобусе

Уже несколько лет человечество активно внедряет автоматизированные системы с участием нейросетей в свою повседневность. Вопреки расхожему мнению, не только компании извлекают из этого выгоду, но и обычные люди. И речь не только о коммерческой выгоде — такие системы могут спасать жизни. Система, о которой мы сегодня расскажем, преследует цель сделать жизнь людей безопаснее и удобнее. Сколько времени человек проводит в общественном транспорте? Какие нарушения совершают водители? Можно ли повысить безопасность поездок за счет нейросетей? Ответы — в этом материале.5 лет в дороге

продолжить чтение

Как посчитать проект и защитить бизнес от некорректной оценки: руководство для специалистов по данным

Сорванные дедлайны, работа в выходные, недовольный клиент — знакомо? Если да, то вы, вероятно, сталкивались с некорректной оценкой проекта. В прошлой статье я рассказывал о риск-факторах в задачах разметки и сбора данных: Почему оценить стоимость датасета не так просто, как кажется на первый взглядПредставьте, что вы получили заказ на разметку датасета из 1,000 изображений. Вы берете 20 картинок ...

продолжить чтение

Разметка данных на заказ: как корректно оценить проект и защитить бизнес от рисков

Сорванные дедлайны, работа в выходные, недовольный клиент — знакомо? Если да, то вы, вероятно, сталкивались с некорректной оценкой проекта. В прошлой статье я рассказывал о риск-факторах в задачах разметки и сбора данных: Почему оценить стоимость датасета не так просто, как кажется на первый взглядПредставьте, что вы получили заказ на разметку датасета из 1,000 изображений. Вы берете 20 картинок ...

продолжить чтение

Rambler's Top100