- BrainTools - https://www.braintools.ru -

Представлен стандарт лицензирования контента для оплаты за сбор ботами данных для обучения ИИ

Группа разработчиков во главе с одним из создателей RSS Экартом Вальтером представила [1] открытый стандарт лицензирования контента Really Simple Licensing [2] (RSL), который позволит издателям возможность определять условия оплаты за сбор ботами данных для обучения [3] ИИ. 

Представлен стандарт лицензирования контента для оплаты за сбор ботами данных для обучения ИИ - 1

Стандарт предлагает веб-издателям устанавливать условия использования их произведений прямо в файле robots.txt на сайтах. Его уже поддержали многие крупные компании, в том числе Reddit, Yahoo, Medium, Quora, IGN и People Inc.

По словам Вальтера, целью было создание системы лицензирования данных обучения, которая могла бы масштабироваться по всему интернету. «Нам нужны машиночитаемые лицензионные соглашения для интернета», — заявил он.

В течение многих лет такие группы, как Альянс поставщиков наборов данных (Dataset Providers Alliance), добивались более чётких практик сбора данных, но RSL — это первая попытка создания технической и юридической инфраструктуры, способной реализовать намерения на практике. 

С технической стороны протокол RSL устанавливает конкретные условия лицензирования, которые издатель определил для своего контента, будь то необходимость наличия специальной лицензии или принятия положений Creative Commons. Веб-сайты будут включать эти условия в свой файл «robots.txt» в заранее подготовленном формате.

Кроме того, команда RSL создала организацию коллективного лицензирования RSL Collective, которая может согласовывать условия и собирать роялти, аналогично ASCAP для музыкантов или MPLC для фильмов. Цель состоит в том, чтобы предоставить лицензиарам единую точку контакта для выплаты роялти, а правообладателям — возможность устанавливать условия с десятками потенциальных лицензиаров одновременно. 

К коллективу уже присоединилось множество веб-издателей, включая Yahoo, Reddit, Medium, O’Reilly Media, Ziff Davis (владелец Mashable и Cnet), Internet Brands (владелец WebMD), People Inc. и The Daily Beast. 

Примечательно, что в RSL Collective входят некоторые издатели, уже имеющие лицензионные соглашения, — в частности, Reddit, который получает от Google около $60 млн в год за использование своих обучающих данных. Однако ничто не мешает компаниям заключать собственные соглашения в рамках системы RSL. Вероятно, для небольших издателей новый протокол станет единственным вариантом получать роялти за свой контент.

Между тем Google летом запустила [4] инструмент Offerwall, который позволяет издателям получать доход помимо более зависимых от трафика источников, таких как реклама. Ранее анализ Ahrefs показал, что ИИ-обзоры AI Overviews от Google снижают [5] количество переходов на сайты, занимающие верхние позиции в рейтинге, более чем на 34%. В марте 2024 года — незадолго до выхода AI Overviews в США — средний CTR первого результата поиска на компьютере составлял 0,073. Год спустя этот показатель снизился до 0,026.

Автор: maybe_elf

Источник [6]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/19386

URLs in this post:

[1] представила: https://rslstandard.org/press/rsl-standard

[2] Really Simple Licensing: https://rslstandard.org/

[3] обучения: http://www.braintools.ru/article/5125

[4] запустила: https://habr.com/ru/news/922792/

[5] снижают: https://habr.com/ru/companies/bothub/news/902866/

[6] Источник: https://habr.com/ru/news/945978/?utm_source=habrahabr&utm_medium=rss&utm_campaign=945978

www.BrainTools.ru

Rambler's Top100