EFF: блокировка контента для интернет-архивов не остановит ИИ, но сотрёт исторические записи. eff.. eff. архивация.. eff. архивация. веб-скрейпинг.. eff. архивация. веб-скрейпинг. защита контента.. eff. архивация. веб-скрейпинг. защита контента. ИИ-боты.. eff. архивация. веб-скрейпинг. защита контента. ИИ-боты. интернет-архив.. eff. архивация. веб-скрейпинг. защита контента. ИИ-боты. интернет-архив. искусственный интеллект.. eff. архивация. веб-скрейпинг. защита контента. ИИ-боты. интернет-архив. искусственный интеллект. контент.. eff. архивация. веб-скрейпинг. защита контента. ИИ-боты. интернет-архив. искусственный интеллект. контент. Контент и копирайтинг.. eff. архивация. веб-скрейпинг. защита контента. ИИ-боты. интернет-архив. искусственный интеллект. контент. Контент и копирайтинг. медиа.. eff. архивация. веб-скрейпинг. защита контента. ИИ-боты. интернет-архив. искусственный интеллект. контент. Контент и копирайтинг. медиа. сми.. eff. архивация. веб-скрейпинг. защита контента. ИИ-боты. интернет-архив. искусственный интеллект. контент. Контент и копирайтинг. медиа. сми. сохранение данных.. eff. архивация. веб-скрейпинг. защита контента. ИИ-боты. интернет-архив. искусственный интеллект. контент. Контент и копирайтинг. медиа. сми. сохранение данных. Управление медиа.. eff. архивация. веб-скрейпинг. защита контента. ИИ-боты. интернет-архив. искусственный интеллект. контент. Контент и копирайтинг. медиа. сми. сохранение данных. Управление медиа. Хранение данных.

Старший аналитик по вопросам политики Фонда электронных рубежей (Electronic Frontier Foundation, EFF) Джо Маллин затронул проблему защиты контента издателей от ИИ-ботов в контексте сохранения цифрового наследия. 

EFF: блокировка контента для интернет-архивов не остановит ИИ, но сотрёт исторические записи - 1

«Представьте себе, что издатель газеты объявляет о том, что больше не позволит библиотекам хранить копии своей газеты», — пишет он.

По мнению Маллина, именно это и начало происходить в интернете в последние несколько месяцев. 

Аналитик напомнил, что Интернет-архив — крупнейшая в мире цифровая библиотека — хранит цифровые копии газет с момента своего запуска в середине 1990-х годов. 

Но в последние месяцы The New York Times начала блокировать индексацию своего веб-сайта со стороны архива, используя технические меры, выходящие за рамки традиционных правил robots.txt. Другие газеты, включая The Guardian, похоже, следуют этому примеру, отмечает Маллин.

«На протяжении почти трёх десятилетий историки, журналисты и широкая публика полагались на Интернет-архив для сохранения новостных сайтов в том виде, в котором они были опубликованы в сети. Эти архивные страницы часто являются единственным надёжным свидетельством того, как статьи были опубликованы изначально. Во многих случаях статьи редактируются, изменяются или удаляются — иногда открыто, иногда нет. Интернет-архив часто становится единственным источником для просмотра этих изменений. Когда крупные издательства блокируют поисковые роботы архива, эта историческая запись начинает исчезать», — пишет аналитик.

Газета The Times объясняет свои шаги защитой от веб-скрейперов, которые действуют в интересах ИИ-компаний. СМИ уже подали не один иск в суды по поводу нарушений прав на свой контент.

«Каким бы ни был исход этих судебных процессов, блокировка некоммерческих архивистов — это неправильный ответ. Такие организации, как Интернет-архив, не создают коммерческие системы искусственного интеллекта. Они сохраняют летопись нашей истории. Отключение этой функции сохранения в попытке контролировать доступ ИИ может фактически уничтожить десятилетия исторической документации из-за борьбы, которую библиотеки, подобные архиву, не начинали и не просили. Если издатели закрывают доступ к архиву, они не просто ограничивают ботов. Они стирают историческую летопись», — подчёркивает Маллин.

Он напомнил, что предоставление возможности поиска по материалам — это хорошо зарекомендовавшее себя добросовестное использование, а суды давно признали, что зачастую невозможно создать индекс с возможностью поиска без копирования исходного материала. По словам Маллина, Интернет-архив работает по тому же принципу. 

«Те же правовые принципы, которые защищают поисковые системы, должны также защищать архивы и библиотеки. Даже если суды установят ограничения на обучение ИИ, закон, защищающий поиск и архивирование веб-контента, уже хорошо проработан», — указывает аналитик.

По мнению Маллина, жертвовать общедоступными данными ради борьбы с ИИ «было бы глубокой и, возможно, необратимой ошибкой».

Автор: maybe_elf

Источник

Rambler's Top100