- BrainTools - https://www.braintools.ru -

Писатели обвинили Adobe в использовании пиратских версий книг для обучения программы SlimLM

Элизабет Лайон и ряд других писателей предъявили иск [1] к Adobe, обвинив её в использовании пиратских версий многочисленных книг для обучения [2] системы искусственного интеллекта [3] SlimLM [4].

Писатели обвинили Adobe в использовании пиратских версий книг для обучения программы SlimLM - 1

Как и практически все остальные технологические компании, Adobe в последние несколько лет активно внедряет ИИ. С 2023 года компания запустила ряд различных сервисов на базе ИИ, включая набор инструментов Firefly [5].

Adobe описывает SlimLM как набор малых языковых моделей, которые можно оптимизировать для работы с документами на мобильных устройствах. Компания указывает, что SlimLM была предварительно обучена на SlimPajama-627B — «дедуплицированном многокорпусном наборе данных с открытым исходным кодом», выпущенном компанией Cerebras в июне 2023 года.

Лайон настаивает, что некоторые её работы вошли датасет, который использовала Adobe.

«Набор данных SlimPajama был создан путём копирования и манипулирования датасетом RedPajama (включая копирование Books3). Таким образом, поскольку он представляет собой производную копию набора данных RedPajama, SlimPajama содержит набор данных Books3, включая защищённые авторским правом произведения истца и членов группы истцов», — следует из коллективного иска.

Book3 — это коллекция из 191 тыс. книг, использованных для обучения систем генеративного ИИ. Она постоянно создаёт юридические проблемы для технологического сообщества. RedPajama также фигурировал в ряде судебных исков. В сентябре Apple обвинили [6] в использовании этого датасета для обучения Apple Intelligence без указания авторства и выплат компенсаций. Спустя месяц на аналогичных основаниях обвинили [7] Salesforce.

Осенью Anthropic согласилась выплатить [8] $1,5 млрд ряду авторов. Последние обвинили компанию в использовании пиратских книг для обучения модели, лежащей в основе чат-бота Claude. Летом этого года Anthropic призналась [9], что выкупала и сканировала, а затем уничтожала миллионы физических книг для обучения ИИ-моделей.

Автор: Travis_Macrif

Источник [10]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/23352

URLs in this post:

[1] предъявили иск: https://www.reuters.com/legal/government/adobe-sued-allegedly-misusing-authors-work-ai-training-2025-12-17/

[2] обучения: http://www.braintools.ru/article/5125

[3] интеллекта: http://www.braintools.ru/article/7605

[4] SlimLM: https://arxiv.org/html/2411.09944v1

[5] Firefly: https://habr.com/ru/news/760980/

[6] обвинили: https://www.macobserver.com/news/apple-faces-lawsuit-over-use-of-pirated-books-to-train-ai-models/

[7] обвинили: https://www.jdsupra.com/legalnews/salesforce-used-pirated-books-to-train-9970854/

[8] согласилась выплатить: https://habr.com/ru/news/944686/

[9] призналась: https://habr.com/ru/news/923796/

[10] Источник: https://habr.com/ru/news/978010/?utm_source=habrahabr&utm_medium=rss&utm_campaign=978010

www.BrainTools.ru

Rambler's Top100