
В обновленных материалах коллективного иска против Nvidia появились новые детали, которые удивили экспертов. Оказывается, компания напрямую связывалась с крупнейшей теневой библиотекой Anna’s Archive, чтобы получить приоритетный доступ к массиву книг для обучения своих языковых моделей. В судебных документах говорится, что инженеры Nvidia планировали использовать около 500 Тб информации, включая материалы из LibGen и Sci-Hub.
По версии истцов, библиотека предупреждала Nvidia о незаконном характере контента, но менеджмент компании дал согласие на скачивание, объясняя это острой нехваткой качественных текстов и конкурентным давлением на рынке ИИ. Сделка должна была ускорить обучение моделей и повысить их качество за счет расширенного корпуса данных.
Ситуация выглядит особенно спорной с юридической точки зрения. С одной стороны, речь идет о продвижении технологий искусственного интеллекта, с другой – о явном нарушении авторских прав и международного законодательства. Дальнейшее развитие дела будет внимательно отслеживаться в профессиональном сообществе.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn


