
Разработчиков в сфере искусственного интеллекта в России могут обязать раскрывать массивы данных, на которых обучались или тестировались их модели, сообщает газета «Ведомости» со ссылкой на источники.
Соответствующий законопроект прорабатывают Минцифры, отраслевые ассоциации и компании в сфере ИИ. Согласно одной из рабочих версий проекта, разработчики должны будут указывать наименование набора данных, дату создания, назначение использования, формат, объём и происхождение. Пока неясно, где будут собираться эти сведения — вероятно, для этого власти создадут некий реестр отечественного ИИ или отечественных наборов данных.
Инициатива обсуждалась при подготовке законопроекта об искусственном интеллекте, но в итоге не вошла в текущую версию документа.
Представители отрасли считают, что полное и точное описание массива данных в формате реестра потребует значительных ресурсов. В частности, представитель Альянса в сфере ИИ (в него входят в том числе«Сбер», «Яндекс», VK, Т‑Банк и МТС) отметил, что требуемые ресурсы будут несоразмерно результату, либо же ведение реестра сведётся к формальному перечислению без какой‑либо аналитической ценности.
Обсуждение инициативы проходит на фоне многочисленных судебных исков, которые по всему миру получают технологические компании из‑за неправомерного использования данных для обучения моделей. В частности, такие претензии предъявляют журналисты, авторы блогов, художники, издания и другие авторы контента, которые считают, что техногиганты незаконно используют уникальные ценные произведения. В случае, если инициатива по раскрытию данных, используемых для обучения нейросетей, будет принята в России и вскроются похожие случаи незаконного использования материалов, аналогичные судебные прецеденты могут появиться и в России.
Автор: avouner


