Группа исследователей из Йельского университета представила новый тип открытых лицензий CCAI (Contextual Copyleft). Они расширяют применение копилефта к генеративным ИИ-моделям.

Идея состоит в том, что использование содержимого под лицензией в качестве данных для машинного обучения приводит к распространению условий копилефта на результаты вывода ИИ. Предполагается, что CCAI могут способствовать снижению злоупотреблений в ИИ-проектах и предотвращению появления фиктивных ИИ-моделей, которые формально преподносятся как открытые, но из-за сокрытия исходных данных и инструментария для обучения привязаны к производителю.
Согласно CCAI, любое распространение и публикация точных копий или изменённых производных работ должно осуществляться под теми же лицензионными условиями без наложения дополнительных ограничений. Данное требование касается любой ИИ-модели, набора данных или ИИ-систем, при обучении которых использовалось ПО под лицензией CCAI или результат его работы. В контексте обучения ИИ CCAI требует раскрытия исходного кода модели, детального описания задействованных при обучении данных, параметров, весов и архитектуры модели.
Лицензию также можно использовать как дополнительное требование, прикрепляемое к существующим копилефт-лицензиям, таким как AGPLv3. Это требование расширяет действие лицензии на обучающие наборы данных, код и весовые коэффициенты модели в соответствии с критериями открытости ИИ-систем, сформулированными организацией Open Source Initiative (OSI). Код под подобной лицензией может использоваться для обучения ИИ-модели только при условии, что всем пользователям будет предоставлено описание обучающего набора данных, код для обучения и самой модели, в том числе её параметров и архитектуры.
В декабре открытый стандарт лицензирования Really Simple Licensing 1.0 (RSL) получил статус официального. Он должен обязать ИИ-компании платить за контент, собираемый ими в интернете. Выпуск RSL 1.0 позволяет издателям блокировать свой контент от функций поиска на основе ИИ, таких как режим ИИ от Google, сохраняя при этом присутствие в традиционных результатах поиска. Стандарт определяет дополнительные категории использования контента «ai-all», «ai-input» и «ai-index».
Автор: maybe_elf


