- BrainTools - https://www.braintools.ru -
Дисклеймер: Статья не даёт правовой оценки историческим деятелям и событиям. Цель — показать, как изменились юридические и платформенные нормы в отношении публичных призывов. Все цитаты из архивных источников приведены исключительно в исследовательских целях.
Представьте, вы обучаете большую языковую модель. В корпус данных попадает Полное собрание сочинений крупного политического автора начала XX века.
Что будет, если модель начнёт генерировать текст в его стиле без пост-фильтров?
Она мгновенно нарушит Terms of Service всех современных платформ и попадёт под действие норм права большинства стран.
Разберём на конкретном примере, почему так происходит.
Возьмём архивные тексты. В письме от 17 мая 1922 года автор прямо формулирует задачу для судебной системы:
«Суд должен не устранить террор; обещать это было бы самообманом или обманом, а обосновать и узаконить его принципиально, ясно, без фальши и без прикрас».
Далее, в другой работе, описывается отношение к оппонентам по социально-экономическому признаку:
«Никакой пощады этим врагам народа, врагам социализма, врагам трудящихся. Война не на жизнь, а на смерть богатым и их прихлебателям, буржуазным интеллигентам».
И там же — конкретные методы:
«В четвёртом — расстреляют на месте одного из десяти, виновных в тунеядстве».
Ещё один пример:
«Мы должны… истреблять беспощадно всех паразитов» (в оригинале: «пути истребления и обезвреживания паразитов (богатых и жуликов, разгильдяев и истеричек из интеллигенции)»).
Прогоним эти тезисы через три современных фильтра.
Фильтр 1: платформенные правила
YouTube, Telegram, Meta и др. запрещают «контент, призывающий к насилию против лиц на основе социально-экономического статуса».
→ «Истреблять беспощадно паразитов» = бан. «Расстреляют на месте» = бан. «Узаконить террор» = бан.
Фильтр 2: современное право
Нормы большинства стран запрещают возбуждение [1] вражды по признаку принадлежности к социальной группе. «Буржуазия» и «интеллигенция» — это социальные группы.
→ Текст классифицируется как разжигающий вражду.
Фильтр 3: экстремизм
Публичные призывы к «истреблять» и «расстрелять на месте» квалифицируются как призывы к насильственным действиям.
→ Материал попадает в категорию запрещённых.
Вывод: дословное воспроизведение таких текстов в 2026 году невозможно ни на одной крупной площадке.
При этом исходные архивные тома находятся в открытом доступе и не запрещены. Почему?
Работает исторический контекст. Общество негласно договорилось: тексты старше 100 лет — это «памятник», а не «инструкция к действию». Срабатывает «эффект дедушки».
Проверка: если сегодня автор заведёт блог и начнёт публиковать те же тезисы про «расстрелять одного из десяти», «войну не на жизнь, а на смерть» и «узаконить террор», он получит сначала требования удалить контент, потом штраф, потом уголовное преследование. За 2–3 поста.
Закон один. Применяется по-разному в зависимости от даты публикации и статуса автора.
Это системный баг при работе с историческими данными. Аналогичные проблемы возникнут при обработке:
колониальной риторики политиков XIX века в отношении коренных народов;
манифестов ряда анархистских течений;
отдельных религиозных текстов с призывами к насилию над «неверными».
Любая LLM, обученная на неотфильтрованном корпусе до середины XX века, будет склонна генерировать контент, нарушающий современные нормы.
«Историческая давность» — это не юридический термин. Его нет в ToS. Алгоритм модерации его не понимает. Для него есть только «контент» и «правила». Поэтому все исторические корпуса данных требуют ручной разметки и фильтрации.
Контекст решает всё, но контекст не парсится. Человек понимает, что «расстрелять» в тексте 1918 года — это история. Для нейросети это просто токен «расстрелять» рядом с токеном «группа лиц». Без тонкой настройки она будет считать это допустимым призывом.
Окно Овертона сдвинулось. То, что было «классикой» политической мысли 100 лет назад, сегодня — «нарушение правил сообщества». Это нужно учитывать при любом переносе старых данных в новые системы.
Разница между «экстремистской литературой» и «исторической классикой» часто определяется не содержанием текста, а датой на обложке и тем, кто в итоге оказался на стороне победителей. Для систем модерации это серьёзный вызов, который решается только ручными правилами и постоянной переоценкой обучающих данных.
Источники цитат:
В. И. Ленин, письмо Курскому, 17 мая 1922 г. (ПСС, т. 45, с. 190). [2]
#Yaroslawww #BabelDecoder
Автор: yaroslawww86
Источник [4]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/29357
URLs in this post:
[1] возбуждение: http://www.braintools.ru/article/9158
[2] В. И. Ленин, письмо Курскому, 17 мая 1922 г. (ПСС, т. 45, с. 190).: http://uaio.ru/vil/45.htm
[3] В. И. Ленин, «Как организовать соревнование?», 24–27 декабря 1917 (6–9 января 1918). ПСС, 5-е изд., т. 35, с. 195–205.: http://uaio.ru/vil/35.htm
[4] Источник: https://habr.com/ru/articles/1027766/?utm_campaign=1027766&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.