
Исследователи из ETH Zurich совместно с Anthropic показали, что современные модели способны деанонимизировать людей, анализируя только их тексты в интернете.
В эксперименте использовали 338 профилей с форума Hacker News. Из данных заранее удалили прямые идентификаторы, такие как имена и ссылки на соцсети. AI-агент изучал стиль письма, упоминания работы, интересов, географии и другие косвенные детали. На основе этого он формировал вероятный профиль человека: профессию, местоположение, хобби и политические взгляды.
Далее эти характеристики сопоставили с базой из 89 тысяч профилей LinkedIn. В результате удалось корректно установить личности примерно двух третей пользователей. Похожий результат исследователи получили и при анализе части аккаунтов Reddit.
Авторы подчёркивают, что использовалась исключительно открытая информация. Никакого взлома или утечки данных не было. Главный вывод звучит просто: чем больше человек пишет в сети, тем легче по совокупности деталей установить, кто он.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn


