- BrainTools - https://www.braintools.ru -
Cloudflare обвинила [1] Perplexity в том, что ИИ‑боты компании игнорируют ограничения и продолжают скрыто извлекать и копировать контент с десятков тысяч доменов, используя автономные системы для обхода блокировок.
В Cloudflare заявили, что Perplexity меняет названия своих ботов в поле User‑Agent. Для обхода блокировок компания, в частности, выдаёт действия ботов за действия человека в браузере Google Chrome для macOS, говорят в Cloudflare. Кроме того, Perplexity использует постоянно меняющиеся IP‑адреса для своих ботов, которые не включает в официальный список адресов, применяющихся ботами.
Также Cloudflare обвиняет Perplexity в том, что компания меняет ASN, чтобы обходить блокировки на сайтах. Такая активность, утверждают в Cloudflare, регистрировалась на десятках тысяч сайтов, а количество запросов исчислялось миллионами в день.
Это обнаружилось после того, как в компанию поступили жалобы от клиентов, которые установили ограничения в файл robots.txt, но всё равно были вынуждены установить дополнительные ограничения для ботов Perplexity.
Cloudflare вычеркнула Perplexity из своего официального списка доверенных краулеров. Perplexity, в свою очередь, называет действия и заявления Cloudflare маркетинговым ходом. В компании утверждают, что на приведённых Cloudflare скриншотах нет подтверждений факта доступа ИИ‑ботов к контенту, а упомянутый в отчёте бот не принадлежит стартапу. Cloudflare перепутала 20–25 миллионов запросов от настоящих пользователей с запросами от ИИ‑ботов, заявили в Perplexity.
Автор: avouner
Источник [2]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/18050
URLs in this post:
[1] обвинила: https://www.theverge.com/news/718319/perplexity-stealth-crawling-cloudflare-ai-bots-report
[2] Источник: https://habr.com/ru/news/934700/?utm_source=habrahabr&utm_medium=rss&utm_campaign=934700
Нажмите здесь для печати.