Google собирает в три раза больше данных об искусственном интеллекте OpenAI благодаря своей монополии в сфере поиска

Данные Cloudflare показывают, что сочетание поиска Google и сканирования с помощью искусственного интеллекта ^[1] даёт компании огромное преимущество в плане данных перед OpenAI и Anthropic.

Генеральный директор Cloudflare Мэтью Принс утверждает, что Google получает выгоду от необычайно привилегированного уровня доступа к интернету благодаря тому, как поисковый робот связан с системами сбора данных для искусственного интеллекта.

По словам Принса, внутренние измерения Cloudflare показывают, что в настоящее время Google просматривает в 3,2 раза больше страниц, чем OpenAI. Разница ещё больше, если сравнивать с другими конкурентами: Google просматривает в 4,6 раза больше контента, чем Microsoft, и в 4,8 раза больше, чем Anthropic. По мнению Принса, этот дисбаланс связан с решением Google объединить поисковый робот с роботом для ИИ. Владельцы сайтов не могут заблокировать обучение ^[2] ИИ, не исчезнув при этом из поисковой системы Google, что создаёт дилемму, которая фактически дает Google эксклюзивный доступ к огромным объёмам данных.

Принс рассматривает это как злоупотребление давним доминированием на рынке, предполагая, что поведение ^[3] Google позволяет компании распространить свою историческую монополию на развивающуюся сферу искусственного интеллекта.

Как привязка к поиску ограничивает возможности издателей в блокировке ИИ-скрапинга

Масштаб дисбаланса становится более очевидным, если посмотреть, насколько агрессивно владельцы сайтов пытаются дать отпор. С 1 июля Cloudflare уже заблокировала 416 миллиардов запросов ИИ для своих клиентов. Эти блокировки в основном затрагивают компании, которые следуют стандартам или идентифицируют своих краулеров отдельно. Однако Google обходит этот барьер благодаря тесному взаимодействию своих поисковых систем и ИИ.

Перед издателями стоит дилемма: разрешить использовать свой контент для обучения ИИ-моделей Google или потерять позиции в поисковой выдаче. Для многих такой компромисс может оказаться губительным с финансовой точки зрения ^[4].

Принс сказал WIRED, что Google является главным препятствием на пути к прогрессу, если только на него не будет оказано давление или его не убедят разделить поисковые и ИИ-краулеры. Без такого разделения у издателей практически не будет возможности защитить свой контент или договориться о моделях лицензирования, которые будут иметь решающее значение в эпоху ИИ.

Делегируйте часть рутинных задач вместе с BotHub! ^[5] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке ^[6] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник ^[7]

Автор: MrRjxrby

Источник ^[8]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/22844

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] обучение: http://www.braintools.ru/article/5125

[3] поведение: http://www.braintools.ru/article/9372

[4] зрения: http://www.braintools.ru/article/6238

[5] BotHub!: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=GOOGLE_COLLECTS_THREE_TIMES_AS_MUCH_DATA_ON_ARTIFICIAL_INTELLIGENCE_AS_OPENAI_DUE_TO_ITS_MONOPOLY_IN_THE_FIELD_OF_SEARCH

[6] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7

[7] Источник: https://the-decoder.com/google-gathers-triple-openais-ai-data-through-its-search-monopoly/

[8] Источник: https://habr.com/ru/companies/bothub/news/974128/?utm_source=habrahabr&utm_medium=rss&utm_campaign=974128

Нажмите здесь для печати.