Исследователи Кембриджа доказали, что вашей статьи не существует. llm.. llm. искусственный интеллект.. llm. искусственный интеллект. Исследования и прогнозы в IT.. llm. искусственный интеллект. Исследования и прогнозы в IT. Копирайт.. llm. искусственный интеллект. Исследования и прогнозы в IT. Копирайт. Машинное обучение.. llm. искусственный интеллект. Исследования и прогнозы в IT. Копирайт. Машинное обучение. Сжатие данных.

СРОЧНО. Исследователи из Отдела предиктивных реконструкций (Department of Predictive Reconstructions) Королевского колледжа Кембриджа (King’s College Cambridge) доказали, что любой письменный текст можно свести к минимальному генеративному промпту и восстановить с семантической достоверностью 98%. Редакция получила доступ к препубликационному черновику. Рынки реагируют. Подробности ниже.

Как это работает

Исследовательская группа под руководством профессора Р.А. Наллфилда (R.A. Nullfield) начала с простой гипотезы: текст — это не хранимая информация. Это извлечённый экземпляр латентной структуры. Для проверки команда прогнала корпус объёмных текстов через Brentwick-7 — архитектуру закрытого бета-тестирования с адаптивным сжатием латентного пространства, доступную по заявке, — и извлекла минимально достаточный промпт для восстановления каждого материала.

Метод итерационный. Brentwick-7 сжимает входные данные до тех пор, пока реконструкция не начинает терять семантическую связность. Точка непосредственно перед этим порогом — минимально достаточный промпт. Ниже него: шум. Выше: статья.

Результаты: документ объёмом 5 000 слов сводится менее чем к 50 токенам. Точность реконструкции: семантическая достоверность 98%, проверенная на независимых тестовых наборах методом косинусного сходства в пространстве эмбеддингов. Дискурсивная структура — разделы, переходы, выводы — сохраняется в целости.

Оставшиеся 2% классифицируются исследовательской группой как стилистический остаток.

Методология обнаруживает определённое сходство с подходами, разработанными в сопоставимых международных исследовательских традициях. Профессор Наллфилд (Nullfield) отказался это комментировать.

Шесть часов

Препубликационный черновик поступил в оборот в четверг вечером. К пятнице утром:

08:44 — Crisisdesk: «Препубликационный черновик из Королевского колледжа циркулирует по закрытым каналам. Источники подтверждают подлинность.»

09:02 — Financial Times: без комментариев.

09:17 — Panikwire: «Seagate −4,1%, Western Digital −3,8% на предторговой сессии. Объяснений не поступало.»

09:31 — Маск (Musk) написал: «Хранилище — это просто оперативная память для промптов. Все данные помещаются в контекстное окно. Всё остальное — задержка.» Пост удалён в 09:35. Восстановлен в 09:36. Удалён снова в 09:41.

09:48 — Crisisdesk: «SK Hynix, Micron и Samsung движутся одновременно. Аналитики характеризуют ситуацию как неясную.»

10:03 — Би-би-си (BBC): подтвердила осведомлённость о материале.

10:17 — Panikwire: «ETF на зелёную энергетику фиксируют неожиданный приток средств. Управляющие фондами связывают это со снижением прогнозируемой нагрузки на центры обработки данных. Управляющие, судя по всему, сами удивлены этой логикой

11:17 — Получены данные из Сассекса (Sussex). Без атрибуции.

11:44 — Crisisdesk: «AWS объявляет о плановом техническом обслуживании во всех регионах. Одновременно.»

11:45 — Panikwire: «Это не плановое обслуживание.»

Тем временем

Источники указывают, что как минимум одно правительство внесло проект закона, обязывающего разрабатывать и обучать все системы искусственного интеллекта исключительно на территории страны, наряду с реестром одобренных государством моделей. Реестр, по имеющимся данным, открыт для заявок. Заявки принимаются.

Что было утрачено

Профессор Наллфилд (Nullfield), с которым удалось связаться поздно в пятницу, был точен.

«Мы измеряем не текст. Мы измеряем минимальное описание, из которого текст может быть восстановлен. Если это описание коротко, текст сжимается. То, что остаётся после сжатия, — не потеря. Это точность. 2%, которые не выживают, — это индивидуальные лексические предпочтения автора: стилистический остаток, не несущий семантической нагрузки. Это не повлияло на реконструкцию.»

Следующий этап исследования, подтвердил Наллфилд (Nullfield), — создание универсального пространства стилей. В этой системе любой автор описывается вектором координат. Текст генерируется из промпта. Голос автора загружается отдельно, как параметр.

«Автор становится входными данными,» — сказал Наллфилд (Nullfield). «Как и любые другие.»

Первого рецензента спросили, столкнётся ли работа с сопротивлением до публикации. Он ответил кратко.

«Это нельзя остановить.»

Участие читателей

Доступ к Brentwick-7 предоставляется по заявке. Редакция приглашает читателей протестировать метод на собственных текстах и направить результаты сжатия на рассмотрение. Подборка читательских промптов будет опубликована в следующем материале.

Стоит отметить — для читателей, незнакомых с техническими подробностями, — что описанный процесс сжатия, итерационная латентная редукция до минимально достаточного промпта, функционально эквивалентен процессу, уже выполняемому в обратном направлении любым широко доступным языковым ассистентом на основе большой языковой модели. Brentwick-7 восстанавливает текст из промптов. Инструменты, которые уже используются, восстанавливают промпты из текста. Сжатие происходит примерно с 2023 года. Brentwick-7, если он существует, лишь формализовал то, что уже имело место.

Редакция приветствует присылку промптов. Материалы направляйте в редакционный ящик для обращений читателей.

Икс. Войдрайтер (X. Voidwriter) The Prompt


Редакция получила доступ к препубликационному черновику через источник, знакомый с процессом первичного рецензирования. Описанное исследование на момент публикации не прошло полное рецензирование. Первый рецензент его рассмотрел.

Данный материал публикуется исключительно в информационных целях. Он не является инвестиционной рекомендацией. Читателям, уже принявшим инвестиционные решения на основании данного материала, сообщаем: редакция не участвовала в консультациях. Читателям, принявшим такие решения в первые шесть минут, рекомендуем связаться с брокером. Брокеру тоже рекомендуем.

Автор: Kahelman

Источник