СРОЧНО. Исследователи из Отдела предиктивных реконструкций (Department of Predictive Reconstructions) Королевского колледжа Кембриджа (King’s College Cambridge) доказали, что любой письменный текст можно свести к минимальному генеративному промпту и восстановить с семантической достоверностью 98%. Редакция получила доступ к препубликационному черновику. Рынки реагируют. Подробности ниже.
Как это работает
Исследовательская группа под руководством профессора Р.А. Наллфилда (R.A. Nullfield) начала с простой гипотезы: текст — это не хранимая информация. Это извлечённый экземпляр латентной структуры. Для проверки команда прогнала корпус объёмных текстов через Brentwick-7 — архитектуру закрытого бета-тестирования с адаптивным сжатием латентного пространства, доступную по заявке, — и извлекла минимально достаточный промпт для восстановления каждого материала.
Метод итерационный. Brentwick-7 сжимает входные данные до тех пор, пока реконструкция не начинает терять семантическую связность. Точка непосредственно перед этим порогом — минимально достаточный промпт. Ниже него: шум. Выше: статья.
Результаты: документ объёмом 5 000 слов сводится менее чем к 50 токенам. Точность реконструкции: семантическая достоверность 98%, проверенная на независимых тестовых наборах методом косинусного сходства в пространстве эмбеддингов. Дискурсивная структура — разделы, переходы, выводы — сохраняется в целости.
Оставшиеся 2% классифицируются исследовательской группой как стилистический остаток.
Методология обнаруживает определённое сходство с подходами, разработанными в сопоставимых международных исследовательских традициях. Профессор Наллфилд (Nullfield) отказался это комментировать.
Шесть часов
Препубликационный черновик поступил в оборот в четверг вечером. К пятнице утром:
08:44 — Crisisdesk: «Препубликационный черновик из Королевского колледжа циркулирует по закрытым каналам. Источники подтверждают подлинность.»
09:02 — Financial Times: без комментариев.
09:17 — Panikwire: «Seagate −4,1%, Western Digital −3,8% на предторговой сессии. Объяснений не поступало.»
09:31 — Маск (Musk) написал: «Хранилище — это просто оперативная память для промптов. Все данные помещаются в контекстное окно. Всё остальное — задержка.» Пост удалён в 09:35. Восстановлен в 09:36. Удалён снова в 09:41.
09:48 — Crisisdesk: «SK Hynix, Micron и Samsung движутся одновременно. Аналитики характеризуют ситуацию как неясную.»
10:03 — Би-би-си (BBC): подтвердила осведомлённость о материале.
10:17 — Panikwire: «ETF на зелёную энергетику фиксируют неожиданный приток средств. Управляющие фондами связывают это со снижением прогнозируемой нагрузки на центры обработки данных. Управляющие, судя по всему, сами удивлены этой логикой.»
11:17 — Получены данные из Сассекса (Sussex). Без атрибуции.
11:44 — Crisisdesk: «AWS объявляет о плановом техническом обслуживании во всех регионах. Одновременно.»
11:45 — Panikwire: «Это не плановое обслуживание.»
Тем временем
Источники указывают, что как минимум одно правительство внесло проект закона, обязывающего разрабатывать и обучать все системы искусственного интеллекта исключительно на территории страны, наряду с реестром одобренных государством моделей. Реестр, по имеющимся данным, открыт для заявок. Заявки принимаются.
Что было утрачено
Профессор Наллфилд (Nullfield), с которым удалось связаться поздно в пятницу, был точен.
«Мы измеряем не текст. Мы измеряем минимальное описание, из которого текст может быть восстановлен. Если это описание коротко, текст сжимается. То, что остаётся после сжатия, — не потеря. Это точность. 2%, которые не выживают, — это индивидуальные лексические предпочтения автора: стилистический остаток, не несущий семантической нагрузки. Это не повлияло на реконструкцию.»
Следующий этап исследования, подтвердил Наллфилд (Nullfield), — создание универсального пространства стилей. В этой системе любой автор описывается вектором координат. Текст генерируется из промпта. Голос автора загружается отдельно, как параметр.
«Автор становится входными данными,» — сказал Наллфилд (Nullfield). «Как и любые другие.»
Первого рецензента спросили, столкнётся ли работа с сопротивлением до публикации. Он ответил кратко.
«Это нельзя остановить.»
Участие читателей
Доступ к Brentwick-7 предоставляется по заявке. Редакция приглашает читателей протестировать метод на собственных текстах и направить результаты сжатия на рассмотрение. Подборка читательских промптов будет опубликована в следующем материале.
Стоит отметить — для читателей, незнакомых с техническими подробностями, — что описанный процесс сжатия, итерационная латентная редукция до минимально достаточного промпта, функционально эквивалентен процессу, уже выполняемому в обратном направлении любым широко доступным языковым ассистентом на основе большой языковой модели. Brentwick-7 восстанавливает текст из промптов. Инструменты, которые уже используются, восстанавливают промпты из текста. Сжатие происходит примерно с 2023 года. Brentwick-7, если он существует, лишь формализовал то, что уже имело место.
Редакция приветствует присылку промптов. Материалы направляйте в редакционный ящик для обращений читателей.
Икс. Войдрайтер (X. Voidwriter) The Prompt
Редакция получила доступ к препубликационному черновику через источник, знакомый с процессом первичного рецензирования. Описанное исследование на момент публикации не прошло полное рецензирование. Первый рецензент его рассмотрел.
Данный материал публикуется исключительно в информационных целях. Он не является инвестиционной рекомендацией. Читателям, уже принявшим инвестиционные решения на основании данного материала, сообщаем: редакция не участвовала в консультациях. Читателям, принявшим такие решения в первые шесть минут, рекомендуем связаться с брокером. Брокеру тоже рекомендуем.
Автор: Kahelman


