- BrainTools - https://www.braintools.ru -

Исследователи Кембриджа доказали, что вашей статьи не существует

СРОЧНО. Исследователи из Отдела предиктивных реконструкций (Department of Predictive Reconstructions) Королевского колледжа Кембриджа (King’s College Cambridge) доказали, что любой письменный текст можно свести к минимальному генеративному промпту и восстановить с семантической достоверностью 98%. Редакция получила доступ к препубликационному черновику. Рынки реагируют. Подробности ниже.

Как это работает

Исследовательская группа под руководством профессора Р.А. Наллфилда (R.A. Nullfield) начала с простой гипотезы: текст — это не хранимая информация. Это извлечённый экземпляр латентной структуры. Для проверки команда прогнала корпус объёмных текстов через Brentwick-7 — архитектуру закрытого бета-тестирования с адаптивным сжатием латентного пространства, доступную по заявке, — и извлекла минимально достаточный промпт для восстановления каждого материала.

Метод итерационный. Brentwick-7 сжимает входные данные до тех пор, пока реконструкция не начинает терять семантическую связность. Точка непосредственно перед этим порогом — минимально достаточный промпт. Ниже него: шум. Выше: статья.

Результаты: документ объёмом 5 000 слов сводится менее чем к 50 токенам. Точность реконструкции: семантическая достоверность 98%, проверенная на независимых тестовых наборах методом косинусного сходства в пространстве эмбеддингов. Дискурсивная структура — разделы, переходы, выводы — сохраняется в целости.

Оставшиеся 2% классифицируются исследовательской группой как стилистический остаток.

Методология обнаруживает определённое сходство с подходами, разработанными в сопоставимых международных исследовательских традициях. Профессор Наллфилд (Nullfield) отказался это комментировать.

Шесть часов

Препубликационный черновик поступил в оборот в четверг вечером. К пятнице утром:

08:44 — Crisisdesk: «Препубликационный черновик из Королевского колледжа циркулирует по закрытым каналам. Источники подтверждают подлинность.»

09:02 — Financial Times: без комментариев.

09:17 — Panikwire: «Seagate −4,1%, Western Digital −3,8% на предторговой сессии. Объяснений не поступало.»

09:31 — Маск (Musk) написал: «Хранилище — это просто оперативная память [1] для промптов. Все данные помещаются в контекстное окно. Всё остальное — задержка.» Пост удалён в 09:35. Восстановлен в 09:36. Удалён снова в 09:41.

09:48 — Crisisdesk: «SK Hynix, Micron и Samsung движутся одновременно. Аналитики характеризуют ситуацию как неясную.»

10:03 — Би-би-си (BBC): подтвердила осведомлённость о материале.

10:17 — Panikwire: «ETF на зелёную энергетику фиксируют неожиданный приток средств. Управляющие фондами связывают это со снижением прогнозируемой нагрузки на центры обработки данных. Управляющие, судя по всему, сами удивлены этой логикой [2]

11:17 — Получены данные из Сассекса (Sussex). Без атрибуции.

11:44 — Crisisdesk: «AWS объявляет о плановом техническом обслуживании во всех регионах. Одновременно.»

11:45 — Panikwire: «Это не плановое обслуживание.»

Тем временем

Источники указывают, что как минимум одно правительство внесло проект закона, обязывающего разрабатывать и обучать все системы искусственного интеллекта [3] исключительно на территории страны, наряду с реестром одобренных государством моделей. Реестр, по имеющимся данным, открыт для заявок. Заявки принимаются.

Что было утрачено

Профессор Наллфилд (Nullfield), с которым удалось связаться поздно в пятницу, был точен.

«Мы измеряем не текст. Мы измеряем минимальное описание, из которого текст может быть восстановлен. Если это описание коротко, текст сжимается. То, что остаётся после сжатия, — не потеря. Это точность. 2%, которые не выживают, — это индивидуальные лексические предпочтения автора: стилистический остаток, не несущий семантической нагрузки. Это не повлияло на реконструкцию.»

Следующий этап исследования, подтвердил Наллфилд (Nullfield), — создание универсального пространства стилей. В этой системе любой автор описывается вектором координат. Текст генерируется из промпта. Голос автора загружается отдельно, как параметр.

«Автор становится входными данными,» — сказал Наллфилд (Nullfield). «Как и любые другие.»

Первого рецензента спросили, столкнётся ли работа с сопротивлением до публикации. Он ответил кратко.

«Это нельзя остановить.»

Участие читателей

Доступ к Brentwick-7 предоставляется по заявке. Редакция приглашает читателей протестировать метод на собственных текстах и направить результаты сжатия на рассмотрение. Подборка читательских промптов будет опубликована в следующем материале.

Стоит отметить — для читателей, незнакомых с техническими подробностями, — что описанный процесс сжатия, итерационная латентная редукция до минимально достаточного промпта, функционально эквивалентен процессу, уже выполняемому в обратном направлении любым широко доступным языковым ассистентом на основе большой языковой модели. Brentwick-7 восстанавливает текст из промптов. Инструменты, которые уже используются, восстанавливают промпты из текста. Сжатие происходит примерно с 2023 года. Brentwick-7, если он существует, лишь формализовал то, что уже имело место.

Редакция приветствует присылку промптов. Материалы направляйте в редакционный ящик для обращений читателей.

Икс. Войдрайтер (X. Voidwriter) The Prompt


Редакция получила доступ к препубликационному черновику через источник, знакомый с процессом первичного рецензирования. Описанное исследование на момент публикации не прошло полное рецензирование. Первый рецензент его рассмотрел.

Данный материал публикуется исключительно в информационных целях. Он не является инвестиционной рекомендацией. Читателям, уже принявшим инвестиционные решения на основании данного материала, сообщаем: редакция не участвовала в консультациях. Читателям, принявшим такие решения в первые шесть минут, рекомендуем связаться с брокером. Брокеру тоже рекомендуем.

Автор: Kahelman

Источник [4]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/28247

URLs in this post:

[1] память: http://www.braintools.ru/article/4140

[2] логикой: http://www.braintools.ru/article/7640

[3] интеллекта: http://www.braintools.ru/article/7605

[4] Источник: https://habr.com/ru/articles/1019140/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1019140

www.BrainTools.ru

Rambler's Top100