- BrainTools - https://www.braintools.ru -

Большие языковые модели кажутся умными, потому что говорят бегло, уверенно и в огромных масштабах. Но беглость – это не понимание, а уверенность – это не восприятие [1]. Чтобы ухватить реальное ограничение сегодняшних ИИ-систем, полезно вернуться к идее возрастом более двух тысяч лет.
В “Государстве” Платон [2] описывает аллегорию пещеры [3]: узники, закованные в цепи внутри пещеры, могут видеть только тени, проецируемые на стену. Никогда не видев реальных объектов, отбрасывающих эти тени, они принимают видимость за реальность и лишены возможности испытать настоящий мир.
Большие языковые модели живут в очень похожей пещере.
LLM не видят, не слышат, не касаются и не взаимодействуют с реальностью. Они обучены почти полностью на тексте: книгах, статьях, постах, комментариях, расшифровках и фрагментах человеческого самовыражения, собранных из истории и интернета. Этот текст – их единственный вход. Их единственный “опыт”.
LLM видят только “тени”: тексты, созданные людьми, описывающими мир. Эти тексты – их целая вселенная. Все, что LLM знает о реальности, приходит отфильтрованным через язык, написанный людьми с разной степенью интеллекта [4], честности, предвзятости, знаний и намерений.
Текст – это не реальность. Это человеческое представление реальности. Оно опосредовано, неполно, предвзято и дико гетерогенно, часто искажено. Человеческий язык отражает мнения, недопонимания, культурные слепые пятна и откровенную ложь. Книги и интернет содержат экстраординарные инсайты, но также теории заговора, пропаганду, порнографию, насилие и чистую чушь. Когда мы обучаем LLM на “всем тексте”, мы не даем им доступ к миру. Мы даем им доступ к человеческим теням на стене.
Это не незначительное ограничение. Это основной архитектурный дефект современного ИИ.
Преобладающее предположение в стратегии ИИ было таким: масштаб исправляет все – больше данных, модели покрупнее, больше параметров, больше вычислений. Но больше теней на стене не равняется реальности.
Поскольку LLM обучены предсказывать статистически наиболее вероятное следующее слово, они отлично справляются с производством правдоподобного языка, но не с пониманием причинности, физических ограничений или реальных последствий. Вот почему галлюцинации – это не баг, который можно исправить патчем, а структурное ограничение [5].
Как неоднократно утверждал Ян ЛеКун [6], одного языка недостаточно как основы для интеллекта [7].
Вот почему внимание [8] все больше поворачивается к world models (мировым моделям) [9]: системам, которые строят внутренние представления о том, как работают среды, учатся на взаимодействии и симулируют результаты перед действием.
В отличие от LLM, мировые модели не ограничены текстом. Они могут включать временные ряды данных, сенсорные входы, циклы обратной связи, данные ERP, таблицы, симуляции и последствия действий. Вместо вопроса “Какое наиболее вероятное следующее слово?” они задают гораздо более мощный вопрос:
“Что произойдет, если мы сделаем это [10]?”
Для руководителей это не абстрактные исследовательские дебаты. Мировые модели уже появляются (часто без соответствующей маркировки) в областях, где одного языка недостаточно.
Цепочки поставок и логистика: Языковая модель может суммировать сбои или генерировать отчеты. Мировая модель может симулировать, как закрытие порта, рост цен на топливо или провал поставщика распространяется по сети, и тестировать альтернативные ответы перед вложением капитала.
Страхование и управление рисками: LLM могут объяснять политики или отвечать на вопросы клиентов. Мировые модели могут изучать, как риск на самом деле эволюционирует во времени, симулировать экстремальные события и оценивать каскадные потери при разных сценариях – то, что ни одна текстовая система не может делать надежно.
Производство и операции: Цифровые двойники фабрик – это ранние мировые модели. Они не просто описывают процессы; они симулируют, как машины, материалы и тайминг взаимодействуют, позволяя компаниям предсказывать отказы, оптимизировать пропускную способность и тестировать изменения виртуально перед касанием реальной системы.
Во всех этих случаях язык полезен, но недостаточен. Понимание требует модели того, как ведет себя мир, а не только того, как люди о нем говорят.
Весь этот разговор о переходе от языковых моделей к мировым моделям поднимает практический вопрос: как профессионалам и компаниям готовиться к этому сдвигу уже сегодня?
Проблема в том, что пока мировые модели развиваются в лабораториях и специализированных приложениях, понимание их принципов работы требует экспериментирования с современными ИИ-системами. Нельзя строить будущее, не понимая настоящего.
Сервисы вроде BotHub дают возможность экспериментировать с разными подходами к ИИ прямо из браузера – от языковых моделей до более сложных архитектур.

Для доступа не требуется VPN, можно использовать российскую карту.
По ссылке вы можете получить 300 000 бесплатных токенов [11] для первых задач и приступить к работе с нейросетями прямо сейчас!
Не привязывайтесь к одному источнику информации [12]. Привяжитесь к инструментам, которые помогают видеть полную картину.
Это не значит отказываться от языковых моделей. Это значит поставить их на правильное место.
В следующей фазе ИИ:
LLM становятся интерфейсами, копилотами и переводчиками
Мировые модели обеспечивают заземление, предсказание и планирование
Язык располагается поверх систем, которые учатся на самой реальности
В аллегории Платона узники освобождаются не изучением теней более внимательно – они освобождаются, повернувшись и столкнувшись с источником этих теней, и в конечном счете с миром за пределами пещеры.
ИИ приближается к похожему моменту.
Организации, которые распознают это рано, перестанут принимать беглый язык за понимание и начнут инвестировать в архитектуры, моделирующие их собственную реальность. Эти компании не будут просто строить ИИ, который убедительно говорит о мире – они построят ИИ, который действительно понимает, как он работает.
Поймет ли ваша компания это? Сможет ли ваша компания построить свою мировую модель?
Автор: cognitronn
Источник [13]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/25197
URLs in this post:
[1] восприятие: http://www.braintools.ru/article/7534
[2] Платон: http://www.braintools.ru/article/8253
[3] аллегорию пещеры: https://en.wikipedia.org/wiki/Allegory_of_the_cave
[4] интеллекта: http://www.braintools.ru/article/7605
[5] почему галлюцинации – это не баг, который можно исправить патчем, а структурное ограничение: https://www.ft.com/content/7a4e7eae-f004-486a-987f-4a2e4dbd34fb
[6] Ян ЛеКун: https://en.wikipedia.org/wiki/Yann_LeCun
[7] одного языка недостаточно как основы для интеллекта: https://www.ft.com/content/23fab126-f1d3-4add-a457-207a25730ad9
[8] внимание: http://www.braintools.ru/article/7595
[9] world models (мировым моделям): https://techcrunch.com/2024/12/14/what-are-ai-world-models-and-why-do-they-matter/
[10] Что произойдет, если мы сделаем это: https://medium.com/@ML-today/world-modeling-the-future-of-ai-ff8703daa220
[11] По ссылке вы можете получить 300 000 бесплатных токенов: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[12] источнику информации: http://www.braintools.ru/article/8616
[13] Источник: https://habr.com/ru/companies/bothub/articles/992600/?utm_source=habrahabr&utm_medium=rss&utm_campaign=992600
Нажмите здесь для печати.