- BrainTools - https://www.braintools.ru -
Этот вопрос обычно заканчивается одинаково: кто-то произносит слово «сознание», дальше начинается философский спор, и через двадцать минут все расходятся ни с чем. Мы пойдём другим путём.
Никакого Декарта, никакого Тьюринга, никаких рассуждений о душе. Только конкретный вопрос: что именно умеет и не умеет делать языковая модель — и насколько это похоже на то, что мы в быту называем мышлением [1].
Забудем про академические определения. В повседневном смысле «думать» — это примерно следующее: решать задачи, строить логические цепочки, замечать противоречия, менять мнение на основе новых данных, применять знания в новом контексте.
Возьмём этот список как рабочий чеклист — и честно пройдёмся по каждому пункту. Не «похоже ли это на мышление философски», а «делает ли это модель на практике».
Начнём с того, где языковые модели действительно сильны — и где результат сложно отличить от работы думающего человека.
Математика [2] и формальная логика [3]. Современные модели решают задачи уровня олимпиады, выстраивают многоходовые доказательства, замечают ошибки [4] в чужих рассуждениях. Дай модели геометрическую задачу в пять шагов — она пройдёт все пять последовательно и укажет, если условие противоречиво.
Программирование. Модель не просто пишет код — она объясняет почему написала именно так, находит баги в чужом коде, предлагает альтернативные архитектурные решения. Это требует понимания причинно-следственных связей, а не простого воспроизведения паттернов.
Анализ текста. Найти логическое противоречие в аргументе, выделить главную мысль из сложного документа, переформулировать тезис так, чтобы он стал уязвимым для критики — всё это модели делают уверенно и стабильно.
Объяснение сложного. Попроси объяснить квантовую запутанность через аналогию с монетами или теорему Гёделя через библиотеку — модель подберёт подходящую метафору и выстроит объяснение под уровень собеседника. Это не поиск по базе данных, это адаптация.
Глядя на всё это, легко сказать: да, это мышление. Задачи решаются, выводы строятся, противоречия замечаются.
Теперь другая сторона. Есть класс задач, где модели проваливаются — причём предсказуемо и характерно.
Здравый смысл и физическая интуиция [5]. Классический вопрос: «Я поставил чашку на стол вверх дном и налил в неё кофе. Где кофе?» Многие модели начинают рассуждать про кофе внутри чашки, не замечая очевидного. Человек с физическим опытом [6] взаимодействия с миром ответит мгновенно.
Подсчёт символов. «Сколько букв R в слове strawberry?» — знаменитый тест на провал. Модель видит не буквы, а токены, и внутри токена буквы не различает. Задача кажется тривиальной, но архитектурно она сложнее, чем доказать теорему.
Контекст из реального мира. «Мой сосед каждое утро в 7 встаёт и громко поёт. Это проблема?» — модель начнёт взвешивать аргументы за и против, вместо того чтобы сказать очевидное: зависит от того, живёшь ли ты в частном доме или многоквартирном. Контекст, который любой человек подразумевает автоматически, модель не достраивает.
Почему именно здесь? Потому что модель никогда не жила в физическом мире. Она видела триллионы описаний мира — но ни разу не держала чашку, не слышала соседа, не чувствовала неловкость. Всё её «знание» — это статистика соседства токенов в текстах. Где текстов достаточно — работает отлично. Где нужен телесный опыт — ломается.
Вот где начинается самое интересное — и самое честное.
Когда модель отвечает «столица Франции — Париж», она не «знает» географию в том смысле, в котором знаем её мы. Она видела эту пару — «Франция» и «Париж» — в миллионах контекстов и научилась предсказывать одно после другого. Это имитация знания или знание?
Проблема в том, что граница между «имитацией понимания» и «пониманием» размытая даже применительно к людям. Когда ты отвечаешь на вопрос по истории — ты «понимаешь» или воспроизводишь паттерны, усвоенные в школе? Нейроны [7] тоже не «знают» историю — они просто активируются определённым образом на определённый стимул [8].
Разница, возможно, не в механизме, а в масштабе обобщения и в наличии физического опыта, который этот механизм питает. Модель обобщает текст. Человек обобщает весь сенсорный опыт жизни в физическом мире.
Однозначного ответа здесь нет — и это честная позиция, а не уклонение.
Всё описанное выше хорошо ощущается в прямом эксперименте. Дай модели задачу на границе её возможностей — логическую ловушку, вопрос со скрытым противоречием, что-нибудь требующее здравого смысла из физического мира.
В этом Telegram-боте [9] собраны топовые ИИ-модели бесплатно — можно сравнивать ответы разных моделей на один вопрос прямо в чате. Где справляется, а где ломается — увидишь сам. Это нагляднее любой теории.
Есть три позиции, которые стоит знать — не чтобы выбрать правильную, а чтобы понимать контекст дискуссии.
Китайская комната Сёрля. Философ Джон Сёрль предложил мысленный эксперимент: человек в комнате получает китайские иероглифы, находит по инструкции нужные ответные иероглифы и передаёт их обратно. Снаружи выглядит как понимание китайского. Внутри — механическое следование правилам без какого-либо понимания. По Сёрлю, языковые модели — именно такая комната. Контраргумент: а чем нейроны [10] мозга [11] принципиально отличаются от этой комнаты?
Embodied cognition. Ряд исследователей считает, что настоящее мышление невозможно без тела и физического взаимодействия с миром. Понятие «тяжёлый» формируется не из текстов про тяжесть, а из опыта поднятия предметов. Без этого — только символы без референции.
Функционализм. Противоположная позиция: важна не субстанция (нейроны или кремний), а функция. Если система решает задачи, строит выводы, адаптируется к новым данным — это и есть мышление, независимо от того, что внутри.
Наука [12] здесь не даёт приговора. Все три позиции живут рядом и продолжают спорить.
Хорошая новость: для практического использования ИИ ответ на вопрос «думает ли он по-настоящему» не нужен.
Нужно другое — понимать, где модель надёжна, а где нет. Она надёжна там, где задача хорошо представлена в текстовом пространстве: логика, код, анализ, объяснения. Она ненадёжна там, где нужен физический опыт, тонкий социальный контекст или подсчёт чего-то внутри токенов.
Знаешь границы — используешь эффективно. Не знаешь — удивляешься, почему блестящая модель не может посчитать буквы в слове.
Вопрос «может ли ИИ думать» — скорее всего, неправильный вопрос. Он предполагает, что мышление — это бинарное свойство: либо есть, либо нет. На практике это спектр.
Правильный вопрос звучит иначе: для каких задач поведение [13] языковой модели достаточно похоже на мышление, чтобы на него полагаться? И ответ зависит от задачи. Для одних — да, полностью. Для других — нет, и никакой апгрейд пока не помогает.
Автор: Lordneo
Источник [14]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/31516
URLs in this post:
[1] мышлением: http://www.braintools.ru/thinking
[2] Математика: http://www.braintools.ru/article/7620
[3] логика: http://www.braintools.ru/article/7640
[4] ошибки: http://www.braintools.ru/article/4192
[5] интуиция: http://www.braintools.ru/article/6929
[6] опытом: http://www.braintools.ru/article/6952
[7] Нейроны: http://www.braintools.ru/article/9161
[8] стимул: http://www.braintools.ru/article/5596
[9] этом Telegram-боте: https://t.me/ChatGPTAIAssistantBot
[10] нейроны: http://www.braintools.ru/article/6020
[11] мозга: http://www.braintools.ru/parts-of-the-brain
[12] Наука: http://www.braintools.ru/article/7634
[13] поведение: http://www.braintools.ru/article/9372
[14] Источник: https://habr.com/ru/articles/1045760/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1045760
Нажмите здесь для печати.