В левом углу ринга — дерзкий новичок Gemini 3.5, о котором сейчас трубят из каждого утюга. В правом — тяжеловесы-ветераны: GPT-5 и Claude 4.5. Задача: не просто поболтать, а сгенерировать прорывную концепцию использования генеративного ИИ для блога «Чувство управления». Результат схватки (и ��собенно судейства) вас удивит.
Закинул старик невод в синее море… Ну, вы знаете эту классику. Я собрал четырех участников: Gemini 3.5 Pro, GPT-5, Gemini 2.5 Pro (для массовки и сравнения прогресса) и Claude 4.5.
Акт 1. Первый невод (ожидаемо) — с тиной морской
Сначала я пошел простым путем. Попросил их проанализировать мои прошлые статьи и предложить перспективные небанальные темы для новых серий. Результат? Как под копирку: «Автоматизируйте рутину», «Внедряйте промпт-инжиниринг». Скучно, банально, «вода». Для уровня материалов, которые мы разбираем на chu.st (архитектура организаций будущего, стратегии трансформации), это был детский сад.
Стало понятно: чтобы проверить реальную мощь Gemini 3.5 и остальных, нужно ставить задачу иначе. Не «придумай что-нибудь», а «думай как гений».
Акт 2. Создаем крепкий невод-алгоритм для ловли золотых рыбок
Я решил заставить их попотеть. Во втором раунде я выдал сложный промпт с алгоритмом (публикую сокращенный сутевой вариант):
[list:{“items”:[“Сам выбери 5 лучших методик креативности, подходящих под задачу («перспективные небанальные темы»).”,”Оцени их и оставь 3 самые подходящие для этой задачи методики.”,”Примени их и выдай список разных и неочевидных тем статей.”,”Придумай формулу оценки перспективности и проранжируй темы.”],”type”:”OL”}]
И тут случилась магия единодушия. Я не ограничивал их в выборе инструментов. Но все четыре модели, не сговариваясь, выбрали ТРИЗ (Теорию решения изобретательских задач) как один из главных инструментов. Видимо, даже ИИ понимает: чтобы придумать что-то новое, нужно искать системные противоречия по Альтшуллеру, а не просто галлюцинировать. Также в фавориты попали First Principles Thinking (мышление от первых принципов) и Design Thinking (дизайн-мышление).
В итоге каждый участник выдал различные интересные концепции: от «Одноразового софта» до «Психоанализа корпораций». Но кто из них оказался реально крут?
Акт 3. Кто захотел стать владычицей морской?
Я собрал от каждой из четырех моделей топ-3 идеи (всего – 12 идей), поместил в один промпт и скормил обратно всем четырем моделям с задачей: «Оцените всех конкурентов и себя по 10-балльной шкале и выберите ТОП-3 идеи». Свои идеи модели могли узнать из контекста диалога — остальные были обезличены.
И тут вскрылись интересные психологические портреты моделей:
Claude 4.5: Оказалась самой нарцистичной. Она поставила две свои идеи на 1 и 2 места с высочайшими баллами. «Сам себя не похвалишь — никто не похвалит».
Gemini 3.5: Проявила удивительную объективность (или скромность). В её личном рейтинге победила чужая идея (от того самого Claude). Свои идеи она оценила высоко, но корону владычицы на себя надевать не стала.
GPT-5: Легкая предвзятость. Выбрала победителем свою идею, но с минимальным отрывом от конкурентов.
Финал: Три самые золотые рыбки-идеи
Усреднив оценки всех четырех «судей» и убрав предвзятость, мы получили абсолютных чемпионов. Если вы ищете тему для стартапа — забирайте.
🥇 1 место: Градиенты агентности (Gradients of Agency)
Автор: Claude 4.5 | Средний балл: 8.95
Суть: Мы привыкли думать об ИИ как о переключателе «Вкл/Выкл» (человек делает VS робот делает). Победившая концепция предлагает рассматривать агентность как спектр. Почему это круто: Это новая онтология ответственности. Как в беспилотниках есть уровни L1-L5, так и в бизнесе должна появиться жесткая шкала: какие решения на каком уровне «градиента» можно делегировать. Это снимает главный страх бизнеса — потерю контроля.
🥈 2 место: Реверсивная автономия (Reversible Autonomy)
Автор: GPT-5 | Средний балл: 8.38
Суть: Инженерный ответ на страх перед ИИ. Мы строим системы, где любое действие ИИ-агента гарантированно обратимо. Почему это круто: Бизнес боится дать агенту доступ к базе данных («а вдруг удалит?»). Концепция предлагает архитектуру, где у каждого действия есть «Undo» и строгий аудит. Внедряем агентов не когда они поумнеют, а когда цена их ошибки станет нулевой.
🥉 3 место: ИИ как Экзокортекс (или «Корпоративный мицелий»)
Автор: Gemini 2.5 / 3.5 | Средний балл: 8.29
Суть: Использовать LLM не для генерации контента, а для диагностики компании. Почему это круто: Если «скормить» модели все переписки и документы, она увидит то, что скрыто от CEO: реальные центры влияния, «тромбы» в коммуникациях и разрыв между ценностями на стене и в курилке. Это МРТ для бизнеса.
Вывод: Так силен ли Gemini 3.5?
Эксперимент показал интересную расстановку сил:
По качеству мышления: Новичок Gemini 3.5 показала себя достойно, выдав крепкие визионерские идеи, но в жесткой схватке уступила пальму первенства Claude 4.5, чьи идеи оказались глубже проработаны философски.
По адекватности: Gemini 3.5 оказалась самым честным судьей, не побоявшись признать победу соперника.
ИИ-модели переросли стадию «птиц-говорунов, отличающихся умом и сообразительностью». Если дать им правильную методологию (пусть выберут сами!), они способны выдавать концепции уровня стратегического консалтинга.
А какая из трех тем-победителей вам понравилась? Пишите в комментариях 👇
P.S. Самые вкусные разборы этих тем и практические гайды по внедрению я публикую в своем телеграм-канале. Подписывайтесь, чтобы не остатся у разбитого корыта в эпоху генеративного ИИ.
Автор: Slidering


