gpt.

gpt.

Гайды Anthropic для Fable 5 и Opus 4.8 советуют противоположное, у OpenAI — третий путь. Что менять в промптах

Гайды Anthropic для Fable 5 и Opus 4.8 дают противоположные советы по одним и тем же темам. Opus спавнит мало субагентов — его надо подталкивать; Fable делегирует охотно — его надо ограничивать. Для Opus стартовый effort — xhigh, для Fable — high.Оба вендора официально сошлись в главном: новая модель — переписывай промпт. OpenAI: «treat GPT-5.5 as a new model family to tune for, not a drop-in replacement». Anthropic: скиллы для прежних моделей «слишком прескриптивны» для Fable 5 и снижают качество.OpenAI выносит управление поведением в параметры API (reasoning_effort, verbosity, phase), Anthropic — в текст промпта

продолжить чтение

Стягивай куда нужно: Activation Steering Tutorial

Привет, друзья! Если вы по запросу "как сделать модель добрее" видите в output-е LLM фразу "рулевое управление" — значит LLM говорит про Steering. В этом туториале вы:узнаете, что такое steering и на чем он основан;осуществите steering, используя pytorch-hooks;познакомитесь с библиотеками nnsight и pyvene для interventions;И если какое-то слово из bullet-ов было непонятно, они все станут вам понятны к концу.

продолжить чтение

Что такое контекстное окно и почему модели забывают

Ты час разговариваешь с ChatGPT. Даёшь контекст, объясняешь задачу, уточняешь детали. А потом модель вдруг начинает противоречить тому, что говорила раньше. Забывает имя персонажа которое ты указал в самом начале. Спрашивает то, о чём вы уже договорились.Первая реакция - что-то сломалось. Но это не баг. Это фундаментальное ограничение архитектуры, у которого есть название и объяснение.Модель не помнит - она читаетГлавное заблуждение про языковые модели - что у них есть память. Что где-то внутри хранится история ваших разговоров, и модель к ней обращается.Это не так.

продолжить чтение

Эксперимент: может ли группа LLM отбирать стартапы лучше человека?

Оценивая текущую повестку вокруг ИИ, многие резонно замечают парадокс. Шума много, ботов ещё больше, а сгенерированных картинок и красивых концептов — бесконечный поток. Мы даже видим волны увольнений из-за повальной оптимизации, но где осязаемые результаты? Где то самое «пощупать»? Настоящая эффективность, которую можно поставить на стол перед скептиком и сказать: смотрите, вот оно работает. Без идеализации, но с пониманием реального потенциала.Безусловно, у технологии есть мощные стороны. Я сам о них писал (раз

продолжить чтение

Может ли ИИ думать? Разбираем вопрос без философии

Этот вопрос обычно заканчивается одинаково: кто-то произносит слово «сознание», дальше начинается философский спор, и через двадцать минут все расходятся ни с чем. Мы пойдём другим путём.Никакого Декарта, никакого Тьюринга, никаких рассуждений о душе. Только конкретный вопрос: что именно умеет и не умеет делать языковая модель — и насколько это похоже на то, что мы в быту называем мышлением.Что мы вообще называем «думать»

продолжить чтение

Один промпт разросся в регламент: как я разделяю ответственность внутри AI-навыка

У меня был рабочий AI-навык для инженерных задач. Сначала он выглядел как обычная инструкция: роль, задача, формат ответа и несколько ограничений. Этого хватало, пока сценарии были короткими: посмотреть фрагмент кода, подсказать план, разобрать очевидную ошибку.Потом навык начал получать задачи сложнее. Например: “посмотри PR перед merge”. В такой фразе много скрытой работы. Нужно понять, что меняется, какие есть ограничения, где может быть риск, чем подтверждён вывод, какие замечания действительно блокируют принятие изменений, а какие остаются пожеланиями.

продолжить чтение

Генерируем фотореалистичные изображения

Привет, меня зовут Николай Разумовский, я дизайнер в команде цифровой трансформации Ареал. Как дизайнер я регулярно сталкиваюсь с задачей: нужно быстро получить уникальные изображения для интернет-магазинов, корпоративных сайтов, лендингов и презентаций. Если опираться только на стоки, процесс затягивается, а визуально проекты становятся похожими друг на друга.Генерация через нейросети решает сразу несколько задач:Скорость. Вместо нескольких часов поиска на стоках — несколько минут на генерацию.

продолжить чтение

Режим thinking у ИИ: что на самом деле происходит, когда модель «думает»

Когда нажимаешь кнопку Thinking и видишь, как модель несколько секунд «размышляет» перед ответом — легко решить, что она просто старается сильнее. Работает усерднее. Думает глубже. Может, перебирает больше вариантов из какой-то внутренней базы знаний.Это не так. Thinking-режим — это принципиально другой способ генерации текста, не просто «обычный режим с усилием». И понять разницу полезно не для общего развития, а чтобы знать, когда его включать, когда он даёт реальное преимущество — а когда только тратит твоё время и ресурсы.Как работает обычная генерация — и в чём её фундаментальная ловушка

продолжить чтение

За кулисами нейросетей: полный цикл тренировки языкового ИИ

Ты уже пользуешься языковыми моделями — спрашиваешь, генерируешь, отлаживаешь код. Но откуда берётся сама способность отвечать? Не «где хранятся данные», а именно — как из случайно инициализированной матрицы чисел вырастает нечто, способное объяснить теорему Гёделя, написать резюме или найти баг в чужом коде?Ответ не в магии и не в «огромной базе данных». Под капотом — три последовательных этапа обучения. Каждый решает строго свою задачу, и без предыдущего следующий просто невозможен. Разберём каждый по очереди.Этап первый: предобучение — строим фундамент

продолжить чтение

Что происходит внутри LLM, когда ты отправляешь сообщение

Ты пишешь вопрос и нажимаешь Enter. Через секунду начинают появляться слова. Кажется, будто кто-то думает и печатает. Но внутри не происходит ничего похожего на мышление — зато происходит кое-что куда более странное и интересное.Главное заблуждениеБольшинство людей представляют языковую модель как умную базу данных: спросил — она нашла ответ и выдала. Это не так.LLM — это машина, которая предсказывает следующий токен. Всё. Из этой одной простой задачи, повторённой миллиарды раз на триллионах слов текста, вырастает нечто, которое умеет объяснять квантовую физику, писать код и иногда убедительно врать.

продолжить чтение

123456...1020...27