контекст.

Сравниваем LLM: 11 тестов для Opus 4.8, GPT 5.5 и Gemini 3.1 Pro

Меньше месяца назад Anthropic выпустила модель Claude Opus 4.8. Как обычно, заявили много новых плюшек, вроде улучшенного кодинга и режима Fast Mode. Нам это показалось отличным поводом, чтобы устроить ее сравнение с двумя другими тяжеловесами рынка от Google и OpenAI.

продолжить чтение

Контекстное окно: почему нейросеть забывает части разговора

Представьте, что вы разговариваете с невероятно умным и эрудированным собеседником. Только очень странным. Несмотря на весь свой интеллект и тысячи фактов, которые он непринужденно рассказывает, он не может ничего запомнить. Ваш диалог с ним каждый раз как бы начинается заново. Вы даете ему вводные, задаете вопросы, что-то уточняете, а он, на основе всего этого, выдает ответ.

продолжить чтение

Что такое контекстное окно и почему модели забывают

Ты час разговариваешь с ChatGPT. Даёшь контекст, объясняешь задачу, уточняешь детали. А потом модель вдруг начинает противоречить тому, что говорила раньше. Забывает имя персонажа которое ты указал в самом начале. Спрашивает то, о чём вы уже договорились.Первая реакция - что-то сломалось. Но это не баг. Это фундаментальное ограничение архитектуры, у которого есть название и объяснение.Модель не помнит - она читаетГлавное заблуждение про языковые модели - что у них есть память. Что где-то внутри хранится история ваших разговоров, и модель к ней обращается.Это не так.

продолжить чтение

Экономный ИИ. 12 способов снизить расходы (токенов-на токены)

Наверное, всем уже очевидно, что ИИ крайне полезен, мир поменялся, нас всех заменят роботы и вообще ИИ уже нас во всём превзошёл :)Всё так или почти так, "но есть одно но" как поётся в одной известной песне. ИИ стоит денег, и весьма немалых при текущих ценах. А про локальные модели для большинства пользователей и компаний в РФ можно забыть. Ну и в целом кажется локальные модели - это не сценарий ИИ будущего.

продолжить чтение

Пишем Java-скрипт, который собирает проект в один файл для контекста в чат DeepSeek или другие LLM

У нейросетей есть ограничение на количество символов в чате или на число запросов. И бывает так, что лимит уже закончился, а разработка проекта — нет. Тогда приходится открывать новый чат и заново напоминать контекст: что за проект, какая структура, какие файлы важны, где уже были изменения. Обычно это сводится к ручному копированию кода, а это долго и неудобно. Отдельная проблема — DeepSeek не всегда понимает ссылки на репозиторий и не смотрит код по ним так, как хотелось бы. Зато если дать ему сам контекст кода текстом, он включает его в анализ. Идея

продолжить чтение

Опус от Claude Opus «Рефлексия о промпт-инжиниринге»

Дисклеймер: Я тут вел очень долгие изыскания на тему бизнес-консалтинга, и параллельно с этим регулярно просил разбирать наши с Opus-ом диалоги. На определенном этапе нам удалось собрать некоторые наблюдения, навыки, которые, он подметил в моей практике, и пройдясь поиском в интернете, мы не нашли их в явном виде, а некоторые мысли вовсе. Далее текст написал моделью Claude Opus от первого лица. Я не редактировал его, однако готов в комментариях пояснить и рассказать, как тот или иной подход я использую в своей работе. Что я понял о работе со мной, пока меня вели через долгий разговор

продолжить чтение

Контент-модерация в ретроспективе: почему тексты 100-летней давности не проходят фильтры 2026 года

Дисклеймер: Статья не даёт правовой оценки историческим деятелям и событиям. Цель — показать, как изменились юридические и платформенные нормы в отношении публичных призывов. Все цитаты из архивных источников приведены исключительно в исследовательских целях.Дано: задача для ML-инженераПредставьте, вы обучаете большую языковую модель. В корпус данных попадает Полное собрание сочинений крупного политического автора начала XX века.Что будет, если модель начнёт генерировать текст в его стиле без пост-фильтров?

продолжить чтение

Кто сегодня разрабатывает с ИИ?

Два года назад, чтобы написать веб-приложение, нужно было знать язык программирования, фреймворк, базу данных, уметь деплоить и дебажить. Сегодня достаточно уметь сформулировать задачу.ИИ радикально снизил порог входа в разработку. Это не гипотеза – это статистика:63% пользователей, практикующих вайбкодинг, идентифицируют себя как не-разработчики (Second Talent, 2026)Gartner прогнозирует, что к 2026 году «citizen developers» превысят число профессиональных разработчиков 4:1 (VentureBeat/Gartner)

продолжить чтение

Контекст – ветер перемен, сдувающий капитализацию облачных решений и рабочие места

Недавно я натолкнулся на статью технологического аналитика Эвана Армстронга Context is King. Аргументы, изложенные в ней, по мнению моих знакомых экспертов отрасли, звучат весомо, логично и даже пророчески. Поэтому перспективы изменений в повседневной работе и процессах компаний в ближайшем будущем для одних выглядят многообещающими, а для других — тревожными.Прогнозы о том, что дальнейшее развитие искусственного интеллекта может как цунами смыть с рынка труда десятки миллионов рабочих мест, уже не кажутся фантастикой — скорее, это новая, неизбежная реальность.

продолжить чтение

Как показать модели пальцем, что важно

Вы наверняка замечали: один и тот же вопрос в ChatGPT или Claude иногда даёт отличный ответ, иногда – качество ответа не соответствует ожиданиям. Многие списывают это на «непредсказуемость AI». На самом деле у этого есть и структурная причина.В апреле 2025 года Anthropic публиковали официальную документацию по промпт-инжинирингу для Claude 4.6 – Prompting Best Practices. Это технический документ для разработчиков API. Массовому пользователю читать его не предполагается.Однако, там есть пара инсайтов, которые работают и буду полезны всем.Как модель «смотрит» на текст

продолжить чтение

123