почему LLM галлюцинирует.

Больше контекста — хуже результат

почему AI-агенты деградируют на длинных сессиях и при чём тут CoTПосле статьи про Cursor и сжатие контекста я получил много комментариев. В коментах спорят: виноват компактинг? Или attention dilution? Или модель просто ослушалась? Или проблема вообще не в контексте, а в alignment?Спор хороший, но он показывает фундаментальную проблему: у инженеров нет общей картины того, как LLM работают с контекстом. Мы видим симптомы (агент удалил базу, модель галлюцинирует, точность падает на длинной сессии), но не понимаем механизмы.Попробуем собрать эту картинкуDisclaimer

продолжить чтение