Авто-сжатие контекста

Автоматическое управление контекстом через LLM-сжатие

Что это

Авто-сжатие (auto-condense) — система управления контекстом, которая автоматически сжимает историю диалога, когда она приближается к лимиту контекстного окна модели.

Вместо того чтобы терять ранние сообщения, Skycode использует LLM для создания краткой сводки предыдущего контекста. Это позволяет вести длинные сессии без потери важной информации.

Как работает

Skycode отслеживает количество токенов в текущей сессии
Когда контекст приближается к порогу, срабатывает сжатие
LLM анализирует историю и создаёт компактную сводку: ключевые решения, изменённые файлы, текущее состояние задачи
Сводка заменяет старые сообщения — свежие сообщения остаются как есть

Когда включать

Длинные сессии — рефакторинг, миграция, серия связанных задач
Модели с маленьким контекстом — 8K–32K токенов
Сложные проекты — много файлов, частые переключения

Когда не нужно

Короткие задачи (1-2 сообщения)
Модели с большим контекстом (200K+) при небольших задачах

Настройка

Настройки → Контекст → Авто-сжатие

Порог срабатывания

Порог настраивается через шкалу контекстного окна в заголовке задачи. Нажмите на шкалу, чтобы установить маркер — когда использование контекста превысит эту отметку, произойдёт автоматическое сжатие.

Ручное сжатие

Помимо автоматического, вы можете вызвать сжатие вручную — AI использует инструмент condense для суммаризации текущего контекста в любой момент.