Авто-сжатие контекста
Автоматическое управление контекстом через LLM-сжатие
Что это
Авто-сжатие (auto-condense) — система управления контекстом, которая автоматически сжимает историю диалога, когда она приближается к лимиту контекстного окна модели.
Вместо того чтобы терять ранние сообщения, Skycode использует LLM для создания краткой сводки предыдущего контекста. Это позволяет вести длинные сессии без потери важной информации.
Как работает
- Skycode отслеживает количество токенов в текущей сессии
- Когда контекст приближается к порогу, срабатывает сжатие
- LLM анализирует историю и создаёт компактную сводку: ключевые решения, изменённые файлы, текущее состояние задачи
- Сводка заменяет старые сообщения — свежие сообщения остаются как есть
Когда включать
- Длинные сессии — рефакторинг, миграция, серия связанных задач
- Модели с маленьким контекстом — 8K–32K токенов
- Сложные проекты — много файлов, частые переключения
Когда не нужно
- Короткие задачи (1-2 сообщения)
- Модели с большим контекстом (200K+) при небольших задачах
Настройка
Настройки → Контекст → Авто-сжатие
Порог срабатывания
Порог настраивается через шкалу контекстного окна в заголовке задачи. Нажмите на шкалу, чтобы установить маркер — когда использование контекста превысит эту отметку, произойдёт автоматическое сжатие.
Ручное сжатие
Помимо автоматического, вы можете вызвать сжатие вручную — AI использует инструмент condense для суммаризации текущего контекста в любой момент.