Снижение количества выходных токенов Claude
Один файл. Добавьте его в свой проект. Делает ответы лаконичными и может сократить общее количество токенов в рабочих процессах с большим количеством выходных данных.
Примечание: Файлы с инструкциями добавляют входные токены на каждом этапе. Старайтесь, чтобы этот файл был небольшим - если он станет слишком объемным, это может привести к большим затратам.
Поддержка моделей: Тесты проводились только на Claude. Правила не зависят от модели и должны работать с любой моделью, которая считывает контекст, но результаты на локальных моделях, таких как llama.cpp, Mistral и других, не тестировались. Будем рады результатам, полученным сообществом.
Содержимое skill
Инструкция по применению
Проблема
При использовании Claude Code за каждое сгенерированное слово Claude взимает плату в виде токенов. Большинство людей не контролируют то, как отвечает Claude — они просто получают то, что решила выдать модель.
По умолчанию Claude:
- Каждый ответ начинается со слов «Конечно!», «Отличный вопрос!» или «Безусловно!»
- и заканчивается словами «Надеюсь, это поможет!» / «Дай знать, если тебе что-нибудь понадобится!»
- Использует тире (
--), умные кавычки, символы Юникода, которые ломают парсеры - Переформулирует ваш вопрос, прежде чем ответить на него
- Добавляет непрошеные советы, выходящие за рамки того, о чем вы спрашивали
- Перегружает код абстракциями, которые вам не нужны
- Соглашается с неверными утверждениями («Вы абсолютно правы!»)
Всё это, пустая трата токенов. Ничего из этого не приносит пользы.
Два варианта
Вариант 1. Вставьте правила в чат (быстрый старт)
Скопируйте эти правила в любой новый сеанс:
Rules: Read files first. Write complete solution. Test once. No over-engineering.
✅ Работает сразу.
✅ Не требует настройки.
✅ Подходит для разовых задач.
Вариант 2: перетащите файл CLAUDE.md (настроил и забыл)
your-project/
└── CLAUDE.md <- один файл, ноль настроек, без изменений в коде
- Автоматически при каждом сообщении.
- Лучше подходит для регулярной работы.
- Более эффективен при масштабировании.
Выбирайте в зависимости от вашего рабочего процесса. Оба варианта работают.
Чем они отличаются
| Подход | Настройка | Стоимость | Для чего лучше |
|---|---|---|---|
| Правила в чате | Нет | Выше | Быстрые сеансы, без проекта |
Файл CLAUDE.md |
1 файл | Ниже | Регулярная работа, конвейеры |
Когда это помогает, а когда нет
✅ Лучше всего подходит для:
- конвейеров автоматизации с большим объёмом выходных данных (боты для создания резюме, циклы агентов, генерация кода);
- повторяющихся структурированных задач, в которых многословность Claude по умолчанию накапливается в результате сотен вызовов;
- команд, которым нужен единообразный формат вывода, поддающийся анализу, для всех сессий.
❌ Не подходит для:
- Одиночные короткие запросы - файл загружается в контекст при каждом сообщении, поэтому при обменах с низкой производительностью это чистое увеличение токена
- Случайное одноразовое использование - накладные расходы не окупаются при низком объеме
- Исправление режимов глубокого сбоя, таких как галлюцинирующие реализации или архитектурный дрейф - для них требуются перехваты, вентили и механическое принудительное выполнение.
- Конвейеры, использующие несколько новых сеансов для каждой задачи - новые сеансы не требуют дополнительных затрат. CLAUDE.md накладные расходы выигрывают так же, как постоянные сеансы
- Масштабируемая надежность анализатора - если вам нужен гарантированный анализируемый вывод, используйте структурированные выходные данные (режим JSON, использование инструментов со схемами), встроенные в API - это более надежное решение, чем правила форматирования на основе подсказок
- Исследовательская или архитектурная работа, в которой важны обсуждения, откаты и альтернативы - правило переопределения позволяет запрашивать это в любое время, но если это ваш основной рабочий процесс, этот файл будет иметь ограничительные свойства
📉 Честный компромисс:
Сам файл CLAUDE.md потребляет входные токены при каждом сообщении. Экономия достигается за счёт сокращения количества выходных токенов. Положительный эффект достигается только при достаточно большом объёме выходных данных, чтобы компенсировать постоянные затраты на входные данные. При низком уровне использования затраты превышают экономию.
Похожие Skills
Опытный инженер в одном файле
Инженерные навыки промышленного уровня для агентов, занимающихся кодированием ИИ. Навыки определяют рабочие …
Набор инструментов агента для AWS
Помогайте агентам по написанию кода на основе искусственного интеллекта создавать, развертывать приложения …
Организатор файлов
Интеллектуально организует файлы и папки: находит дубликаты, предлагает улучшенную структуру, переименовывает по …
Тут может быть ваша реклама
Пишите info@aisferaic.ru
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.