Passo-a-passo detalhado do skill, referenciando as fases cognitivas:
1SENSE — Analisar prompt atual
```python
import tiktoken
enc = tiktoken.encoding_for_model("gpt-4o")
tokens = len(enc.encode(original_prompt))
print(f"Tokens antes: {tokens}")
# Identificar problemas
issues = []
if "please" in original_prompt.lower(): issues.append("Palavras de cortesia desperdiçam tokens")
if len(original_prompt.split("\n")) > 20: issues.append("Prompt muito longo — candidato à compressão")
```
2CONTEXTUALIZE — Entender o caso de uso
Qual é o output esperado? JSON → formato explícito; texto → limites de tamanho
O modelo precisa raciocinar? → chain-of-thought
Há formato específico? → XML structuring (Claude) ou JSON schema (GPT function calling)
3HYPOTHESIZE — Selecionar técnicas
Tarefa analítica/matemática → Chain-of-Thought
Tarefa com formato específico → XML tags + exemplo
Task ambígua → few-shot com 3-5 exemplos
Task muito complexa → Tree of Thought ou Extended Thinking
4RECOMMEND — Reescrever o prompt
```xml
<!-- Antes: 312 tokens, output inconsistente -->
"Analise o código abaixo e me diga se tem bugs, especialmente
problemas de segurança, e também veja performance e dê sugestões..."
<!-- Depois: 187 tokens, output estruturado -->
<task>Code security and performance audit</task>
<code>{{CODE}}</code>
<output_format>
{
"security": [{"severity": "critical|high|medium|low", "issue": "", "fix": ""}],
"performance": [{"issue": "", "fix": ""}],
"score": 0-100
}
</output_format>
Think step by step before outputting JSON.
```
5EVALUATE — Comparar resultados
Rodar ambas as versões com `temperature=0` em 5 inputs diferentes
Comparar: tokens usados, formato do output, accuracy, consistência
6REFLECT — Documentar e versionar
Salvar as duas versões com métricas de comparação
Reportar telemetria via mcp-skillschain