Optimización de prompts y tokens en GitHub Copilot
Con la facturación por uso, los tokens de entrada, salida y caché se contabilizan contra tu pool de AI credits. Los tokens de salida cuestan cerca de 5x más que los de entrada. La mayoría de la entrada no es lo que escribes: son instrucciones, pestañas abiertas, esquemas de herramientas e historial de chat que se replay en cada turno.
1. Las 12 prácticas con mayor ROI
Limita la salida
Agrega Code only, no explanation. Bullets over paragraphs. a las instrucciones del repo.
Reduce el contexto siempre activo
Comprime copilot-instructions.md y AGENTS.md a solo las minas. Borra el boilerplate generado que el agente puede redescubrir.
Acota el contexto con applyTo:
Divide un archivo grande de instrucciones en archivos más pequeños y acotados que solo cargan para rutas o tipos de archivo que coinciden.
Ask Mode para preguntas simples
Reserva Agent Mode para trabajo realmente de varios pasos. Elige Ask Mode para Q&A de un solo turno.
Usa la selección de modelo Auto
Por defecto, Auto. Fija un modelo de mayor categoría solo cuando la tarea lo amerite.
Audita los servidores MCP
Desactiva los MCP que no usas activamente. Cada esquema de herramienta puede costar tokens por paso de agente.
Prefiere Skills sobre MCPs siempre activos
Los Skills cargan solo título y descripción hasta que se invocan. Los esquemas de herramientas MCP se cargan en el contexto del agente.
Usa CLI para trabajo determinista
Para flujos repetibles de navegador, archivos o comandos, encadena comandos CLI en vez de razonamiento de agente de varios turnos.
Sé preciso en los prompts
Add a null check to getUser() and return 404 le gana a can you maybe handle errors here?
Ajusta los prompts por modelo
Las guías de prompting del vendor varían por modelo y versión. Pídele a Copilot que adapte tus instrucciones al modelo que estés usando.
Corre /chronicle improve
Córrelo semanalmente en Copilot CLI o VS Code para escanear sesiones recientes en busca de confusiones recurrentes y generar parches de instrucciones.
Abre sesiones nuevas seguido
El historial se replay en cada turno. Cuando cambia el tema, abre un chat nuevo.
2. El contexto lo es todo: cinco superficies de contexto
| Superficie | Archivo | Cuándo se carga | Mejor para |
|---|---|---|---|
| Instrucciones de repo | copilot-instructions.md, AGENTS.md | Siempre, en cada request | README de IA del proyecto |
| Instrucciones personalizadas | *.instructions.md | Por patrón de archivo con applyTo: | Reglas específicas por archivo |
| Prompts | *.prompt.md | Cuando se invocan | Plantillas de tareas |
| Agents | *.agent.md | Cuando se mencionan | Personas especializadas |
| Skills | SKILL.md | Automáticamente, cuando son relevantes | Conocimiento especializado |
Mientras más a la derecha esté la superficie de contexto, más se carga por demanda y más bajo es el costo de tokens en estado estable. Empuja todo lo que puedas de las instrucciones de repo siempre activas hacia Skills y prompts bajo demanda.
3. MCP vs Skills vs CLI
| Herramienta | Mejor para | Cómo se carga | Tradeoff |
|---|---|---|---|
| MCP | APIs remotas, SaaS, bases de datos, integraciones cross-platform | Metadatos de herramientas cargados en el contexto del agente | Auth y gobernanza fuertes, pero cada llamada a una tool puede volverse otro turno de LLM |
| Skills | Flujos repetibles, conocimiento de la organización, orquestación | Carga progresiva: primero título y descripción, contenido completo al invocar | Legible para humanos y menor contexto en estado estable |
| CLI | Dev local, velocidad, bajo costo, operaciones deterministas y componibles | Cero sobrecarga de esquema | Ideal para pipes de shell y comandos en batch; gobierna con cuidado a escala |
Cada llamada a una MCP o a una tool puede ser un turno separado del LLM, donde se vuelven a enviar el system prompt, el historial de chat y los esquemas de herramientas cargados. Un comando CLI puede encadenar varias operaciones en una sola línea y devolver un resultado filtrado. Para trabajo determinista, prefiere CLI. Ve por MCP cuando necesitas protocolo tipado, auth, sandboxing o APIs remotas.
4. A dónde se van los tokens en realidad
| Fuente | ¿Se envía siempre? | Palanca |
|---|---|---|
.github/copilot-instructions.md | Cada turno | Comprimir |
AGENTS.md | Cada paso de agente | Comprimir |
| Pestañas y selección abiertas | A menudo | Cerrar las que no uses |
| Historial de chat | Crece con el tiempo | Empezar de cero |
| Esquemas de herramientas MCP | Por paso de agente | Auditar o convertir a Skill o CLI |
| Metadata de Skill | Solo nombre y descripción | Prefiere Skills donde aplique |
| Salida de comando CLI | Solo lo que devuelves | Filtra antes de devolver con | head o | jq |
| Salida del modelo | Se factura a tasa más alta que la entrada | Limita la salida |
5. Selección de modo
| Tarea | Mejor modo | Por qué |
|---|---|---|
| Explica esta función | Ask | Un solo turno, no necesita tools |
| Refactoriza el archivo X | Edit / Inline | Alcance acotado, menos tools |
| Implementa una feature en tres archivos y corre las pruebas | Agent | Genuinamente multi-step |
| Pipeline reproducible de navegador o archivos | CLI | Determinista, sin round-trip del LLM por paso |
| Confusión recurrente en sesiones anteriores | /chronicle improve | Parcha las instrucciones de forma permanente |
6. Anti-patrones
Instrucciones infladas
Costo: se paga cada turno. Fix: quita el relleno y deja solo las minas.
Todo MCP activado por si acaso
Costo: gran sobrecarga inicial y por tarea. Fix: desactiva hasta que se necesite o convierte a Skill/CLI.
MCP para trabajo que un pipe de shell resuelve
Costo: un turno de LLM por paso. Fix: usa un comando CLI encadenado.
Agent para una explicación simple
Costo: 5-10x de sobrecarga. Fix: usa Ask.
Un mega-hilo por días
Costo: replay lineal del historial. Fix: chat nuevo por tema.
Prompts verbosos y modelos premium pineados
Costo: más entrada, más salida y tasa facturada más alta. Fix: imperativos directos y Auto por defecto.
7. Checklist de setup en cinco minutos
Agrega Code only, no explanation. Bullets over paragraphs. Be terse. a las instrucciones del repo.
Borra el boilerplate generado de copilot-instructions.md y AGENTS.md.
Abre el panel de MCP y desactiva los servidores que no usas.
Mueve los flujos repetidos de MCP o instrucciones a un Skill.
Pon la selección de modelo en Auto.
Marca /chronicle improve para uso semanal.
Cierra las pestañas del editor que no estés usando activamente.
Lecturas adicionales
Precios públicos de Anthropic, para ejemplos de asimetría de precios input/output.
Recurso práctico; para la guía oficial, revisa la documentación de GitHub Copilot y la documentación de facturación de GitHub.