Referencia rápida de Office Hours · v02 · mayo 2026 EN·ES

Optimización de prompts y tokens en GitHub Copilot

Por qué importa.

Con la facturación por uso, los tokens de entrada, salida y caché se contabilizan contra tu pool de AI credits. Los tokens de salida cuestan cerca de 5x más que los de entrada. La mayoría de la entrada no es lo que escribes: son instrucciones, pestañas abiertas, esquemas de herramientas e historial de chat que se replay en cada turno.

1. Las 12 prácticas con mayor ROI

Limita la salida

Agrega Code only, no explanation. Bullets over paragraphs. a las instrucciones del repo. Efecto: 40-70% menos tokens de salida en tareas de código. Setup: 1 min.

Reduce el contexto siempre activo

Comprime copilot-instructions.md y AGENTS.md a solo las minas. Borra el boilerplate generado que el agente puede redescubrir. Efecto: 40-60% menos tokens de instrucciones en cada llamada. Setup: 15 min.

Acota el contexto con `applyTo:`

Divide un archivo grande de instrucciones en archivos más pequeños y acotados que solo cargan para rutas o tipos de archivo que coinciden. Efecto: 50-80% menos carga acotada cuando el archivo no aplica. Setup: 15 min.

Ask Mode para preguntas simples

Reserva Agent Mode para trabajo realmente de varios pasos. Elige Ask Mode para Q&A de un solo turno. Efecto: 60-90% menos consumo de tokens vs loops de agente. Setup: 0 min.

Usa la selección de modelo Auto

Por defecto, Auto. Fija un modelo de mayor categoría solo cuando la tarea lo amerite. Efecto: tasa facturada más baja en el uso elegible. Setup: 0 min.

Audita los servidores MCP

Desactiva los MCP que no usas activamente. Cada esquema de herramienta puede costar tokens por paso de agente. Efecto: 5K-190K tokens menos por tarea de agente. Setup: 5 min.

Prefiere Skills sobre MCPs siempre activos

Los Skills cargan solo título y descripción hasta que se invocan. Los esquemas de herramientas MCP se cargan en el contexto del agente. Efecto: contexto en estado estable mucho más bajo. Setup: 10 min.

Usa CLI para trabajo determinista

Para flujos repetibles de navegador, archivos o comandos, encadena comandos CLI en vez de razonamiento de agente de varios turnos. Efecto: menos round-trips al LLM y menos replay de esquemas de herramientas.

Sé preciso en los prompts

Add a null check to getUser() and return 404 le gana a can you maybe handle errors here? Efecto: mejor primer intento, menos turnos de seguimiento. Setup: 0 min.

Ajusta los prompts por modelo

Las guías de prompting del vendor varían por modelo y versión. Pídele a Copilot que adapte tus instrucciones al modelo que estés usando. Efecto: reduce el rework por mala salida en el primer intento. Setup: 10 min por modelo.

Corre `/chronicle improve`

Córrelo semanalmente en Copilot CLI o VS Code para escanear sesiones recientes en busca de confusiones recurrentes y generar parches de instrucciones. Efecto: 10K-30K tokens ahorrados por patrón recurrente. Setup: 2 min.

Abre sesiones nuevas seguido

El historial se replay en cada turno. Cuando cambia el tema, abre un chat nuevo. Efecto: elimina el costo de entrada arrastrado. Setup: 0 min.

Las cifras están acotadas al mecanismo de cada fila y no son acumulativas.

2. El contexto lo es todo: cinco superficies de contexto

Superficie	Archivo	Cuándo se carga	Mejor para
Instrucciones de repo	`copilot-instructions.md`, `AGENTS.md`	Siempre, en cada request	README de IA del proyecto
Instrucciones personalizadas	`*.instructions.md`	Por patrón de archivo con `applyTo:`	Reglas específicas por archivo
Prompts	`*.prompt.md`	Cuando se invocan	Plantillas de tareas
Agents	`*.agent.md`	Cuando se mencionan	Personas especializadas
Skills	`SKILL.md`	Automáticamente, cuando son relevantes	Conocimiento especializado

Regla del costo.

Mientras más a la derecha esté la superficie de contexto, más se carga por demanda y más bajo es el costo de tokens en estado estable. Empuja todo lo que puedas de las instrucciones de repo siempre activas hacia Skills y prompts bajo demanda.

3. MCP vs Skills vs CLI

Herramienta	Mejor para	Cómo se carga	Tradeoff
MCP	APIs remotas, SaaS, bases de datos, integraciones cross-platform	Metadatos de herramientas cargados en el contexto del agente	Auth y gobernanza fuertes, pero cada llamada a una tool puede volverse otro turno de LLM
Skills	Flujos repetibles, conocimiento de la organización, orquestación	Carga progresiva: primero título y descripción, contenido completo al invocar	Legible para humanos y menor contexto en estado estable
CLI	Dev local, velocidad, bajo costo, operaciones deterministas y componibles	Cero sobrecarga de esquema	Ideal para pipes de shell y comandos en batch; gobierna con cuidado a escala

La regla del roundtrip.

Cada llamada a una MCP o a una tool puede ser un turno separado del LLM, donde se vuelven a enviar el system prompt, el historial de chat y los esquemas de herramientas cargados. Un comando CLI puede encadenar varias operaciones en una sola línea y devolver un resultado filtrado. Para trabajo determinista, prefiere CLI. Ve por MCP cuando necesitas protocolo tipado, auth, sandboxing o APIs remotas.

4. A dónde se van los tokens en realidad

Fuente	¿Se envía siempre?	Palanca
`.github/copilot-instructions.md`	Cada turno	Comprimir
`AGENTS.md`	Cada paso de agente	Comprimir
Pestañas y selección abiertas	A menudo	Cerrar las que no uses
Historial de chat	Crece con el tiempo	Empezar de cero
Esquemas de herramientas MCP	Por paso de agente	Auditar o convertir a Skill o CLI
Metadata de Skill	Solo nombre y descripción	Prefiere Skills donde aplique
Salida de comando CLI	Solo lo que devuelves	Filtra antes de devolver con `\| head` o `\| jq`
Salida del modelo	Se factura a tasa más alta que la entrada	Limita la salida

5. Selección de modo

Tarea	Mejor modo	Por qué
Explica esta función	Ask	Un solo turno, no necesita tools
Refactoriza el archivo X	Edit / Inline	Alcance acotado, menos tools
Implementa una feature en tres archivos y corre las pruebas	Agent	Genuinamente multi-step
Pipeline reproducible de navegador o archivos	CLI	Determinista, sin round-trip del LLM por paso
Confusión recurrente en sesiones anteriores	`/chronicle improve`	Parcha las instrucciones de forma permanente

6. Anti-patrones

Instrucciones infladas

Costo: se paga cada turno. Fix: quita el relleno y deja solo las minas.

Todo MCP activado por si acaso

Costo: gran sobrecarga inicial y por tarea. Fix: desactiva hasta que se necesite o convierte a Skill/CLI.

MCP para trabajo que un pipe de shell resuelve

Costo: un turno de LLM por paso. Fix: usa un comando CLI encadenado.

Agent para una explicación simple

Costo: 5-10x de sobrecarga. Fix: usa Ask.

Un mega-hilo por días

Costo: replay lineal del historial. Fix: chat nuevo por tema.

Prompts verbosos y modelos premium pineados

Costo: más entrada, más salida y tasa facturada más alta. Fix: imperativos directos y Auto por defecto.

7. Checklist de setup en cinco minutos

Agrega Code only, no explanation. Bullets over paragraphs. Be terse. a las instrucciones del repo.

Borra el boilerplate generado de copilot-instructions.md y AGENTS.md.

Abre el panel de MCP y desactiva los servidores que no usas.

Mueve los flujos repetidos de MCP o instrucciones a un Skill.

Pon la selección de modelo en Auto.

Marca /chronicle improve para uso semanal.

Cierra las pestañas del editor que no estés usando activamente.

Lecturas adicionales

Docs de GitHub: Copilot

Docs de GitHub: Sobre la facturación de Copilot

Docs de GitHub: Personalizando respuestas de Copilot Chat

Precios públicos de Anthropic, para ejemplos de asimetría de precios input/output.

Recurso práctico; para la guía oficial, revisa la documentación de GitHub Copilot y la documentación de facturación de GitHub.

Descargar PDF (inglés) Volver a la guía