Referencia rápida de Office Hours · v02 · mayo 2026 EN·ES

Optimización de prompts y tokens en GitHub Copilot

Por qué importa.

Con la facturación por uso, los tokens de entrada, salida y caché se contabilizan contra tu pool de AI credits. Los tokens de salida cuestan cerca de 5x más que los de entrada. La mayoría de la entrada no es lo que escribes: son instrucciones, pestañas abiertas, esquemas de herramientas e historial de chat que se replay en cada turno.

1. Las 12 prácticas con mayor ROI

1

Limita la salida

Agrega Code only, no explanation. Bullets over paragraphs. a las instrucciones del repo. Efecto: 40-70% menos tokens de salida en tareas de código. Setup: 1 min.

2

Reduce el contexto siempre activo

Comprime copilot-instructions.md y AGENTS.md a solo las minas. Borra el boilerplate generado que el agente puede redescubrir. Efecto: 40-60% menos tokens de instrucciones en cada llamada. Setup: 15 min.

3

Acota el contexto con applyTo:

Divide un archivo grande de instrucciones en archivos más pequeños y acotados que solo cargan para rutas o tipos de archivo que coinciden. Efecto: 50-80% menos carga acotada cuando el archivo no aplica. Setup: 15 min.

4

Ask Mode para preguntas simples

Reserva Agent Mode para trabajo realmente de varios pasos. Elige Ask Mode para Q&A de un solo turno. Efecto: 60-90% menos consumo de tokens vs loops de agente. Setup: 0 min.

5

Usa la selección de modelo Auto

Por defecto, Auto. Fija un modelo de mayor categoría solo cuando la tarea lo amerite. Efecto: tasa facturada más baja en el uso elegible. Setup: 0 min.

6

Audita los servidores MCP

Desactiva los MCP que no usas activamente. Cada esquema de herramienta puede costar tokens por paso de agente. Efecto: 5K-190K tokens menos por tarea de agente. Setup: 5 min.

7

Prefiere Skills sobre MCPs siempre activos

Los Skills cargan solo título y descripción hasta que se invocan. Los esquemas de herramientas MCP se cargan en el contexto del agente. Efecto: contexto en estado estable mucho más bajo. Setup: 10 min.

8

Usa CLI para trabajo determinista

Para flujos repetibles de navegador, archivos o comandos, encadena comandos CLI en vez de razonamiento de agente de varios turnos. Efecto: menos round-trips al LLM y menos replay de esquemas de herramientas.

9

Sé preciso en los prompts

Add a null check to getUser() and return 404 le gana a can you maybe handle errors here? Efecto: mejor primer intento, menos turnos de seguimiento. Setup: 0 min.

10

Ajusta los prompts por modelo

Las guías de prompting del vendor varían por modelo y versión. Pídele a Copilot que adapte tus instrucciones al modelo que estés usando. Efecto: reduce el rework por mala salida en el primer intento. Setup: 10 min por modelo.

11

Corre /chronicle improve

Córrelo semanalmente en Copilot CLI o VS Code para escanear sesiones recientes en busca de confusiones recurrentes y generar parches de instrucciones. Efecto: 10K-30K tokens ahorrados por patrón recurrente. Setup: 2 min.

12

Abre sesiones nuevas seguido

El historial se replay en cada turno. Cuando cambia el tema, abre un chat nuevo. Efecto: elimina el costo de entrada arrastrado. Setup: 0 min.

Las cifras están acotadas al mecanismo de cada fila y no son acumulativas.

2. El contexto lo es todo: cinco superficies de contexto

SuperficieArchivoCuándo se cargaMejor para
Instrucciones de repocopilot-instructions.md, AGENTS.mdSiempre, en cada requestREADME de IA del proyecto
Instrucciones personalizadas*.instructions.mdPor patrón de archivo con applyTo:Reglas específicas por archivo
Prompts*.prompt.mdCuando se invocanPlantillas de tareas
Agents*.agent.mdCuando se mencionanPersonas especializadas
SkillsSKILL.mdAutomáticamente, cuando son relevantesConocimiento especializado
Regla del costo.

Mientras más a la derecha esté la superficie de contexto, más se carga por demanda y más bajo es el costo de tokens en estado estable. Empuja todo lo que puedas de las instrucciones de repo siempre activas hacia Skills y prompts bajo demanda.

3. MCP vs Skills vs CLI

HerramientaMejor paraCómo se cargaTradeoff
MCPAPIs remotas, SaaS, bases de datos, integraciones cross-platformMetadatos de herramientas cargados en el contexto del agenteAuth y gobernanza fuertes, pero cada llamada a una tool puede volverse otro turno de LLM
SkillsFlujos repetibles, conocimiento de la organización, orquestaciónCarga progresiva: primero título y descripción, contenido completo al invocarLegible para humanos y menor contexto en estado estable
CLIDev local, velocidad, bajo costo, operaciones deterministas y componiblesCero sobrecarga de esquemaIdeal para pipes de shell y comandos en batch; gobierna con cuidado a escala
La regla del roundtrip.

Cada llamada a una MCP o a una tool puede ser un turno separado del LLM, donde se vuelven a enviar el system prompt, el historial de chat y los esquemas de herramientas cargados. Un comando CLI puede encadenar varias operaciones en una sola línea y devolver un resultado filtrado. Para trabajo determinista, prefiere CLI. Ve por MCP cuando necesitas protocolo tipado, auth, sandboxing o APIs remotas.

4. A dónde se van los tokens en realidad

Fuente¿Se envía siempre?Palanca
.github/copilot-instructions.mdCada turnoComprimir
AGENTS.mdCada paso de agenteComprimir
Pestañas y selección abiertasA menudoCerrar las que no uses
Historial de chatCrece con el tiempoEmpezar de cero
Esquemas de herramientas MCPPor paso de agenteAuditar o convertir a Skill o CLI
Metadata de SkillSolo nombre y descripciónPrefiere Skills donde aplique
Salida de comando CLISolo lo que devuelvesFiltra antes de devolver con | head o | jq
Salida del modeloSe factura a tasa más alta que la entradaLimita la salida

5. Selección de modo

TareaMejor modoPor qué
Explica esta funciónAskUn solo turno, no necesita tools
Refactoriza el archivo XEdit / InlineAlcance acotado, menos tools
Implementa una feature en tres archivos y corre las pruebasAgentGenuinamente multi-step
Pipeline reproducible de navegador o archivosCLIDeterminista, sin round-trip del LLM por paso
Confusión recurrente en sesiones anteriores/chronicle improveParcha las instrucciones de forma permanente

6. Anti-patrones

!

Instrucciones infladas

Costo: se paga cada turno. Fix: quita el relleno y deja solo las minas.

!

Todo MCP activado por si acaso

Costo: gran sobrecarga inicial y por tarea. Fix: desactiva hasta que se necesite o convierte a Skill/CLI.

!

MCP para trabajo que un pipe de shell resuelve

Costo: un turno de LLM por paso. Fix: usa un comando CLI encadenado.

!

Agent para una explicación simple

Costo: 5-10x de sobrecarga. Fix: usa Ask.

!

Un mega-hilo por días

Costo: replay lineal del historial. Fix: chat nuevo por tema.

!

Prompts verbosos y modelos premium pineados

Costo: más entrada, más salida y tasa facturada más alta. Fix: imperativos directos y Auto por defecto.

7. Checklist de setup en cinco minutos

1

Agrega Code only, no explanation. Bullets over paragraphs. Be terse. a las instrucciones del repo.

2

Borra el boilerplate generado de copilot-instructions.md y AGENTS.md.

3

Abre el panel de MCP y desactiva los servidores que no usas.

4

Mueve los flujos repetidos de MCP o instrucciones a un Skill.

5

Pon la selección de modelo en Auto.

6

Marca /chronicle improve para uso semanal.

7

Cierra las pestañas del editor que no estés usando activamente.

Lecturas adicionales

Recurso práctico; para la guía oficial, revisa la documentación de GitHub Copilot y la documentación de facturación de GitHub.