Facturación por uso

Sácale más a cada interacción de Copilot

La meta no es "usar menos Copilot". La meta es desperdiciar menos en cada interacción. Una guía práctica para prompts más limpios, contexto más liviano, respuestas más cortas y agentes del tamaño adecuado.

Modelo mental

Qué impulsa el consumo

El costo y la latencia no dependen solo de lo que escribes. Contextos grandes, respuestas largas, el modelo que elijas y los pasos repetidos del agente también pesan.

01

Entrada del prompt

Las palabras, archivos, logs e instrucciones que mandas a la interacción.

02

Salida del modelo

La respuesta en sí: explicaciones repetidas, código y resúmenes.

03

Sobrecarga de contexto

Pestañas abiertas, instrucciones persistentes, historial del chat, contexto generado y memoria.

04

Sobrecarga de herramientas

Planeación del agente, esquemas de herramientas, lecturas intermedias, reintentos y catálogos de MCP.

Los presupuestos topan el gasto. Los hábitos reducen el desperdicio.

La facturación por uso pone en evidencia que los chats largos, los agentes amplios, la elección de modelo y las respuestas extensas son los que mueven el costo.

Flujo del taller

De pedidos vagos a defaults reusables

Úsalo para apretar las interacciones de Copilot una a una: empieza por la tarea, baja el ruido y conserva los hábitos que aceleran el siguiente loop.

0-5

Facturación por uso y por qué importa la calidad del flujo de trabajo.

5-15

Ganancias rápidas que puedes aplicar hoy.

15-25

Patrones de prompts que reducen el trabajo de búsqueda.

25-35

Higiene de contexto: instrucciones, pestañas, historial y archivos generados.

35-52

Sobrecarga de salida, agente, modelo y MCP/herramientas.

52-60

Mide el impacto, fija defaults de equipo y decide qué se queda.

Defaults

Ganancias rápidas que puedes aplicar hoy

Arranca con defaults que cambien la forma de cada interacción sin pedirle a los devs que se vuelvan expertos en facturación.

01

Respuestas al grano

Fija un default tipo: código primero, explicación mínima salvo que la pidan, bullets antes que párrafos.

solo código máx 3 bullets sin resumen
02

Escoge el flujo más pequeño

Usa Ask para preguntas acotadas, Edit cuando ya sabes el archivo destino, y Agent solo cuando la autonomía valga la pena.

Ask Edit Agent
03

Auto por defecto

Deja flotar la selección de modelo, salvo que tengas una razón concreta para fijar uno premium o subir el esfuerzo.

Auto base elige a propósito
Default de equipo:

Responde con la respuesta útil más pequeña. Si toca código, arranca con código.

Patrón de prompting

La receta del prompt apretado

Los buenos prompts reducen el espacio de búsqueda. Le dicen a Copilot dónde mirar, qué cambiar, qué restricciones importan y qué forma debe tener la salida.

Objetivo

Archivo, función, componente, issue, test que falla o flujo exacto.

Cambio

Qué tiene que estar distinto cuando termine el trabajo.

Restricciones

Tests, estilo, casos límite, APIs, requisitos de seguridad y límites.

Salida

Diff, solo código, tabla compacta, JSON o un porqué breve.

Antes

¿Puedes arreglar este bug de login?

Después

En src/auth/session.ts, encuentra por qué los refresh tokens vencidos siguen pasando. Cambia solo la lógica de validación, agrega un test de regresión y muéstrame el diff.

Manejo de contexto

El contexto es el costo oculto más grande

El contexto siempre activo se siente útil hasta que pesa en cada turno. La solución no es cero contexto. La solución es contexto con alcance definido.

Conserva

+

Riesgos no obvios, comandos obligatorios y precauciones de seguridad.

+

Convenciones fáciles de romper y caras de redescubrir.

+

Guías con alcance por ruta para API, UI, tests, migraciones o áreas específicas de plataforma.

Borra o muévelo a bajo demanda

-

Datos visibles en el código, docs duplicados, boilerplate generado y consejos de herramientas desactualizados.

-

Pestañas del editor que no aplican, historial viejo del chat, logs sin recortar y archivos de vendor.

-

Checklists de PR, notas de migración y playbooks que solo importan para una tarea. Mueve el trabajo repetible a prompts o Skills.

20-23%

Más tokens con archivos de contexto generados en los escenarios probados.

-2%

Cambio promedio de correctitud en los resultados citados de AGENTBENCH.

1.6x

Anclaje a una herramienta cuando el contexto nombra una específica.

Superficie de contexto Cuándo se carga Úsala para Hábito de costo
Instrucciones del repo
copilot-instructions.md, AGENTS.md
Siempre Minas escondidas, comandos obligatorios, restricciones de todo el proyecto. Mantenlas cortas. Borra relleno y boilerplate generado.
Instrucciones con alcance
*.instructions.md
Cuando coinciden los patrones de archivo Reglas para APIs, UI, tests, migraciones o tipos de archivo. Usa applyTo: para que las reglas carguen solo donde aplican.
Prompts y agentes
*.prompt.md, *.agent.md
Cuando se invocan Tareas repetibles y flujos basados en roles. Saca del contexto siempre activo los playbooks que casi no usas.
Skills
SKILL.md
Primero nombre y descripción, contenido completo bajo demanda Flujos especializados, conocimiento de la organización y orquestación de herramientas. Prefiere Skills antes que instrucciones siempre activas o servidores MCP sin usar.
Agente y herramientas

Mantén corta la cadena

Cada herramienta habilitada trae nombre, descripción y esquema de parámetros. En modo agente, ese catálogo se puede repetir muchas veces en una sola tarea.

Regla práctica

1

Define el resultado y la condición de parada antes de salir a explorar a lo amplio.

2

Habilita solo los servidores y herramientas que la tarea necesita.

3

Prefiere Skills para flujos repetibles que no necesitan cargar todo el esquema cada turno.

4

Usa comandos CLI para trabajo determinístico: grep, jq, gh, npm, tests y flujos repetibles de Playwright.

5

Agrupa lecturas acotadas en lugar de ir y volver varias veces.

servidores
x herramientas/servidor
x tokens de esquema
x pasos del agente
= sobrecarga

setup pesado:
15 servidores, 187 herramientas
265K tokens de sobrecarga

setup enfocado:
3 servidores, 50 herramientas
75K tokens de sobrecarga
Uso Ideal para Forma de tokens Cuidado con
MCP APIs remotas, herramientas SaaS, bases de datos, autenticación e integraciones aisladas. El metadata de las herramientas está disponible para el modelo durante los turnos del agente. Cada llamada a una herramienta puede convertirse en otro turno completo del LLM, con historial y esquemas repetidos.
Skills Flujos repetibles, estándares de equipo y playbooks especializados. Metadata liviano primero, instrucciones completas al invocar. Mantén las descripciones claras para que Copilot elija el Skill correcto en el momento correcto.
CLI Trabajo local determinístico, operaciones encadenadas en shell, builds, tests y filtros. No carga esquema de herramientas. El modelo solo ve el comando y la salida. Filtra la salida antes de devolverla: | head, | jq, comandos de test puntuales.
Hooks Acciones determinísticas después de un evento conocido del ciclo de vida: tests, formato, deploys, gates. Cero costo de LLM. El hook es ejecución de shell; el modelo no se vuelve a invocar. Spam de hooks por triggers muy amplios. Filtra por nombre de herramienta y ruta de archivo, y fija una config conocida (Preview).
Automatización del ciclo de vida

Hooks: ejecución sin costo

Los Skills deciden. Los Hooks ejecutan. Cuando un flujo tiene un paso determinístico tipo "si X, siempre Y", los hooks te dejan sacar las llamadas al LLM del loop. Mira cómo se comparan los hooks con MCP, Skills y CLI, o la referencia oficial de hooks.

En Preview.

Los Hooks están en Preview. El formato de configuración y los eventos pueden cambiar. Fija una config conocida y revisa los docs antes de moverlo a producción amplia.

Eventos comunes de hooks

PostToolUse

Después de que termina una herramienta

Corre tests, formatea código, genera artefactos o dispara despliegues sin otro turno del LLM.

SessionStart

Empieza una nueva sesión

Carga el contexto del proyecto, busca secrets o valida el entorno antes del primer prompt.

PreToolUse

Antes de que corra una herramienta

Bloquea comandos peligrosos, exige aprobaciones o reescribe la entrada antes de ejecutar.

Cómo funciona el ahorro

# solo skills: cadena de LLM en cada corrida
petición del usuario
  ↓ el Skill analiza      tokens
  ↓ el LLM decide         tokens
  ↓ el Skill ejecuta      tokens
# skills + hooks: LLM solo la primera vez
petición del usuario
  ↓ el Skill analiza      tokens (una vez)
  ↓ escribe decision.json

el hook detecta la escritura
  ↓ corre el script         cero tokens
  ↓ corridas siguientes     cero tokens

Configuración

Los hooks se definen en archivos .github/hooks/*.json:

{
  "hooks": {
    "PostToolUse": [
      {
        "type": "command",
        "command": "./scripts/process-output.sh",
        "timeout": 30,
        "cwd": "."
      }
    ]
  }
}

Reglas prácticas

01

Skills escriben datos estructurados

Emite summary.json, config.yaml o un archivo de decisión que el hook pueda leer.

02

Hooks miran los triggers

Filtra PostToolUse por nombre de herramienta y ruta de archivo para que el hook dispare cuando importa.

03

Mantén los hooks determinísticos

Sin llamadas al LLM dentro del script. Shell, build, lint, deploy: ahí está el valor.

04

Filtra el spam de hooks

Por defecto dispara con cualquier uso de herramienta. Acótalo por evento, ruta y condiciones de salida.

Cuidado con

!

Spam de hooks. PostToolUse dispara después de cada uso de herramienta. Filtra por nombre y ruta.

!

Restricciones del agente en la nube. Solo Bash, red restringida, filesystem efímero.

!

Estado Preview. El formato y los eventos pueden cambiar. Fija una config conocida.

!

Fallas silenciosas. Pon logs (echo "Hook fired" >> /tmp/hook.log).

!

Límites de timeout. 30 segundos por defecto. Súbelo si la tarea es larga.

Árbol de decisión
  1. ¿Necesita criterio del LLM? → Skill
  2. ¿Siempre es lo mismo después de un trigger? → Hook
  3. ¿Es un comando puntual de shell? → CLI
  4. ¿Necesita auth a servicios externos? → MCP
Capa de equipo y admin

Topa el gasto, después mejora los hábitos

Los hábitos de prompting mejoran la eficiencia, pero los controles de admin son los que hacen cumplir el presupuesto. Ambos importan cuando el uso ya es visible.

Presupuestos

Configura alertas temprano

Define presupuestos de AI credits a nivel empresa, centro de costo y usuario. Revisa el uso cuando las líneas base se estabilicen.

Política de modelo

Aprueba a propósito

Revisa el acceso a modelos premium por flujo, equipo y necesidad medible, en vez de dejar modelos caros fijados por defecto.

Loop de revisión

Mide lo que cambia

Lleva métricas de menos turnos, respuestas por defecto más cortas, menos pasos del agente por tarea y loops de revisión más rápidos.

Los 3 básicos

Hazlo hoy

Escoge dos o tres defaults, pruébalos en varios repos y editores, y quédate con los flujos que mueven la aguja.

01

Defaults al grano

Código primero. Explicación mínima salvo que la pidan. Bullets antes que párrafos.

02

Poda el contexto

Conserva solo las instrucciones que evitan errores caros.

03

Dimensiona el modo

Ask para trabajo de un paso. Agent para multi-paso con condiciones claras de parada.

Mismos resultados, menos tokens, loops más rápidos.

Trae prompts, archivos de contexto y flujos de agente. Aprétalos en vivo y luego convierte los mejores patrones en defaults de equipo.

Recurso

Checklist de interacción con Copilot

Dos materiales complementarios más un recorrido corto del flujo oficial de billing preview de Copilot.

Material del checklist

Usa el PDF como compañía de la presentación, material del taller o recurso de onboarding. Incluye el checklist táctico más las revisiones de billing y admin del artículo compañero.

Referencia de prompts y tokens

Una guía rápida y práctica de Copilot con prompts, checklists y patrones curados por la comunidad para usarlo mejor todos los días.

Video del recorrido del usage report

Mira el flujo de subir el CSV: descarga el reporte, abre el billing preview, y revisa las pestañas de overview, usuarios, modelos, productos, organizaciones y centros de costo.

Optimización de tokens, en profundidad

Guía complementaria de Marco Olivo, capítulo por capítulo. Profundiza en control de output, costo de MCP y tools, y hábitos de equipo. Útil cuando la checklist se queda corta.