Antes de escribir una línea de código, hago estos 9 pasos
Checklist de 9 pasos para tu primer día con un dataset nuevo
Para el analista que quiere dejar de improvisar cada vez que abre un archivo nuevo.
Antes de escribir una sola línea de código
1. Identifica la fuente y la frecuencia de actualización
¿Quién publica estos datos? ¿Cada cuánto se actualizan? Si no hay fecha de última actualización, desconfía.
2. Revisa el formato y método de acceso
¿CSV, JSON, API, portal web? ¿Necesitas autenticación? Descarga una muestra antes de automatizar nada.
3. Cuenta registros y columnas
¿Cuántas filas? ¿Cuántos campos? ¿Cabe en memoria o necesitas procesamiento por lotes?
Conoce la estructura
4. Documenta el esquema campo por campo
Nombre, tipo de dato, descripción, ejemplo. Marca los campos que no entiendes — son los que te van a morder después.
5. Mide la cobertura de cada campo
¿Qué porcentaje de valores son nulos o vacíos? Un campo con 80% nulos probablemente no sirve para tu análisis.
6. Busca los valores únicos en campos clave
Categorías, estados, tipos — ¿cuántos hay? ¿Tienen sentido? Detecta inconsistencias temprano (ej: “CDMX”, “Ciudad de México”, “cdmx”).
Evalúa la utilidad
7. Identifica la granularidad temporal y geográfica
¿Datos diarios, mensuales, anuales? ¿Por municipio, estado, país? La granularidad define qué preguntas puedes responder.
8. Cruza con lo que ya tienes
¿Hay campos compatibles con otros datasets que uses? Las llaves de cruce (INEGI, CLAVE_ENT, RFC) multiplican el valor.
9. Escribe un párrafo de “para qué sirve esto”
Si no puedes explicar en 3 oraciones qué harías con este dataset, todavía no lo conoces lo suficiente.
Esto mismo, pero automático
El Dataset Profiler es un skill gratuito para OpenClaw y Claude Desktop que hace estos 9 pasos por ti. Le das un dataset — CSV, API, portal de datos abiertos — y te regresa un perfil completo: esquema, cobertura, valores únicos, y documentación lista para usar.
Instálalo gratis:
La checklist funciona igual de bien a mano. O mejor: envíale este post a tu agente favorito y dile que cree un skill con estos 9 pasos. Así la próxima vez que abras un dataset, él hace el trabajo.
De tacosdedatos — herramientas para analistas con más ideas que tiempo.



