| Análisis Exploratorio de Datos (EDA) |
Trabajo de un detective forense en la escena de un crimen. |
Búsqueda de patrones visuales, huellas ocultas y comprensión de la historia de los datos antes de aplicar fórmulas. |
Descubrimiento de que las galaxias forman filamentos como una telaraña cósmica en lugar de estar distribuidas al azar. |
Una tabla gris de miles de números frente a un gráfico de dispersión que revela una espiral oculta. |
| Histograma |
La Ciudad de los Datos (skyline de edificios). |
Muestra la distribución y frecuencia de los datos mediante el uso de "cajones" (bins) o intervalos de igual tamaño. |
Análisis del valor de las piezas de ajedrez, donde la abundancia de peones de valor 1 genera un sesgo a la derecha. |
Montañas de datos donde la altura representa la frecuencia; puede presentarse de forma simétrica, sesgada o bimodal. |
| Boxplot (Diagrama de Caja y Bigotes) |
El esqueleto de la información (donde la piel es el histograma). |
Resume la arquitectura de los datos mediante 5 números: Mínimo, Q1, Mediana (Q2), Q3 y Máximo. |
Comparación de la consistencia de niveles entre dos grupos de estudio independientes (ej. Libros vs. Computadoras). |
Una caja que representa el 50% central de los datos; una caja delgada indica similitud y una ancha indica dispersión o caos. |
| Outliers |
Señales extrañas o una jugada maestra que rompe la regla. |
Datos que se ubican fuera de la estructura habitual; puntos aislados que pueden indicar errores o grandes descubrimientos. |
En astronomía, la señal de una civilización lejana; en ajedrez, una jugada que tomó un tiempo de ejecución inusual. |
Puntos que quedan representados de forma aislada o "flotando" por fuera de los bigotes del boxplot. |
| Diagrama de Área Polar |
Un gráfico que "grita" para convencer y salvar vidas. |
El área de las secciones circulares muestra la magnitud de un fenómeno; diseñado para generar un impacto visual inmediato. |
Florence Nightingale demostrando que los soldados morían más por falta de higiene que por heridas de guerra. |
Gráfico circular donde el tamaño de las áreas de color destaca visualmente la causa predominante de mortalidad. |