7. ¿Qué es el Análisis y la Visualización de Datos?#
7.1. Análisis de Datos#
Fig. 7.1 Análisis de Datos#
Toma de Decisiones Basada en Datos
- Objetividad y Precisión: Permite tomar decisiones basadas en hechos y cifras en lugar de intuiciones o suposiciones, lo que aumenta la precisión y efectividad de las decisiones.
- Identificación de Tendencias y Patrones: Analizar grandes conjuntos de datos puede revelar tendencias y patrones que no son evidentes a simple vista, proporcionando insights valiosos para la planificación estratégica.
Ventaja Competitiva
- Optimización de Procesos: Las empresas pueden optimizar sus procesos operativos mediante la identificación de ineficiencias y la implementación de mejoras basadas en datos.
- Innovación: al identificar necesidades y preferencias del mercado puede conducir a la innovación en productos y servicios.
Mejora de la Experiencia del Cliente
- Personalización y Satisfacción: Permite ofrecer experiencias personalizadas y generar más satisfacción a los clientes mediante el análisis de sus comportamientos y preferencias.
Reducción de Costos
- Eficiencia Operativa: Identificar áreas donde se puede reducir el desperdicio y optimizar el uso de recursos.
- Prevención de Fraude: Implementar sistemas de detección de fraude basados en patrones anómalos en los datos transaccionales.
Predicción y Planificación
- Predicción de Demandas: Ayuda a predecir demandas futuras, permitiendo a las empresas gestionar mejor sus inventarios y recursos.
- Planificación Estratégica: Proveer insights para la planificación a largo plazo, ayudando a las empresas a anticiparse a las tendencias del mercado y preparar estrategias efectivas.
Cumplimiento Normativo y Gestión de Riesgos
- Cumplimiento Normativo: Asegura que las organizaciones cumplan con las normativas y regulaciones al monitorear y analizar continuamente los datos relevantes.
- Gestión de Riesgos: Identificar y mitigar riesgos potenciales mediante el análisis de datos históricos y la modelización de escenarios.
Ejemplos de uso en Educación
- Análisis de rendimiento académico: Analizar el rendimiento de los estudiantes para identificar brechas, problemas y adaptar decisiones para la mejora, por ejemplo, diseñar métodos de enseñanza más efectivos.
- Predicción del Desempeño: Identificar estudiantes en riesgo y tomar medidas proactivas para mejorar su rendimiento académico y evitar situaciones de repitencia.
7.2. Visualización#
¿Por qué es importante la visualización?
7.2.1. Tipos de Datos#
Datos Categóricos
Gráfico de Barras: Ideal para comparar cantidades entre diferentes categorías.
Gráfico de Pastel: Útil para mostrar proporciones dentro de un todo, aunque puede ser menos efectivo que los gráficos de barras si hay muchas categorías.
Gráfico de Columnas: Similar al gráfico de barras pero con orientación vertical, adecuado para mostrar cambios a lo largo del tiempo si hay muchas categorías.
Datos Numéricos
Histograma: Adecuado para mostrar la distribución de un conjunto de datos numéricos.
Gráfico de Líneas: Ideal para mostrar tendencias a lo largo del tiempo.
Diagrama de Dispersión: Bueno para mostrar la relación entre dos variables numéricas.
Datos Temporales
Gráfico de Líneas: Perfecto para mostrar cómo cambian los datos a lo largo del tiempo.
Gráfico de Áreas: Útil para mostrar cambios acumulativos a lo largo del tiempo.
Datos de Relación
Diagrama de Dispersión: Útil para mostrar la relación entre dos variables.
Gráfico de Burbuja: Extiende el diagrama de dispersión añadiendo una tercera variable a través del tamaño de la burbuja.
7.2.2. Propósito del Análisis#
Comparación
Gráfico de Barras: Excelente para comparar diferentes categorías.
Gráfico de Líneas: Bueno para comparar tendencias a lo largo del tiempo.
Distribución
Histograma: Ideal para mostrar la distribución de un conjunto de datos.
Gráfico de Violín: Combina aspectos de un box plot y un kernel density plot para mostrar la distribución y probabilidad.
Relación
Diagrama de Dispersión: Bueno para ver la relación entre dos variables.
Mapa de Calor: Útil para mostrar la intensidad de las relaciones entre variables.
Composición
Gráfico de Pastel: Bueno para mostrar la composición de un todo.
Gráfico de Áreas Apiladas: Muestra cómo las partes de un todo cambian con el tiempo.
Revisa estos link para visualizar gráficos
¿Cómo elegir el gráfico correcto para visualizar datos abiertos?
7.3. Librerías#
¿Qué es una librería en Python?
Nombre |
Categoría |
Descripción |
|---|---|---|
math |
Matemáticas |
Provee funciones matemáticas, incluyendo trigonometría y logaritmos |
datatime |
fecha y hora |
Tiene funciones que permiten manipular fechas y horas |
os |
Sistema operativo |
Proporciona una forma portátil de utilizar funciones dependientes del sistema operativo, como leer o escribir archivos. |
sys |
Sistema específico |
Permite que los programas Python manipulen partes del entorno de ejecución, como los argumentos de la línea de comandos o el estado de salida. |
Random |
Valor Aleatorio |
Genera números pseudoaleatorios, permite la selección aleatoria de elementos, permutaciones aleatorias y más. |
re |
Expresiones Regulares |
Proporciona funciones para trabajar con expresiones regulares para potentes técnicas de manipulación de cadenas. |
urlib |
Módulos de manejos de URL |
Obtiene URL y proporciona funcionalidad para analizar URL y cambiar entre rutas absolutas y relativas. |
Bokeh |
Visualización |
visualización interactiva para Python que permite crear gráficos y widgets en línea. |
Plotly |
Visualización |
Crear visualizaciones de datos de tipo interactivo y en 3D, en línea. |