7. ¿Qué es el Análisis y la Visualización de Datos?#

7.1. Análisis de Datos#

datos

Fig. 7.1 Análisis de Datos#

La analítica de datos es una disciplina fundamental en la actualidad, impulsando la toma de decisiones informadas y estratégicas en una variedad de campos. Algunas razones por las cuales la analítica de datos es tan importante:

Toma de Decisiones Basada en Datos

  • Objetividad y Precisión: Permite tomar decisiones basadas en hechos y cifras en lugar de intuiciones o suposiciones, lo que aumenta la precisión y efectividad de las decisiones.
  • Identificación de Tendencias y Patrones: Analizar grandes conjuntos de datos puede revelar tendencias y patrones que no son evidentes a simple vista, proporcionando insights valiosos para la planificación estratégica.

Ventaja Competitiva

  • Optimización de Procesos: Las empresas pueden optimizar sus procesos operativos mediante la identificación de ineficiencias y la implementación de mejoras basadas en datos.
  • Innovación: al identificar necesidades y preferencias del mercado puede conducir a la innovación en productos y servicios.

Mejora de la Experiencia del Cliente

  • Personalización y Satisfacción: Permite ofrecer experiencias personalizadas y generar más satisfacción a los clientes mediante el análisis de sus comportamientos y preferencias.

Reducción de Costos

  • Eficiencia Operativa: Identificar áreas donde se puede reducir el desperdicio y optimizar el uso de recursos.
  • Prevención de Fraude: Implementar sistemas de detección de fraude basados en patrones anómalos en los datos transaccionales.

Predicción y Planificación

  • Predicción de Demandas: Ayuda a predecir demandas futuras, permitiendo a las empresas gestionar mejor sus inventarios y recursos.
  • Planificación Estratégica: Proveer insights para la planificación a largo plazo, ayudando a las empresas a anticiparse a las tendencias del mercado y preparar estrategias efectivas.

Cumplimiento Normativo y Gestión de Riesgos

  • Cumplimiento Normativo: Asegura que las organizaciones cumplan con las normativas y regulaciones al monitorear y analizar continuamente los datos relevantes.
  • Gestión de Riesgos: Identificar y mitigar riesgos potenciales mediante el análisis de datos históricos y la modelización de escenarios.

Ejemplos de uso en Educación

  • Análisis de rendimiento académico: Analizar el rendimiento de los estudiantes para identificar brechas, problemas y adaptar decisiones para la mejora, por ejemplo, diseñar métodos de enseñanza más efectivos.
  • Predicción del Desempeño: Identificar estudiantes en riesgo y tomar medidas proactivas para mejorar su rendimiento académico y evitar situaciones de repitencia.

7.2. Visualización#

¿Por qué es importante la visualización?

Un aspecto importante al trabajar con Datos es no solo el análisis sino su visualización. Por lo mismo, es muy importante saber elegir el o los gráficos adecuados para dar cuenta del análisis realizado y de la información que se desea dar a conocer
Elegir el mejor gráfico para visualizar datos depende de varios factores, entre ellos los tipos de datos que uno posees, el mensaje que deseotransmitir y la audiencia a la que me dirigo. Aquí hay algunas consideraciones para tomar la mejor decisión:
grafico

Fig. 7.2 Tipos de Gráficos Fuente#

7.2.1. Tipos de Datos#

Datos Categóricos

  • Gráfico de Barras: Ideal para comparar cantidades entre diferentes categorías.

  • Gráfico de Pastel: Útil para mostrar proporciones dentro de un todo, aunque puede ser menos efectivo que los gráficos de barras si hay muchas categorías.

  • Gráfico de Columnas: Similar al gráfico de barras pero con orientación vertical, adecuado para mostrar cambios a lo largo del tiempo si hay muchas categorías.

Datos Numéricos

  • Histograma: Adecuado para mostrar la distribución de un conjunto de datos numéricos.

  • Gráfico de Líneas: Ideal para mostrar tendencias a lo largo del tiempo.

  • Diagrama de Dispersión: Bueno para mostrar la relación entre dos variables numéricas.

Datos Temporales

  • Gráfico de Líneas: Perfecto para mostrar cómo cambian los datos a lo largo del tiempo.

  • Gráfico de Áreas: Útil para mostrar cambios acumulativos a lo largo del tiempo.

Datos de Relación

  • Diagrama de Dispersión: Útil para mostrar la relación entre dos variables.

  • Gráfico de Burbuja: Extiende el diagrama de dispersión añadiendo una tercera variable a través del tamaño de la burbuja.

7.2.2. Propósito del Análisis#

Comparación

  • Gráfico de Barras: Excelente para comparar diferentes categorías.

  • Gráfico de Líneas: Bueno para comparar tendencias a lo largo del tiempo.

Distribución

  • Histograma: Ideal para mostrar la distribución de un conjunto de datos.

  • Gráfico de Violín: Combina aspectos de un box plot y un kernel density plot para mostrar la distribución y probabilidad.

Relación

  • Diagrama de Dispersión: Bueno para ver la relación entre dos variables.

  • Mapa de Calor: Útil para mostrar la intensidad de las relaciones entre variables.

Composición

  • Gráfico de Pastel: Bueno para mostrar la composición de un todo.

  • Gráfico de Áreas Apiladas: Muestra cómo las partes de un todo cambian con el tiempo.

7.3. Librerías#

¿Qué es una librería en Python?

Una librería en Python es un conjunto de funciones y herramientas predefinidas que se pueden utilizar para realizar tareas específicas sin necesidad de escribir el código desde cero. Estas librerías están diseñadas para ser reutilizables y facilitar el desarrollo de aplicaciones al proporcionar funciones y métodos que abordan problemas comunes.
Table 7.1 Algunas Librerías de Python#

Nombre

Categoría

Descripción

math

Matemáticas

Provee funciones matemáticas, incluyendo trigonometría y logaritmos

datatime

fecha y hora

Tiene funciones que permiten manipular fechas y horas

os

Sistema operativo

Proporciona una forma portátil de utilizar funciones dependientes del sistema operativo, como leer o escribir archivos.

sys

Sistema específico

Permite que los programas Python manipulen partes del entorno de ejecución, como los argumentos de la línea de comandos o el estado de salida.

Random

Valor Aleatorio

Genera números pseudoaleatorios, permite la selección aleatoria de elementos, permutaciones aleatorias y más.

re

Expresiones Regulares

Proporciona funciones para trabajar con expresiones regulares para potentes técnicas de manipulación de cadenas.

urlib

Módulos de manejos de URL

Obtiene URL y proporciona funcionalidad para analizar URL y cambiar entre rutas absolutas y relativas.

Bokeh

Visualización

visualización interactiva para Python que permite crear gráficos y widgets en línea.

Plotly

Visualización

Crear visualizaciones de datos de tipo interactivo y en 3D, en línea.