Jueves, Agosto 18, 2022

Python : ¿Porqué el API llamado 'Lux 'podría realizar un análisis de datos exploratorios automatizados?

python_api

¿Quieres automatizar el análisis de datos en tus proyectos? LUX es una API que produce un análisis de datos eficiente y rápido. Échale un vistazo.

El análisis exploratorio de datos es el proceso de comprender los datos a fondo para las características clave y comprender estadísticamente la importancia de cada característica. Como su nombre indica, el análisis exploratorio de datos ayuda a explorar los datos estadísticamente y a formular ciertas hipótesis según sea necesario. En general, el análisis de datos exploratorios se considera una tarea tediosa y aquí es donde LUX está allanando el camino al automatizar todo el análisis de datos exploratorios en un solo paso. Entonces, en este artículo, veamos cómo usar la API de Python LUX para realizar análisis de datos exploratorios.

La necesidad de automatizar EDA

El análisis exploratorio de datos es un proceso de análisis de los conjuntos de datos para resumir la importancia estadística importante de las características y visualizar la distribución de cada característica a través de imágenes adecuadas. Pero visualizar cada una de las características es una tarea tediosa cuando hay muchas características en el conjunto de datos, ya que verificar la correlación de cada una de las características sería un proceso largo. Así que aquí es donde el proceso de automatización de EDA juega un papel vital en la reducción del tiempo total dedicado al análisis de datos y el tiempo dedicado a la selección de características óptimas y también al análisis de valores atípicos.

Aquí es donde surge la necesidad de automatizar el proceso de análisis de datos exploratorios y la automatización del análisis de datos exploratorios es compatible con varias bibliotecas de Python y API como LUX, SweetViz, AutoViz y muchos más entran en juego. En este artículo, exploremos cómo usar la API LUX de Python para automatizar el procedimiento de análisis exploratorio de datos.

Automatización de EDA usando LUX

LUX es una API de Python simple que ayuda en la exploración de datos rápida y fácil al proporcionar gráficos fácilmente interpretables con solo leer el marco de datos en el entorno de trabajo activado por LUX. Las visualizaciones se producen en un widget interactivo con varias pestañas de funciones para deslizarse y comprender las características de los datos.

Algunos de los widgets estándar compatibles con el módulo LUX son los siguientes.

  • Correlación
  • Distribución
  • Ocurrencia
  • Geográfico

Widget de correlación

El widget de correlación ayuda a analizar la correlación entre dos características numéricas de los datos en forma de diagrama de dispersión. Todas las características numéricas se mapearán en conjuntos de dos características y la correlación entre las dos características se puede visualizar para analizar las características con una correlación más alta.

Widget de distribución

El widget de distribución de la API de python LUX es responsable de generar imágenes de histograma para todas las características numéricas que proporcionan el recuento de cada una de las características a través de contenedores de histograma. El widget de distribución ayuda principalmente a analizar la frecuencia de las características numéricas.

Widget de ocurrencia

El widget de ocurrencia de LUX python API es responsable de generar gráficos de barras horizontales mediante el análisis de la frecuencia de ocurrencia de características categóricas presentes en los datos. Para cada una de las características categóricas y para cada clase de características categóricas, la ocurrencia de frecuencia se proporciona en forma de imágenes en el widget de ocurrencia.

Widget geográfico

El widget geográfico de LUX API básicamente muestra los mapas de coropletas para ubicaciones geográficas en el conjunto de datos. La media de ciertas características numéricas se calcula para cada región en los mapas y, con solo pasar el cursor sobre el mapa, se puede calcular el valor medio de cada región en cada una de las ubicaciones geográficas de los datos.

Implementación de la API de Python LUX

En esto, veamos cómo usar la API LUX Python para automatizar el proceso de análisis de datos exploratorios. Para utilizar la API de Python de LUX, primero debemos instalar la API de LUX en el entorno de trabajo.

!pip instalar lux-api

Ahora, después de instalar la API LUX en el entorno de trabajo, importemos la API en el entorno de trabajo junto con el módulo pandas para leer el conjunto de datos.

importar lux
importar pandas como pd

En ciertos entornos de trabajo, ciertos widgets para visualizar desde API deben permitirse instalando los widgets de visualización correspondientes. Aquí veamos cómo permitir que la API LUX produzca imágenes en Google Colab.

de la salida de importación de google.colab
salida.enable_custom_widget_manager()

Una vez que se han configurado los widgets, el paso final es simplemente leer el conjunto de datos utilizando el módulo pandas en el entorno de trabajo.

df=pd.read_csv('/content/drive/MyDrive/Colab notebooks/EDA usando LUX/WA_Fn-UseC_-HR-Employee-Attrition.csv')
d.f.

Así es como con solo leer el marco de datos en el entorno de trabajo activado por LUX, se automatiza todo el proceso de análisis de datos exploratorios y se producen varios widgets.

Más información en : analyticsindiamag.com

 

Fuente: somoslibres

¿Quién está en línea?

Hay 445 invitados y ningún miembro en línea

Contador de Visitas

13649116
Hoy Hoy 908
Ayer Ayer 3589
Esta semana Esta semana 12036
Este mes Este mes 65026
Total de Visitas Total de Visitas 13649116

Día con más
visitantes

08-09-2022 : 4235

Gracias por su visita