Linux-Data-Science.jpg

El análisis de datos y machine learning se utiliza junto con máquinas virtuales. En Azure se empleaba como máquina virtual Microsoft Data Science, dispone de una imagen preinstalada y configurada con varias herramientas que se utilizan para las funciones que hemos indicado. Algunas de estas herramientas se encuentran dentro de Microsoft  Server en su edición de desarrolladores, la distribución Anaconda Python, Azure SDK y ahora en la máquina virtual Linux Data Science.

Linux Data Science llega a Azure

Esta máquina virtual parte de la versión de Linux OpenLogic CentOS 7.2. Y al igual que con la máquina virtual de Microsoft que hemos comentado, dispone de ciertas herramientas para poder hacer un análisis de datos exhaustivo. Estas son las herramientas que incluye:

  • Microsoft R Open (con Librería de Kernel Intel Math)
  • Distribución Anaconda Python con Phyton 2.7 o 3.5.
  • Jupyter Notebook con Kernel Phyton y R para exploración y desarrollo de datos a través de un navegador.
  • Herramientas Azure: Azure Command Line Interface para gestionar recursos de Azure, Azure Storage Explorer para trabajar con Azure Blobs.
  • Una instancia de base de datos local Postgres.
  • Herramientas Machine Learning:
  • Azure ML: Producir modelos en R y Python de manera local en la máquina virtual o en la nube de Azure ML a través de las librerías preinstaladas.
  • Computational Network Toolkit (CNTK): Un software de aprendizaje de Microsoft Research
  • Vowpal Wabbit: Un sistema ML que soporta técnicas como online, hashing, allreduce, reductions, learning2search, active y aprendizaje interactivo.
  • XGBoost: Una herramienta que proporciona rapidez y precisión de implementación ramificada.
  • Rattle (Una herramienta de análisis de R fácil de aprender): Una manera de comenzar el análisis de datos en R con facilidad, con interfaz de exploración de datos, modelos ML y generación de código en R.
  • Herramientas de desarrollo:Azure SDK en Java, Python, Node.js, Ruby, PHP; Eclipse IDE con plugin de Azure Toolkit; editores de código como vim, gedit y Emacs (con addons ESS, auctex); drivers SQL Server y herramientas de comando como bcp (Bulk Copy), sqlcmd; Cliente gráfico SQuirreL SQL para permitir el acceso a varias bases de datos.
  • Acceso remoto a interfaz de texto a través de un cliente SSH (Como PuTTY o comandos SSH) o en un escritorio gráfico (necesita separar una instalación X2Go en tu la máquina).

Microsoft amplía de esta manera sus soluciones para Machine Learning a través de Azure y ofrece sus soluciones en Linux. De esta manera será más fácil que podamos desarrollar una solución a nuestro antojo sin dejar de disponer de las mejores herramientas de análisis.

 

Fuente: microsoftinsider | somoslibres

¿Quién está en línea?

Hay 32273 invitados y ningún miembro en línea