machine-learning.jpg

La mayoría de nosotros subutilizamos nuestro ordenador. Con subutilizar no me refiero al uso intensivo de los componentes, me refiero a que no hacemos una gran parte de las cosas que podríamos hacer y que el código abierto pone a nuestro alcance.

Supongamos que tenemos una fábrica de uniformes para niños de primaria y nos gustaría seguir vendiéndoles durante la adolescencia. Dado que ese tipo de compras la hacen las madres y no siguen los dictados de la moda nuestras decisiones sobre los artículos y cantidades a fabricar estarán determinados por el tamaño de los chicos y el clima.

El tamaño actual de los chicos es un dato que tenemos ya que les vendimos uniformes todos estos años. Hacer estimaciones sobre la evolución de su crecimiento a partir de esos datos es relativamente fácil, la ciencia médica tiene compiladas tablas que la calculan. Y los meteorólogos tienen modelos matemáticos que pueden determinar cómo será el clima durante el año.

Combinando esos datos en un software estadístico podremos obtener una estimación razonablemente acertada sobre que fabricar.

Las máquinas de autoaprendizaje aplican modelos estadísticos a los datos que tenemos para predecir los datos que no tenemos mediante la búsqueda de patrones de comportamiento. Un ejemplo de máquinas de autoaprendizaje son las recomendaciones de películas de Netflix hechas en base a tus preferencias y a las de personas que tienen gustos similares a los tuyos.

Pasos para construir una máquina de autoaprendizaje

1-El objetivo

Decir que si no sabemos cuál es la pregunta jamás podremos obtener una respuesta no deja de ser una obviedad, pero sigue siendo cierto

2-Creación del modelo

Se trata de establecer reglas sobre como los datos que tenemos se vinculan entre ellos. Por ejemplo (me lo estoy inventando) sabemos que si la temperatura promedio será de 18 grados la compra promedio de pantalones cortos es de dos o que los adolescentes que practican basquet no sienten el frío en temperaturas mayores a 5 grados centígrados.

3-Búsqueda de respuestas

De acuerdo al modelo la computadora va respondiéndose preguntas que de acuerdo a sus probabilidades permitan determinar la mejor predicción posible. Por ejemplo si tenemos que el 80% de nuestros clientes practican basquet, que la estadística demuestra que el 70% de los practicantes de ese deporte en la infancia lo siguen practicando durante la adolescencia y que la temperatura promedio del año que viene será de 25 grados, fabricar más pantalones cortos que ropa de abrigo parece ser una apuesta segura.

4-Toma de decisiones

Habiendo provocado el suicidio de mi profesor de estadística con la última frase del párrafo anterior, debemos dejar en claro que al iniciar el proceso debe establecerse el grado de probabilidad deseado de las recomendaciones que se desean obtener para que la máquina pueda filtrar de todas las respuestas posibles las más adecuadas.

5-Retroalimentación

En cualquier momento es posible incorporar nuevos datos al modelo. Por ejemplo información sobre el porcentaje de aciertos de los pronósticos del tiempo en los últimos años, o influencia en los cambios de hábitos de los deportistas ante el éxito del país en otra disciplina, o pronósticos sobre la evolución de la economía e información sobre los cambios de hábito de consumo en los diferentes escenarios. Además de las correcciones resultado de contrastar las predicciones con la realidad.

Herramientas

Todo esto puede parecer algo únicamente accesible para grandes empresas con poderosas computadoras, pero gracias al código abierto podemos utilizar las máquinas de autoaprendizaje en nuestra computadora. En principio las hojas de cálculo de Open/Libre Office disponen de las herramientas básicas para el trabajo con escenarios, pero lo más adecuado es usar lenguajes como Python o R que disponen de bibliotecas específicas para el trabajo estadístico.

 

Fuente: planetaddiego

¿Quién está en línea?

Hay 30421 invitados y ningún miembro en línea