Tipos de Machine Learning. Clasificación vs Regresión

El machine learning genera muchos rumores porque es aplicable en una gran variedad de casos de uso. Esto se debe a que el aprendizaje automático es en realidad un conjunto de muchos métodos diferentes que son especialmente adecuados para responder diversas preguntas sobre un negocio. Para comprender mejor los algoritmos de aprendizaje automático, es útil separarlos en grupos en función de cómo funcionan.

Machine Learning
Machine Learning

Uno de los puntos de vista para separar estos algoritmos es el de los datos, si disponemos de datos etiquetados (ejemplos resueltos) o no.  Entonces será aprendizaje supervisado o no supervisado. Incluso se puede hacer aprendizaje automático semi-supervisado. Pero también existen diferencias inherentes en estos algoritmos basados en el formato de sus salidas. Viéndolos de esta manera, los métodos principales de aprendizaje automático son dos: clasificación y regresión.

Clasificación

Los algoritmos de clasificación se usan cuando el resultado deseado es una etiqueta discreta. En otras palabras, son útiles cuando la respuesta a su pregunta sobre su empresa cae dentro de un conjunto finito de resultados posibles. Muchos casos de uso, como determinar si un correo electrónico es correo no deseado o no, solo tienen dos resultados posibles. Esto se llama clasificación binaria.

Clasificación
Clasificación

La clasificación multicategoría captura todo lo demás, y es útil para la segmentación del cliente, la categorización de imágenes y audio y el análisis de texto para optimizar el sentimiento del cliente. Si estas son las preguntas que espera contestar con el aprendizaje automático en su negocio, considere algoritmos como Bayes ingenuo, árboles de decisión, regresión logística, aproximación kernel y vecinos K más cercanos.

Regresión

Por otro lado, la regresión es útil para predecir productos que son continuos. Eso significa que la respuesta a su pregunta se representa mediante una cantidad que puede determinarse de manera flexible en función de las entradas del modelo en lugar de limitarse a un conjunto de posibles etiquetas. Los problemas de regresión con entradas ordenadas por tiempo se denominan problemas de pronóstico de series temporales, como el pronóstico ARIMA, que permite a los científicos de datos explicar los patrones estacionales en las ventas, evaluar el impacto de las nuevas campañas de marketing y más.

Regresión
Regresión

La regresión lineal es, con mucho, el ejemplo más popular de un algoritmo de regresión. Aunque a menudo se subestima debido a su relativa simplicidad, es un método versátil que se puede usar para predecir los precios de la vivienda, la probabilidad de que los clientes se desvíen o los ingresos que un cliente generará. Para casos de uso como estos, los árboles de regresión y la regresión vectorial de soporte son buenos algoritmos a considerar si está buscando algo más sofisticado que la regresión lineal.

Elegir un algoritmo es un paso crítico en el proceso de aprendizaje automático, por lo que es importante que realmente se adapte al caso de uso del problema en cuestión.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.