¿Qué es el Aprendizaje Automático Supervisado? El Aprendizaje Automático Supervisado es un algoritmo que aprende a partir de datos de entrenamiento etiquetados para ayudarte a predecir resultados para datos imprevistos. En el aprendizaje supervisado, entrenas a la máquina utilizando datos que están bien «etiquetados». Significa que algunos datos ya están etiquetados con respuestas correctas. Puede compararse con el aprendizaje en presencia de un supervisor o un maestro. Construir, escalar y desplegar con éxito modelos precisos de aprendizaje automático supervisado lleva tiempo y experiencia técnica de un equipo de científicos de datos altamente capacitados. Además, los científicos de datos deben reconstruir modelos para asegurarse de que los conocimientos proporcionados sigan siendo válidos hasta que sus datos cambien. En este tutorial, aprenderás: Cómo funciona el aprendizaje supervisado El aprendizaje automático supervisado utiliza conjuntos de datos de entrenamiento para lograr resultados deseados. Estos conjuntos de datos contienen entradas y la salida correcta que ayudan al modelo a aprender más rápido. Por ejemplo, si quieres entrenar a una máquina para que te ayude a predecir cuánto tiempo te llevará conducir a casa desde tu lugar de trabajo, debes comenzar creando un conjunto de datos etiquetados. Estos datos incluyen: Condiciones climáticas, hora del día, días festivos. Todas estas detalles son tus entradas en este ejemplo de aprendizaje supervisado. La salida es la cantidad de tiempo que tomó conducir de regreso a casa ese día específico. Instintivamente sabes que si está lloviendo afuera, te llevará más tiempo llegar a casa. Pero la máquina necesita datos y estadísticas. Veamos algunos ejemplos de aprendizaje supervisado sobre cómo puedes desarrollar un modelo de aprendizaje supervisado de este ejemplo que ayude al usuario a determinar el tiempo de viaje. La primera cosa que necesitas crear es un conjunto de entrenamiento. Este conjunto de entrenamiento contendrá el tiempo total de viaje y factores correspondientes como el clima, la hora, etc. Basado en este conjunto de entrenamiento, tu máquina puede ver que hay una relación directa entre la cantidad de lluvia y el tiempo que necesitarás para llegar a casa. Por lo tanto, determina que cuanto más llueva, más tiempo conducirás para llegar a tu casa. También puede ver la conexión entre la hora a la que dejas el trabajo y el tiempo que estarás en la carretera. Cuanto más cerca estés de las 6 p.m., más tiempo tardarás en llegar a casa. Tu máquina puede encontrar algunas de las relaciones con tus datos etiquetados. Funcionamiento del Aprendizaje Automático Supervisado Este es el comienzo de tu Modelo de Datos. Comienza a impactar cómo la lluvia afecta la forma en que las personas conducen. También comienza a ver que más personas viajan durante una hora específica del día. Tipos de algoritmos de aprendizaje automático supervisado A continuación se presentan los tipos de algoritmos de aprendizaje automático supervisado: Regresión: La técnica de regresión predice un solo valor de salida utilizando datos de entrenamiento. Ejemplo: Puedes usar la regresión para predecir el precio de una casa a partir de datos de entrenamiento. Las variables de entrada serán la localidad, el tamaño de la casa, etc. Fortalezas: Las salidas siempre tienen una interpretación probabilística, y el algoritmo puede regularizarse para evitar el sobreajuste. Debilidades: La regresión logística puede tener un rendimiento inferior cuando hay múltiples o límites de decisión no lineales. Este método no es flexible, por lo que no captura relaciones más complejas. Regresión Logística: El método de regresión logística se utiliza para estimar valores discretos en función de un conjunto de variables independientes. Te ayuda a predecir la probabilidad de ocurrencia de un evento ajustando los datos a una función logística. Por lo tanto, también se conoce como regresión logística. Como predice la probabilidad, su valor de salida está entre 0 y 1. Aquí hay algunos tipos de algoritmos de regresión Clasificación: La clasificación significa agrupar la salida en una clase. Si el algoritmo intenta etiquetar la entrada en dos clases distintas, se llama clasificación binaria. La selección entre más de dos clases se conoce como clasificación de múltiples clases. Ejemplo: Determinar si alguien será o no un incumplido del préstamo. Fortalezas: Los árboles de clasificación funcionan muy bien en la práctica Debilidades: Los árboles individuales sin restricción son propensos al sobreajuste. Aquí hay algunos tipos de algoritmos de clasificación Clasificadores Bayes Ingenuos El modelo bayesiano ingenuo (NBN) es fácil de construir y muy útil para grandes conjuntos de datos. Este método está compuesto por grafos acíclicos directos con un padre y varios hijos. Supone independencia entre los nodos hijos separados de su padre. Árboles de Decisión Los árboles de decisión clasifican instancias ordenándolas basándose en el valor de la característica. En este método, cada modo es la característica de una instancia. Debe clasificarse, y cada rama representa un valor que el nodo puede asumir. Es una técnica ampliamente utilizada para la clasificación. En este método, la clasificación es un árbol que se conoce como un árbol de decisión. Te ayuda a estimar valores reales (costo de compra de un automóvil, número de llamadas, ventas mensuales totales, etc.). Máquina de Soporte Vectorial La máquina de soporte vectorial (SVM) es un tipo de algoritmo de aprendizaje desarrollado en 1990. Este método se basa en resultados de la teoría estadística de aprendizaje introducida por Vap Nik. Las máquinas SVM también están estrechamente conectadas a las funciones de kernel, que es un concepto central para la mayoría de las tareas de aprendizaje. El marco de kernel y SVM se utilizan en una variedad de campos. Incluye recuperación de información multimedia, bioinformática y reconocimiento de patrones. Técnicas de aprendizaje automático supervisado versus no supervisado Basado en la técnica de aprendizaje automático supervisado Técnica de aprendizaje automático no supervisado Entrada de datos Los algoritmos se entrenan utilizando datos etiquetados. Los algoritmos se utilizan con datos que no están etiquetados. Complejidad computacional El aprendizaje supervisado es un método más simple. El aprendizaje no supervisado es computacionalmente complejo. Precisión Método muy preciso y confiable. Método menos preciso y confiable. Desafíos en el aprendizaje automático supervisado Aquí hay desafíos enfrentados en el aprendizaje automático supervisado: La presencia de características de entrada irrelevantes en los datos de entrenamiento podría dar resultados inexactos. La preparación de datos y el preprocesamiento siempre son un desafío. La precisión sufre cuando se han introducido valores imposibles, improbables e incompletos como datos de entrenamiento Si el experto pertinente no está disponible, entonces el otro enfoque es «fuerza bruta». Significa que debes pensar en las características correctas (variables de entrada) para capacitar a la máquina. Esto podría ser inexacto. Ventajas del Aprendizaje Supervisado Aquí están las ventajas del aprendizaje supervisado: El aprendizaje supervisado en el aprendizaje automático te permite recolectar datos o producir una salida de datos a partir de experiencias anteriores. Te ayuda a optimizar criterios de rendimiento mediante la experiencia. El aprendizaje automático supervisado te ayuda a resolver varios tipos de problemas de cálculo del mundo real. Desventajas del Aprendizaje Supervisado A continuación, se presentan las desventajas del aprendizaje automático supervisado: El límite de decisión podría sobreentrenarse si tu conjunto de entrenamiento no tiene ejemplos que quieres tener en una clase. Necesitas seleccionar muchos buenos ejemplos de cada clase mientras estás entrenando al clasificador. Clasificar grandes datos puede ser un desafío real. El entrenamiento para el aprendizaje supervisado necesita mucho tiempo de computación. Mejores prácticas para el Aprendizaje Supervisado Antes de hacer cualquier otra cosa, debes decidir qué tipo de datos se utilizará como un conjunto de entrenamiento. Debes decidir la estructura de la función aprendida y el algoritmo de aprendizaje. Reúne salidas correspondientes ya sea de expertos humanos o de mediciones. Resumen En los algoritmos de aprendizaje supervisado, entrenas a la máquina utilizando datos que están bien «etiquetados». Querer entrenar a una máquina que te ayude a predecir cuánto tiempo te llevará conducir a casa desde tu lugar de trabajo es un ejemplo de aprendizaje supervisado. La regresión y la clasificación son dos dimensiones de un algoritmo de aprendizaje automático supervisado. El aprendizaje supervisado es un método más simple, mientras que el aprendizaje no supervisado es un método complejo. El mayor desafío en el aprendizaje supervisado es que la presencia de características de entrada irrelevantes en los datos de entrenamiento podría dar resultados inexactos. La principal ventaja del aprendizaje supervisado es que te permite recolectar datos o producir una salida de datos de experiencias anteriores. La desventaja de este modelo es que el límite de decisión podría ser sobreentrenado si su conjunto de entrenamiento no tiene ejemplos que desea tener en una clase. Como mejor práctica del aprendizaje supervisado, primero debes decidir qué tipo de datos se debe usar como un conjunto de entrenamiento.
Calle Eloy Gonzalo, 27
Madrid, Madrid.
Código Postal 28010
Paseo de la Reforma 26
Colonia Juárez, Cuauhtémoc
Ciudad de México 06600
Real Cariari
Autopista General Cañas,
San José, SJ 40104
Av. Jorge Basadre 349
San Isidro
Lima, LIM 15073