¿Qué es Machine Learning? Machine Learning es un sistema de algoritmos informáticos que puede aprender mediante el ejemplo a través de la mejora autónoma sin ser codificado explícitamente por un programador. El aprendizaje automático es una parte de la inteligencia artificial que combina datos con herramientas estadísticas para predecir una salida que puede ser utilizada para obtener percepciones accionables. El avance radica en la idea de que una máquina puede aprender de forma única a partir de los datos (es decir, el ejemplo) para producir resultados precisos. El aprendizaje automático está estrechamente relacionado con la minería de datos y el modelado predictivo bayesiano. La máquina recibe datos como entrada y usa un algoritmo para formular respuestas. Una tarea típica de aprendizaje automático es proporcionar una recomendación. Para aquellos que tienen una cuenta de Netflix, todas las recomendaciones de películas o series se basan en los datos históricos del usuario. Las empresas tecnológicas utilizan el aprendizaje no supervisado para mejorar la experiencia del usuario con recomendaciones personalizadas. El aprendizaje automático también se utiliza para una variedad de tareas como la detección de fraudes, el mantenimiento predictivo, la optimización de carteras, la automatización de tareas, etc. En este tutorial de aprendizaje automático para principiantes, aprenderás: Aprendizaje automático vs. Programación tradicional La programación tradicional difiere significativamente del aprendizaje automático. En la programación tradicional, un programador codifica todas las reglas en consulta con un experto en la industria para la que se está desarrollando el software. Cada regla se basa en un fundamento lógico; la máquina ejecutará una salida siguiendo la declaración lógica. Cuando el sistema se vuelve complejo, se necesitan escribir más reglas. Rápidamente puede volverse insostenible de mantener. El aprendizaje automático se supone que superará este problema. La máquina aprende cómo los datos de entrada y salida están correlacionados y escribe una regla. Los programadores no necesitan escribir nuevas reglas cada vez que haya nuevos datos. Los algoritmos se adaptan en respuesta a nuevos datos y experiencias para mejorar la eficacia con el tiempo. ¿Cómo funciona el aprendizaje automático? Ahora, en este tutorial de aprendizaje automático para principiantes, aprenderemos cómo funciona el aprendizaje automático (ML): Los algoritmos de aprendizaje automático pueden agruparse en dos tareas amplias de aprendizaje: supervisado y no supervisado. Hay muchos otros algoritmos. Aprendizaje supervisado Un algoritmo utiliza datos de entrenamiento y comentarios de humanos para aprender la relación entre entradas dadas y una salida dada. Por ejemplo, un profesional puede usar el gasto en marketing y el pronóstico del tiempo como datos de entrada para predecir las ventas de latas. Puede utilizar el aprendizaje supervisado cuando los datos de salida son conocidos. El algoritmo predecirá nuevos datos. Hay dos categorías de aprendizaje supervisado: tarea de clasificación tarea de regresión Clasificación Imagina que quieres predecir el género de un cliente para un comercial. Comenzarás a recopilar datos sobre la altura, el peso, el trabajo, el salario, la cesta de compra, etc. de tu base de datos de clientes. Conoces el género de cada uno de tus clientes, puede ser solo hombre o mujer. El objetivo del clasificador será asignar una probabilidad de ser hombre o mujer (es decir, la etiqueta) en función de la información (es decir, características que has recopilado). Cuando el modelo aprendió a reconocer el hombre o la mujer, puedes usar nuevos datos para hacer una predicción. Por ejemplo, acabas de obtener nueva información de un cliente desconocido y quieres saber si es hombre o mujer. Si el clasificador predice hombre = 70%, significa que el algoritmo está seguro al 70% de que este cliente es un hombre y el 30% es una mujer. La etiqueta puede ser de dos o más clases. El ejemplo de aprendizaje automático anterior tiene solo dos clases, pero si un clasificador necesita predecir un objeto, tiene docenas de clases (ej., vidrio, mesa, zapatos, etc., cada objeto representa una clase) Regresión Cuando la salida es un valor continuo, la tarea es una regresión. Por ejemplo, un analista financiero puede necesitar predecir el valor de una acción en función de una gama de características como el patrimonio neto, el rendimiento previo de las acciones, el índice macroeconómico. El sistema se entrenará para estimar el precio de las acciones con el menor error posible. Descripción del algoritmo Tipo Regresión lineal Encuentra una manera de correlacionar cada característica con la salida para ayudar a predecir valores futuros. Regresión Regresión logística Extensión de la regresión lineal utilizada para tareas de clasificación. La variable de salida es binaria (por ejemplo, solo negro o blanco) en lugar de continua (por ejemplo, una lista infinita de colores potenciales) Clasificación Árbol de decisión Modelo de clasificación o regresión altamente interpretable que divide los valores de las características de los datos en ramas en nodos de decisión (por ejemplo, si una característica es un color, cada color posible se convierte en una nueva rama) hasta que se tome una decisión final Clasificación Regresión Bayes ingenuo El método Bayesiano es un método de clasificación que hace uso del teorema de Bayes. El teorema actualiza el conocimiento previo de un evento con la probabilidad independiente de cada característica que puede afectar al evento. Clasificación Regresión Máquina de soporte vectorial La máquina de soporte vectorial, o SVM, se utiliza típicamente para la tarea de clasificación. El algoritmo SVM encuentra un hiperplano que divide óptimamente las clases. Se utiliza mejor con un solucionador no lineal. Regresión (no muy común) Clasificación Bosque aleatorio El algoritmo se basa en un árbol de decisión para mejorar drásticamente la precisión. El bosque aleatorio genera muchas veces árboles de decisión simples y utiliza el método de «voto mayoritario» para decidir qué etiqueta devolver. Para la tarea de clasificación, la predicción final será la que tenga más votos; mientras que para la tarea de regresión, la predicción promedio de todos los árboles es la predicción final. Regresión Clasificación AdaBoost Técnica de clasificación o regresión que utiliza una multitud de modelos para llegar a una decisión pero los pondera según su precisión para predecir el resultado Regresión Clasificación Árboles de impulso del gradiente Los árboles de impulso del gradiente son una técnica de clasificación/regresión de vanguardia. Se centra en el error cometido por los árboles anteriores e intenta corregirlo. Regresión Clasificación Aprendizaje no supervisado En el aprendizaje no supervisado, un algoritmo explora los datos de entrada sin recibir una variable de salida explícita (por ejemplo, explora…
Calle Eloy Gonzalo, 27
Madrid, Madrid.
Código Postal 28010
Paseo de la Reforma 26
Colonia Juárez, Cuauhtémoc
Ciudad de México 06600
Real Cariari
Autopista General Cañas,
San José, SJ 40104
Av. Jorge Basadre 349
San Isidro
Lima, LIM 15073