¿Qué es el aprendizaje supervisado?

Name: ¿Qué es el aprendizaje supervisado?
Brand: OVHcloud
Rating: 4.8 (476 reviews)

En esencia, el aprendizaje supervisado es un tipo de aprendizaje automático en el que el algoritmo aprende de los datos etiquetados.

Piense en el aprendizaje supervisado como un estudiante aprendiendo con un profesor. El "profesor" (que a menudo es un científico de datos o experto en dominios) proporciona al equipo un conjunto de ejemplos, donde cada ejemplo incluye tanto la entrada como la salida correcta correspondiente.

El objetivo fundamental del aprendizaje supervisado es que el algoritmo "aprenda" una regla general o una función de mapping que pueda tomar nuevas entradas invisibles y predecir la salida correcta para ellas. Se llama "supervisado" porque el proceso de un algoritmo de aprendizaje del conjunto de datos de capacitación se puede considerar como un maestro que supervisa el proceso de aprendizaje.

Conocemos las respuestas correctas (etiquetas), el algoritmo hace iterativamente predicciones sobre los datos de entrenamiento y es corregido por el profesor. El aprendizaje se detiene cuando el algoritmo alcanza un nivel aceptable de rendimiento.

¿Cómo funciona el aprendizaje supervisado?

El aprendizaje supervisado puede parecer complejo, pero los métodos subyacentes siguen un flujo de trabajo estructurado. Se trata de enseñar a una máquina mostrándole ejemplos y luego probando su comprensión. A continuación, se detallan los pasos típicos que intervienen:

Recopilación y preparación de datos etiquetados

El proceso comienza con la recopilación de datos relevantes. Para el aprendizaje automático supervisado , estos datos deben estar etiquetados. Esto significa que cada dato de entrada se empareja con una salida correcta correspondiente o "etiqueta". Por ejemplo, si está construyendo un detector de spam, sus datos serían correos electrónicos (entrada) etiquetados como "spam" o "not spam" (salida).

La calidad y la cantidad de estos datos etiquetados son primordiales en los métodos utilizados. Cuantos más ejemplos relevantes y de alta calidad vea el modelo de características, mejor aprenderá y funcionará en general. Esta etapa a menudo implica la limpieza de datos (manejo de valores faltantes, eliminación de errores) y el preprocesamiento (transformación de datos en un formato adecuado para el algoritmo).

Dividir los datos en formación, validación y conjuntos de pruebas

Una vez que tenga su conjunto de datos con etiquetas, es una práctica estándar no utilizar todo para enseñar el modelo directamente. En cambio, normalmente está dividido. El Conjunto de entrenamiento es la porción más grande de los datos y se utiliza para entrenar realmente el modelo de aprendizaje automático. El modelo "ve" estos ejemplos y aprende la relación entre las entradas y sus etiquetas correspondientes.

Durante el proceso de formación se utiliza un conjunto de validación (opcional pero muy recomendado) para ajustar los parámetros del modelo (hiperparámetros) y tomar decisiones sobre la arquitectura del modelo; ayuda a evitar que el modelo se vuelva demasiado especializado para los datos de formación (un problema conocido como sobreajuste) al proporcionar una evaluación imparcial a medida que aprende.

Por último, el Conjunto de pruebas se utiliza después de que el modelo ha sido entrenado (y validado) para proporcionar una evaluación imparcial del rendimiento final del modelo. Estos datos nunca han sido vistos por el modelo antes, por lo que dan una buena indicación de cómo el modelo se desempeñará en nuevos datos del mundo real.

Selección de un modelo (selección de algoritmos)

En función del problema que intenta resolver (por ejemplo, predecir una categoría como "spam/no spam" - clasificación, o predecir un valor continuo como el precio de una casa - regresión) y la naturaleza de sus datos, seleccionará un algoritmo de aprendizaje supervisado adecuado . Hay muchos algoritmos entre los que elegir, como Regresión lineal, Regresión logística, Árboles de decisión, Máquinas vectoriales de soporte (SVM), Redes neuronales y más.

Entrenamiento del modelo

Aquí es donde sucede el "aprendizaje". El algoritmo elegido procesa el conjunto de entrenamiento. El modelo realiza predicciones basadas en los datos de entrada y las compara con las etiquetas reales conocidas.

Si hay una discrepancia (un error), el algoritmo ajusta sus parámetros internos para hacer mejores predicciones la próxima vez. Esto se hace a menudo tratando de minimizar una "función de pérdida", que cuantifica cuán lejos están las predicciones del modelo de los valores verdaderos.

Este proceso de ajuste iterativo continúa hasta que el modelo alcanza un nivel satisfactorio de precisión en los datos de entrenamiento (y se comporta bien en los datos de validación).

Evaluación del modelo

Una vez finalizada la formación, se evalúa el rendimiento del modelo mediante el conjunto de pruebas. Las métricas comunes utilizadas para la evaluación dependen del tipo de problema.

Para la clasificación, son comunes las métricas como precisión, precisión, recuperación y F1-score. Para la regresión, se suele utilizar el valor de Error cuadrado medio (MSE) o R cuadrado. Este paso es crucial para comprender hasta qué punto es probable que el modelo se generalice a nuevos datos invisibles.

Si el rendimiento del modelo es satisfactorio, se puede implementar para realizar predicciones sobre datos nuevos y activos. Por ejemplo, nuestro filtro de spam comenzaría a clasificar los mensajes de correo electrónico entrantes que nunca antes había visto. También es importante monitorear continuamente el performance del modelo en el mundo real, ya que los patrones de datos pueden cambiar con el tiempo (un concepto conocido como "deriva del modelo"), lo que potencialmente requiere reentrenamiento o ajustes al modelo.

En esencia, el aprendizaje supervisado es un proceso iterativo de alimentar ejemplos etiquetados a un algoritmo, lo que le permite aprender patrones, y luego probar su capacidad para generalizar esos patrones a nuevos datos.

Tipos de aprendizaje automático supervisado

Los problemas de aprendizaje supervisados, aunque todos se basan en el principio de aprender de los datos etiquetados, se distinguen generalmente en dos categorías principales: Clasificación y regresión. La diferencia fundamental entre ellos depende de la naturaleza del resultado que el modelo está diseñado para predecir.

Clasificación:

La clasificación se refiere a las tareas en las que el objetivo es predecir una etiqueta de categoría o clase discreta. Esto significa que la variable de salida no es un número que puede variar continuamente, sino un grupo distinto, como "sí" o "no", "spam" o "no spam", o tipos de objetos específicos como "gato", "perro" o "humano".

El modelo aprende de un conjunto de datos de capacitación donde cada entrada ya está asignada a una clase predefinida. Su objetivo entonces pasa a ser asignar con precisión nuevos puntos de datos invisibles a una de estas categorías aprendidas.

Existen numerosas aplicaciones prácticas de clasificación. Por ejemplo, en la detección de correo no deseado, los modelos clasifican los mensajes de correo electrónico entrantes como "spam" o "no spam". Las tareas de reconocimiento de imágenes utilizan la clasificación para identificar objetos dentro de las imágenes, como clasificar una imagen como que contiene un "coche", "bicicleta" o "peatón".

Regresión:

Por otro lado, la regresión es la técnica de aprendizaje supervisado que se utiliza cuando la variable de salida es un valor numérico continuo. A diferencia de la clasificación, que predice a qué categoría pertenece algo, la regresión apunta a predecir qué cantidad de algo hay o qué valor numérico específico será. El modelo aprende a asignar variables de entrada a una salida continua.

Abundan los ejemplos reales de regresión. La predicción del precio de una casa implica estimar el precio de mercado de una casa en función de características como su tamaño, número de dormitorios y ubicación. En las finanzas, los modelos de regresión se utilizan para la previsión de los precios de las acciones, intentando predecir los valores futuros de las acciones en los que se basarán las decisiones.

Los algoritmos comunes utilizados para las tareas de regresión incluyen Regresión lineal y Regresión polinómica. La regresión vectorial de soporte (SVR) es otra opción popular, junto con algoritmos adaptables como árboles de decisión, bosques aleatorios y redes neuronales cuando se configuran para salida continua.

Aprendizaje supervisado frente a aprendizaje no supervisado

Si bien tanto el aprendizaje supervisado como el no supervisado son pilares fundamentales del aprendizaje automático y la predicción, abordan los problemas utilizando metodologías y objetivos fundamentalmente diferentes, que se distinguen principalmente por el tipo de datos que utilizan y las metas que pretenden alcanzar. Comprender sus diferencias es clave para seleccionar el enfoque correcto para una tarea determinada.

Elegir datos de entrada

El ejemplo más significativo de una distinción radica en la naturaleza de los datos de entrada. El aprendizaje supervisado, como hemos comentado, se basa en datos etiquetados. Esto significa que durante su fase de entrenamiento, el algoritmo se proporciona con conjuntos de datos donde cada ejemplo de entrada se empareja con una salida correcta correspondiente o "etiqueta".

Aprende comparando su predicción con estas etiquetas conocidas y ajustándose para minimizar los errores. Piense en ello como un aprendizaje automático con un profesor que proporciona las respuestas.

Consideración de datos sin etiqueta

En marcado contraste, el aprendizaje sin supervisión funciona con datos sin etiqueta. Los algoritmos reciben datos que consisten únicamente en funciones de entrada, sin variables de salida explícitas ni respuestas correctas. El objetivo aquí no es predecir un resultado predefinido, sino explorar los datos y descubrir estructuras, patrones o relaciones inherentes dentro de ellos. Es como aprender observando e identificando patrones uno mismo, sin la guía explícita de un maestro.

El aspecto de la "supervisión" delimita claramente ambos aspectos. En el aprendizaje supervisado, la presencia de etiquetas proporciona una retroalimentación directa al proceso de aprendizaje en el que se basará. El algoritmo se le dice explícitamente cuál debería ser el resultado correcto para cada entrada, guiando su aprendizaje. En el aprendizaje no supervisado, no existe esa orientación explícita. Los algoritmos deben inferir patrones y relaciones únicamente a partir de las características de los datos de entrada.

Ejemplos de casos prácticos de aprendizaje automático supervisado

El aprendizaje supervisado no es sólo un concepto teórico o una predicción; es el motor detrás de una amplia gama de aplicaciones que afectan nuestra vida diaria y varias industrias. Su capacidad para aprender de ejemplos etiquetados lo hace invaluable para tareas que requieren predicción y clasificación. A continuación se presentan algunos casos de uso destacados:

Reconocimiento de imágenes y objetos : Esta es una aplicación clásica de clasificación. Los modelos de aprendizaje supervisados se entrenan en conjuntos masivos de datos de imágenes, donde cada imagen se etiqueta con los objetos que contiene (por ejemplo, "gato", "coche", "peatón", "árbol").
Detección de spam : Uno de los primeros y más ampliamente adoptados usos del aprendizaje supervisado (específicamente la clasificación) es en el filtrado de correos electrónicos no deseados. Los modelos están entrenados en un amplio corpus de correos electrónicos que han sido etiquetados manualmente como "spam" o "no spam" (a menudo llamado "jamón").
Diagnóstico médico y asistencia sanitaria : El aprendizaje supervisado desempeña un papel cada vez más importante en la atención sanitaria al ayudar a los profesionales médicos a diagnosticar enfermedades. Los modelos pueden ser entrenados en datos de pacientes, incluyendo síntomas, historial médico, resultados de laboratorio e imágenes médicas, etiquetados con diagnósticos confirmados.
Análisis de opinión : Las empresas y organizaciones confían en gran medida en la comprensión de la opinión pública y los comentarios de los clientes. Los modelos de aprendizaje supervisados (clasificación) están formados en datos de texto (como reseñas de productos, publicaciones en redes sociales o respuestas a encuestas) que han sido etiquetados con sentimientos como "positivo", "negativo" o "neutral".
Detección de fraude financiero : En el sector financiero, el aprendizaje supervisado es fundamental para identificar y prevenir las transacciones fraudulentas. Los modelos reciben formación sobre los datos históricos de las transacciones, donde cada transacción se etiqueta como "fraudulenta" o "legítima".
Predicción de los precios de la vivienda y de los valores bursátiles (regresión): Los modelos de regresión en el aprendizaje automático supervisado son ampliamente utilizados en finanzas y bienes raíces. Para predecir los precios de las viviendas, los modelos se basan en datos de ventas de propiedades anteriores, incluidas características como el tamaño, el número de dormitorios, la ubicación, la edad y las comodidades, junto con sus correspondientes precios de venta.

La lista de ejemplo anterior representa sólo una fracción de las formas en que se está aplicando el aprendizaje supervisado. A medida que los datos se hacen más abundantes y aumenta la potencia de cálculo, la gama y la sofisticación de sus casos de uso no harán más que seguir ampliándose.

OVHcloud y el aprendizaje supervisado

OVHcloud ofrece un conjunto de soluciones adaptadas a cada etapa del ciclo de vida del aprendizaje supervisado. Ya sea para desplegar fácilmente modelos formados, construir y entrenar nuevos modelos a escala o para aprovechar infraestructuras cloud flexibles, OVHcloud pone a su disposición las herramientas necesarias para convertir sus datos en información útil.

Extremos AI

Implemente sin esfuerzo sus modelos de machine learning en producción con los puntos finales de IA. Concéntrese en sus algoritmos mientras gestionamos la infraestructura. Nuestro servicio administrado le permite exponer sus modelos entrenados a través de APIs HTTP escalables y seguras, y hacer que estén disponibles para realizar predicciones en tiempo real.

Machine learning

Libere todo el potencial de sus datos con las soluciones de machine learning. Esta poderosa plataforma proporciona a los científicos de datos y desarrolladores un entorno integral para construir, entrenar e implementar modelos de aprendizaje automático a escala.

Public Cloud

Descubra nuestras soluciones cloud, diseñadas para ofrecerle un control y una flexibilidad totales sobre su infraestructura. Construya, implemente y administre sus aplicaciones con nuestras instancias de computación a petición, soluciones de almacenamiento de información escalables y sólidas capacidades de redes.