Conceptos básicos de Inteligencia Artificial

En el caso de que apenas te estas iniciando en tu camino en el aprendizaje de Inteligencia Artificial, es muy probable que tengas confusión con algunos conceptos que son fundamentales dentro de está área. Por lo que a continuación de explicaré brevemente los términos y conceptos clave que debes conocer y entender.

Inteligencia Artificial

La Inteligencia Artificial es un término que se refiere a la capacidad de un computador o máquina para realizar tareas o tomar decisiones, al igual que los humanos. Los desarrolladores de Inteligencia Artificial pretenden reproducir en los sistemas, atributos humanos como la creatividad, el razonamiento lógico y la adquisición de conocimientos a distintos niveles. Si vemos a los asistentes virtuales como Siri o Alexa, la gran mayoría de las plataformas de redes sociales, son una clara demostración de cómo la Inteligencia Artificial puede automatizar tareas específicas que antes solo podían realizar los humanos.

Machine Learning

En términos sencillos, Machine Learning o Aprendizaje Automático es un subconjunto de la Inteligencia Artificial. Su núcleo radica en la idea de que los sistemas informáticos pueden aprender por sí solos a partir de los datos obtenidos al realizar tareas anteriores y experiencias pasadas. Esto significa que no es necesario programar previamente un dispositivo de Inteligencia Artificial cada vez que se necesita que trabaje en una tarea.

Aprendizaje Supervisado

Machine Learning se divide en tres grandes áreas, la primera de ella es el Aprendizaje Supervisado. Este tipo de aprendizaje implica observaciones o puntos de datos etiquetados. Un algoritmo de Aprendizaje Supervisado modela la relación entre las variables independientes, es decir, las características, y una variable dependiente, es decir, el objetivo o la etiqueta, todo esto dado un conjunto de datos con observaciones.

Para entender mejor esto te pongo como ejemplo un modelo que predice el precio de una casa en función de los años de construcción, ubicación y tamaño. En este caso las características vendrían siendo la edad, ubicación y tamaño, mientras que el precio es el objetivo.

Aprendizaje no Supervisado

La siguiente área de cobertura dentro de Machine Learning es el Aprendizaje no Supervisado. En este tipo de aprendizaje no se incluye etiquetas para las observaciones. Un algoritmo de Aprendizaje no Supervisado encuentra la estructura o los patrones subyacentes entre un conjunto de observaciones.

Para verlo de manera practica veamos un ejemplo, puede ser un negocio al por menor que divide a sus clientes en grupos en función de su comportamiento de compra. No hay ninguna etiqueta asociada a los clientes. En cambio, se espera que el algoritmo de Aprendizaje no Supervisado encuentre esas etiquetas.

Aprendizaje por Refuerzo

El último tipo de Machine Learning es el Aprendizaje por Refuerzo y se basa en el principio de acción-recompensa. Un agente aprende a alcanzar un objetivo calculando iterativamente la recompensa de sus acciones.

Inclusive se puede considerar como un aprendizaje a partir de la interacción. Es por esta razón que en ocasiones se dice que el Aprendizaje por Refuerzo es similar a cómo aprendemos de nuestros errores. Un agente interactúa con el entorno para alcanzar su objetivo y evalúa el resultado de sus acciones. Las aplicaciones más comunes del Aprendizaje por Refuerzo son los juegos de computador y la robótica.

Clasificación

La clasificación es una técnica de Aprendizaje Supervisado que se ocupa de variables objetivas discretas o categóricas. Por ejemplo, detectar si un correo electrónico es deseado o no, esta vendría siendo una tarea de clasificación. En el caso de que la variable objetivo solo tenga dos valores posibles, se le denomina clasificación binaria, en cambio si la variable contiene más de dos valores o clases, se le denomina clasificación multiclase.

Regresión

La regresión es otra técnica de Aprendizaje Supervisado en la que la variable objetivo es continua, es decir acá siempre vamos a predecir un número. Un ejemplo típico puede ser la predicción del precio de la vivienda.

Clustering o Agrupamiento

El clustering o agrupamiento es una técnica que se encuentra ligada al Aprendizaje no Supervisado y agrupa las observaciones de manera que las observaciones del mismo grupo son más similares entre sí que las de otros grupos. Justamente a esos grupos se le conoce como clústeres. A diferencia de la clasificación, que explicamos anteriormente, las observaciones acá no cuentan con etiquetan.

Un ejemplo de clustering es el de agrupar a los clientes de acuerdo a su comportamiento de compra.

Deep Learning

Si queremos una definición sencilla y acertada, se podría decir que el Deep Learning lleva a Machine Learning a un nivel superior. Pero veamos una definición más técnica, y es que Deep Learning o Aprendizaje Profundo es un subconjunto de la Inteligencia Artificial y se refiere a la capacidad de un sistema para tomar datos no estructurados de múltiples fuentes, analizarlos y aplicarlos para resolver nuevos problemas, pero para realizar todo esto utiliza redes neuronales artificiales, en su gran mayoría modificadas, que lo que hace es similar el comportamiento de las redes que tenemos nosotros en nuestro cerebro.

Redes Neuronales Artificiales

Las redes neuronales artificiales se refieren a un sistema o un algoritmo utilizado para Deep Learning que imita el funcionamiento de los circuitos neuronales del cerebro humano, por ejemplo, al dar sentido a las cosas y a los acontecimientos.

Expliquemos ahora varios conceptos que son más específicos en el desarrollo de proyectos de Inteligencia Artificial pero que son muy importantes entender y tenerlos siempre en cuenta.

Conjunto de Datos

Es la materia prima de cualquier sistema de predicción. Son los datos históricos utilizados para entrenar al sistema que detecta los patrones. El conjunto de datos o dataset como en ocasiones también se le conoce, se compone de instancias, características o propiedades.

Instancia, muestra o registro

Podemos encontrar esta definición con cualquiera de estos términos, instancio, muestra o registro, pero se refiere a cada uno de los datos disponibles para el análisis. Por ejemplo, si quieres predecir el comportamiento de los clientes del servicio de telefonía, cada instancia correspondería a un abonado. Cada instancia, a su vez, está compuesta por características que la describen, como la edad del cliente en la empresa, el dinero que gasta diariamente en llamadas, entre otras características.

Características, atributo, propiedad o campo

De todas estas formas se les conoce a las características que describen cada uno de los registros del conjunto de datos. Los nombres se pueden utilizar indistintamente todo va a depender del desarrollador y el contexto. Si continuamos con el ejemplo anterior, dentro de una cartera de clientes, las características vendrían siendo la edad del cliente en la empresa, el dinero que gasta diariamente en las llamadas, entre otras.

Objetivo

El objetivo se refiere al atributo o factor que queremos predecir, el objetivo de la predicción, como por ejemplo la probabilidad de reingreso de un paciente tras una operación.

Procesamiento de datos

Este es uno de los pasos fundamentales dentro del desarrollo de cualquier proyecto de Machine Learning. Es el proceso previo a la creación del modelo de predicción en el que se realiza un análisis, limpieza y estructuración de los campos de datos. Este proceso es uno de los más importantes y en ocasiones costosos, del proceso de predicción. El objetivo con este procedimiento es el de eliminar los campos que no ayudan a realizar la predicción y organizarlos adecuadamente para que el modelo no reciba información que no sea útil, que pueda provocar predicciones de baja calidad o confianza.

Modelo

Una vez que hayamos entrenado el sistema, es decir, tras detectar los patrones en los datos, se crea un modelo para que podamos hacer predicción. Podemos decir que un modelo vendría siendo algo parecido a un filtro en donde le ingresamos nuevos datos y la salida vendría siendo la predicción según los patrones que se han detectado en el entrenamiento.

Sobreajuste

El sobreajuste se produce cuando un modelo intenta ajustarse tan bien a los datos de entrenamiento que no puede realizar una buena predicción cuando le ingresamos nuevas observaciones. El sobreajuste por lo general ocurre cuando queremos que nuestro modelo obtenga una predicción casi perfecta por lo que lo forzamos a tal punto que el modelo se adapta a la perfección a los datos con el que se está entrenando.

Subajuste

El subajuste vendría siendo el contrario del sobreajuste. Un modelo subajustado no capta suficientes detalles en los datos de entrenamiento, por lo tanto, no funciona bien ni en los datos de entrenamiento ni en los de prueba.

Hemos cubierto acá, brevemente, algunos de los términos y conceptos clave dentro de la Inteligencia Artificial. Hay mucho más que aprender, pero los fundamentos son siempre importantes ya que sientan las bases para lo que viene después.

Si conoces términos que aun se te complican entenderlos puedes dejármelos en los comentarios para realizar una nueva publicación con esta información.

Te dejo la siguiente pregunta para comprobar lo que has aprendido con este contenido: de las siguientes afirmaciones ¿cuál crees que es cierta?

Opción 1: El Aprendizaje no Supervisado es uno de las áreas dentro de Machine Learning.

Respuesta Correcta.

Opción 2: La clasificación es uno de los tipos de Aprendizaje no Supervisado.

Respuesta Incorrecta. La clasificación es uno de los tipos de Aprendizaje Supervisado.

Opción 3: El sobreajuste se produce cuando un modelo intenta ajustarse tan bien a los datos de entrenamiento que no puede realizar una buena predicción.

Respuesta Correcta.

3 comentarios en “Conceptos básicos de Inteligencia Artificial”

  1. Alejandro Bermúdez

    Una felicitación y agradecimiento por compartir de ésta manera tan apropiada conceptos que hasta a los programadores con experiencia se nos hacen dificiles.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *