¿Cómo funciona?
ANDRIY ONUFRIYENKO VIA GETTY IMAGES |
El aprendizaje automático está a nuestro alrededor: en nuestros teléfonos, potenciando las redes sociales, ayudando a la policía y los médicos, científicos y alcaldes. Pero ¿cómo funciona? En esta publicación echaremos un vistazo a cómo se pueden usar las estadísticas y la informática para hacer máquinas que aprenden.
¿Qué es el aprendizaje automático?
El aprendizaje automático es el campo de la informática dedicado a enseñar a las computadoras cómo aprender de grandes conjuntos de datos. Un algoritmo es un conjunto de reglas, una receta, que debe seguir una computadora. Lo que hace que los algoritmos de aprendizaje automático sean especiales es que dependen de los datos para funcionar, no que un programador le diga cuáles son las reglas; y cuantos más datos, mejor. Eso significa que un algoritmo de aprendizaje automático es tan bueno como sus datos, por lo que, por ejemplo, un algoritmo de reconocimiento de imágenes va a ser muy preciso para identificar la Torre Eiffel, porque hay muchas imágenes en Internet para aprender de ellas, pero no será tan bueno identificando a su mascota, a menos que, por supuesto, publique muchas fotos de su mascota en Internet.
Cuando se combinan las estadísticas, se trata de decirle a las computadoras cómo procesar los datos de la manera más eficiente posible para obtener el aprendizaje automático; algoritmos eficientes que aprenden automáticamente de los datos, mejorando a medida que obtienen más datos.
Datos de gran tamaño
Los grandes conjuntos de datos están a nuestro alrededor y se recopilan todo el tiempo. Cuando te etiquetas a ti mismo y a los demás en fotos, has contribuido con datos. Y cuando todos hacen esto todos los días, ¡rápidamente se convierte en big data! Cuando haces clic en el resultado de una búsqueda en la web, le está enseñando al algoritmo que fue el mejor resultado, por lo que será más probable que se lo muestre a alguien como usted que hace esa búsqueda. Los especialistas también pueden crear datos, por ejemplo, médicos que registran diagnósticos en bases de datos, que los científicos pueden utilizar para desarrollar nuevos métodos de diagnóstico.
Toma de decisiones
Supongamos por ejemplo que tenemos un gran conjunto de imágenes de gatos y perros etiquetados por nosotros. Los incorporamos a nuestro algoritmo, que podría considerarse como una caja negra. El algoritmo está tratando de aprender una relación para que cuando vea una nueva imagen pueda clasificarla con precisión si es “perro” o “gato”.
Miremos dentro de la caja negra y veamos cómo podría hacerlo. Una clase de algoritmos simples, pero altamente efectivos, se enfoca en aprender un límite de decisión; una línea que separa imágenes de gatos de perros.
Un algoritmo de reconocimiento de imágenes va a ser muy preciso para identificar la Torre Eiffel, porque hay muchas imágenes en Internet para aprender de ellas, pero no será tan bueno identificando a su mascota.
Podemos pensar en colocar estas imágenes en una gráfica, y queremos encontrar una manera de ubicarlas antes de dibujar el límite de decisión. Hay un número infinito de formas de organizar las imágenes, y gran parte del trabajo de ingeniería que se dedica al aprendizaje automático se centra en encontrar buenas maneras de decirle a la computadora que procese las imágenes para que pueda organizarlas.
Una vez que la computadora ha ordenado las imágenes, con los gatos por aquí y los perros por allí, busca el mejor límite para separar a los gatos de los perros, tal vez solo una línea recta para comenzar.
Más allá de los gatos y los perros
Ahora imagine que entrena una computadora para resolver este problema, pero en lugar de tener solo perros y gatos, ¡tiene imágenes de más de mil millones de personas diferentes para decidir! O imagínese intentando resolver este problema sin tener grandes recursos informáticos en un servicio de la Nube, pero resolviéndolo por completo en su teléfono.
O, ¿qué pasa si estamos buscando criminales, en lugar de gatos o perros? Entonces también tendremos que calificar nuestro nivel de confianza en nuestras predicciones
No hay comentarios:
Publicar un comentario