El aprendizaje automático es uno de esos avances que está revolucionando nuestras vidas casi sin saberlo. Sectores como la salud, la robótica, la tecnología financiera o los Big Data están experimentando un cambio de 180 grados gracias a los modelos que son capaces de predecir el futuro y aprender de sus propias predicciones. Un estadio prematuro de lo que todo el mundo conoce como la Inteligencia Artificial.
Diagnósticos médicos
¿Qué es lo que convertía al personaje de ficción Dr. House en un médico tan asombroso? Cualquier diagnóstico clínico necesita de capacitación, experiencia, reconocimiento de patrones y cálculo de probabilidades. Aquellos médicos que reúnen todas esas condiciones y alcanzan soluciones creativas a los problemas son los que inspiran series como ésta. Pero… ¿es posible que un algoritmo sea capaz de asistir a un sanitario en esa labor? La respuesta es que sí.
Hay varios antecedentes interesantes: en 1961, el doctor Homer Warner desarrolló con éxito un sistema de diagnóstico automático para pacientes con cardiopatías congénitas, y en los años 70 Edward Shortliffe, de la Universidad de Stanford, creó el conocido como MYCIN, un sistema experto para el diagnóstico de enfermedades infecciosas de la sangre. Desde los años 80 se han ido introduciendo programas que ayudan a los médicos a tomar decisiones: la mayoría basados en la inteligencia artificial y el aprendizaje automático (redes neuronales artificiales, razonamiento basado en casos y clasificadores bayesianos).
Un caso de éxito en la aplicación de estos modelos de aprendizaje automático al diagnóstico de enfermedades es el proyecto IMED para la detección del cáncer de mama. El proyecto dispone de una plataforma con un enorme repositorio de imágenes médicas de casos anónimos de cáncer de mama; una aplicación llamada Mammography Image Workstation for Analysis and Diagnosis (MIWAD) para el análisis y el diagnóstico asistido por ordenador que permite almacenar, recuperar y manipular esa información (funciona con un visor de imágenes de casos de cáncer de mama); y luego un grupo de clasificadores automáticos, basados en algoritmos de aprendizaje automático, que permiten elaborar diagnósticos alternativos a los que hace el facultativo y que sirven de mecanismo de cotejo del primer informe. Este proyecto fue seleccionado en 2013 como un caso de éxito en I+D+i.
Motores de búsqueda y servicios de análisis predictivo en la nube
Las grandes tecnológicas como Google, Microsoft o Facebook están usando el aprendizaje automático para mejorar sus sistemas de búsqueda y recomendación para usuarios o sus servicios profesionales de computación en la nube. Desde hace tiempo, los buscadores disponen de habilidades por las cuales son capaces de ofrecer opciones de búsqueda a un usuario que comienza a hacer alguna petición.
Esto lo consiguen gracias a técnicas de machine learning, concretamente a lo que la industria tecnológica llama deep learning (aprendizaje profundo). Este tipo de metodologías permite a un gran buscador mejorar su capacidad para reconocer voces, imágenes y textos de una forma más precisa.
Otras corporaciones como Microsoft usan el aprendizaje automático para ofrecer a las empresas soluciones de analítica predictiva con servicios en la nube como Microsoft Azure Machine Learning. Gracias a ellos, los clientes de la compañía de Redmond pueden diseñar aplicaciones para predecir lo que pasará en su empresa en un futuro. Y eso sin una inversión fuerte en perfiles profesionales y software.
El aprendizaje robótico
El aprendizaje automático se utiliza habitualmente en robótica, lo que da origen a lo que se conoce como aprendizaje robótico. Esta disciplina se encarga de estudiar técnicas que permitan a los robots adaptarse al entorno a gran velocidad y de forma creativa. Y eso sólo es posible mediante algoritmos de aprendizaje automático. Esto facilita que una máquina adquiera habilidades sensoriales y motoras (que un robot humanoide sea capaz de moverse por un terreno abrupto), lingüísticas (que sea capaz de reconocer el lenguaje humano) e interactivas (pueda agarrar objetos).
Científicos y expertos en robótica y machine learning llevan tiempo trabajando con las posibilidades que ofrece el aprendizaje supervisado y el auto-aprendizaje supervisado en el campo de las máquinas inteligentes. Las técnicas de aprendizaje supervisado se utilizan, por ejemplo, para la identificación de vegetación y obstáculos en un terreno por parte de un robot. Y las técnicas de auto-aprendizaje supervisado tienen por objetivo que un robot sea capaz de generar ejemplos de entrenamiento que acaben con una mejora de su adaptación al entorno.
Lucha contra el fraude
El aprendizaje automático también se utiliza para la elaboración de modelos predictivos para la detección del fraude en las grandes corporaciones y, concretamente, los delitos en transacciones de tarjetas de créditos en entidades financieras. Por ejemplo, si una entidad bancaria dispone de una base de datos con transacciones correctas y otra con operaciones ilícitas, con técnicas de aprendizaje automático es posible generar un modelo que sea capaz de detectar si las siguientes operaciones son fraudulentas o no con un margen de error determinado.
Dentro de los métodos usados para este tipo de prácticas antifraude se encuentran, por ejemplo, las redes neuronales, los árboles de decisión y los análisis bayesianos.
La clave de todo este proceso es que las redes neuronales son capaces de aprender con el tiempo. Cada nueva detección de una transacción fraudulenta mejora el modelo y aumenta la probabilidad de detectar nuevos delitos con una tarjeta de crédito. Tanto es así, que una entidad financiera podría disponer de los datos de cualquier transacción ilícita poco tiempo después de que ésta se cometiera. Estaríamos hablando de una especie de Gran Hermano del delito económico.
Por poner un ejemplo, el Grupo de Tratamiento de Señales del Instituto de Telecomunicaciones y Aplicaciones Multimedia de la Universitat Politècnica de València lleva tiempo investigando el desarrollo de algoritmo de aprendizaje automático para la detección de fraudes en tarjetas de crédito.
Análisis del mercado de valores
Los viejos sistemas de gestión del mercado de valores solían utilizar los indicadores como pautas para sus decisiones de compra y venta. Hoy en día, el uso de modelos permite analizar grandes cantidades de información para elaborar patrones y tomar decisiones cuando las probabilidades de cerrar una gran operación son más altas.
Para la creación de estos modelos predictivos es necesario usar datos históricos de distintos indicadores, establecer qué valores de esos indicadores son los que mayor probabilidad tiene de finalizar en una buena operación y por último estudiar cuál puede ser el patrón. Una forma más sencilla de aplicar el aprendizaje automático al trading es mediante el uso de herramientas como RapidMiner o Matlab.
Minería de datos
Los datos son el nuevo gran activo de las empresas. Pero los datos por sí mismos no generan valor diferencial. Es necesario extraer de ellos la información útil, lo que en Big Data se llama Knowledge Discovery in Databases (KDD, descubrimiento de conocimiento de las grandes bases de datos). Todo este análisis cualitativo de la información hace tiempo que dejó de ser un proceso manual porque el volumen de datos es muy elevado: es imposible corregir errores y duplicidades o buscar patrones sin la asistencia de algoritmos de machine learning.
La minería de datos se encarga de encontrar patrones o relaciones/secuencias desconocidas de los datos para sacar conclusiones interesantes (encontrar mejores clientes o aumentar las ventas, por ejemplo). Para ello utiliza algoritmos de aprendizaje automático (normalmente redes neuronales artificiales).
Es la aplicación de la inteligencia artificial para la extracción de conocimiento en varias fases bien definidas: primero debemos definir cuál es el problema y preparar los datos, después hay que revisarlos y entender su dimensión, más tarde generar los modelos y finalmente implementar esos modelos a la muestra de información para obtener insights. El modelo se aplica una vez que se ha verificado, mediante una muestra de datos de aprendizaje, que es útil para la extracción de información.
Gestión de los centros de datos
Una de las cuestiones decisivas en los grandes centros de datos es el uso de la energía. Gracias a los algoritmos de aprendizaje automático, un centro de datos es capaz de aprender de su propio rendimiento y corregir cualquier variable para mejorar su gestión. Un verdadero centro de datos inteligente.
Google dispone de potentes algoritmos de aprendizaje automático que permiten rastrear, predecir y aprender sobre el uso eficiente de energía que necesita un grupo de servidores concreto a partir de la demanda de información existente. Por ejemplo, estos algoritmos permiten saber de antemano qué nivel de refrigeración necesitará una instalación para que su rendimiento sea el esperado y dentro del coste previsto.