Hace años el problema para lograr la obtención de conocimiento presente o futuro (predicciones) con la ciencia de datos era la falta de sistemas para el almacenamiento y procesamiento de grandes cantidades de información, hoy en día ya no es así. Y por tanto los esfuerzos se centran en cómo analizar los datos para extraer verdadero valor. Deep Feature Synthesis ayuda en esa tarea porque es un algoritmo que automatiza el aprendizaje automático.
El machine learning es el conjunto de procesos por los que un algoritmo es capaz de realizar predicciones a partir de los datos, y que el resultado de esa proyección facilite a la máquina su propio aprendizaje para mejorar en sus predicciones. Máquinas aprendiendo de sus errores y aciertos. Es, por tanto, una rama específica de la inteligencia artificial que se aplica en campos tan dispares como la banca para detectar procesos de fraude; la sanidad para la gestión de hospitales, o el retail para el cálculo optimizado de precios.
Los dos creadores del algoritmo son dos miembros destacados del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (Massachusetts Institute of Technology), en Cambridge. Sus nombres: James Max Kanter y Kalyan Veeramachaneni. Ambos presentaron el proyecto en un documento titulado ‘Deep Feature Synthesis: Towards Automating Data Science Endeavors’ (PDF), en el que resumen las características de su ‘criatura’.
Deep Feature Synthesis se encarga exactamente de lo que anuncia su propio nombre. Es un algoritmo que es capaz de crear de forma automática características entre conjuntos de datos relacionales para sintetizar procesos de aprendizaje automático. El algoritmo lo que hace es aplicar funciones matemáticas a los conjuntos de datos en el campo de origen y los transforma en nuevos grupos con nuevas características más profundas.
En ese proceso de evolución de los datos de origen, se puede comenzar con unas variables de información referidas al género o la edad, y al acabar con el proceso aplicado por Deep Feature Synthesis disponer de características que permitirían realizar otros cálculos más profundos como porcentajes.
Deep Feature Synthesis y la cópula gaussiana
Este proceso automático de machine learning se perfecciona, según sus creadores, gracias a la teoría de probabilidades de la cópula gaussiana. Muchas de las etapas de un proceso de aprendizaje automático tienen parámetros que, en busca de un resultado adecuado, exigen un proceso de afinado. Cuanto menos afinado, menos predictivo será el modelo.
Pequeñas variaciones en esa perfección pueden suponer un caos. La gran cantidad de combinaciones de parámetros entre sí hace que cualquier mínima desviación en el inicio suponga una falla enorme al final. En modelos predictivos económicos, eso se materializa en miles de millones de euros. La cópula gaussiana facilita a los creadores del algoritmo modelar la relación entre las opciones de los parámetros y el rendimiento del modelo entero. De ahí se decide qué parámetros son los mejores para optimizar el resultado.
La cópula gaussiana fue el método estadístico utilizado para evitar una gran crisis del crédito como la que hubo en 2008 y evidentemente no tuvo éxito. Este método se empleaba dentro de los análisis VAR (Valor en Riesgo), que miden las pérdidas que podría tener el mercado en condiciones normales con un nivel de confianza del 95%. Es decir, que un inversor con una cartera de un millón de euros, solo puede perder 25.000 euros uno de cada 20 días (1/20=5% restante del nivel de confianza). Los días del estallido de la gran crisis internacional de 2008, esos valores se dispararon fuera de los márgenes.
Implementación de Deep Feature Synthesis
El algoritmo de Deep Feature Synthesis y su máquina de Ciencia de Datos se implementa en la parte superior de una base de datos MySQL, usando InmoDB como motor para las tablas, una solución de almacenamiento de datos de código abierto para este tipo de base de datos relacional. InmoDB sustituye a la anterior tecnología de tablas para MySQL, MyISAM. Es más fiable, más consistente, más escalable y por tanto con más rendimiento.
Todos los conjuntos de datos con los que trabaja Deep Feature Synthesis se convierten al esquema de datos con el que trabaja MySQL. La lógica de cálculo, la gestión y la manipulación de las características de toda esa información se hace mediante el lenguaje de programaciónPython, la sintaxis más utilizada en el diseño y la configuración de procesos de Ciencia de Datos.
¿Por qué utilizaron los creadores de Deep Feature Synthesis una base de datos relacional como MySQL? Porque los requisitos del algoritmo y la forma de ordenación de los datos de este tipo de BD son similares. La máquina de Ciencia de Datos de los creadores del algoritmo implementa funciones del tipo AVG (), MAX (), MIN (), SUM (), STD () y COUNT (). Además, añade otras para otro tipo de operaciones con los datos como length () o WEEKDAY () y MONTH () para convertir las fechas en los días de la semana y el mes en que ocurrieron.
El uso de funciones más el de la creación de filtros permiten al algoritmo dos cuestiones realmente importantes en modelos predictivos:
● Aplicación de funciones solo a los casos en los que se da como cierta una condición determinada. Sin filtrado de los datos es imposible.
● Construcción de valores de intervalo de tiempo, con límites por arriba y también por debajo, basados en una fecha temporal.
Esto facilita mucho la optimización de las consultas a la base de datos.
Los tres procesos de Deep Feature Synthesis
La Ciencia de Datos basada en Deep Feature Synthesis utiliza los tres procesos habituales con los datos para la elaboración de modelos predictivos:
● Preprocesamiento de datos: el trabajo previo con los datos es esencial antes de plantear trabajos de aprendizaje automático. Es necesario revisar los parámetros para descartar, por ejemplo, valores nulos.
● Selección de características y reducción de la dimensionalidad: el algoritmo genera una gran cantidad de características por cada entidad y es necesario hacer una labor de selección y reducción previa.
● Modelado: para el modelado de los datos se utilizan árboles de decisión.
Una API es el mecanismo más útil para conectar dos softwares entre sí para el intercambio de mensajes o datos en formato estándar como XML o JSON. Así es como se convierte en un instrumento para buscar ingresos, abrirse al talento, innovar y automatizar procesos.
Las APIs pueden ser un gran apoyo a la hora de automatizar procesos empresariales Las empresas, a menudo con foco en las PYMES, dedican demasiadas horas-persona a procesos empresariales que consumen un tiempo precioso, incurriendo con ello en errores que una máquina jamás tendría. ¿Cómo puede la automatización de procesos empresariales (BPA) ayudar a estas […]
Se espera que durante los próximos años se regule el ‘open finance’, lo que dará lugar a un nuevo ecosistema de datos abiertos El open finance está abriéndose paso en el terreno legal mediante la consolidación de varias iniciativas que le darán blindaje jurídico. Una vez esto se haya completado, los clientes confiarán en un […]
Por favor, si no lo encuentras, recuerda revisar la sección de correo no deseado
×
El correo electrónico con tu ebook está en camino
Te hemos enviado dos mensajes. Uno con el ebook solicitado y otro para confirmar tu correo electrónico y empezar a recibir la newsletter de BBVA API_Market
×
TRATAMIENTO DE DATOS PERSONALES
¿Quién es el Responsable del tratamiento de tus datos personales?
Banco Bilbao Vizcaya Argentaria, S.A. (“BBVA”), con domicilio social en Plaza de San Nicolás 4, 48005, Bilbao, España, C.I.F. A-48265169 Dirección de correo electrónico: contact.bbvaapimarket@bbva.com
¿Para qué y por qué utilizamos tus datos personales?
Para aquellas de las siguientes actividades para la que nos prestes tu consentimiento marcando la casilla correspondiente:
para la ejecución y gestión de tu solicitud, en concreto, recibir la newsletter de BBVA API_Market por medios electrónicos;
para enviarte comunicaciones comerciales, eventos y encuestas relativas a BBVA API_Market a la dirección de correo electrónico que nos hayas facilitado.
¿Durante cuánto tiempo conservaremos tus datos?
Conservaremos tus datos hasta que te des de baja para dejar de recibir nuestra newsletter o, en su caso, las comunicaciones comerciales, eventos y encuestas a las que te hayas suscrito. Tanto si te das de baja como si BBVA decide finalizar el servicio, tus datos serán eliminados.
¿Cómo puedo darme de baja para dejar de recibir la newsletter y/o comunicaciones de BBVA API_Market?
Puedes darte de baja en cualquier momento y sin necesidad de indicarnos ninguna justificación, remitiendo un correo electrónico a la siguiente dirección: contact.bbvaapimarket@bbva.com
¿A quién comunicaremos tus datos?
No cederemos tus datos personales a terceros, salvo que estemos obligados por una ley o que tú lo consientas previamente.
¿Cuáles son tus derechos cuando nos facilitas tus datos?
Consultar los datos personales que se incluyan en los ficheros de BBVA (derecho de acceso)
Solicitar la modificación de tus datos personales (derecho de rectificación)
Solicitar que no se traten tus datos personales (derecho de oposición)
Solicitar la supresión de tus datos personales (derecho de supresión)
Limitar el tratamiento de tus datos personales en los supuestos permitidos (limitación del tratamiento)
Recibir así como a transmitir a otra entidad, en formato electrónico, los datos personales que nos hayas facilitado y aquellos que se han obtenido de tu relación con BBVA (derecho de portabilidad)
Te responsabilizas de la veracidad de los datos personales que facilitas a BBVA y de mantenerlos debidamente actualizados.
Si consideras que no hemos tratado tus datos personales de acuerdo con la normativa, puedes contactar con el Delegado de Protección de Datos en la dirección dpogrupobbva@bbva.com
Puedes encontrar más información en el documento “Política de Protección de Datos Personales” de esta página web.
×
TRATAMIENTO DE DATOS PERSONALES
¿Quién es el Responsable del tratamiento de tus datos personales?
Banco Bilbao Vizcaya Argentaria, S.A. (“BBVA”), con domicilio social en Plaza de San Nicolás 4, 48005, Bilbao, España, C.I.F. A-48265169 Dirección de correo electrónico:contact.bbvaapimarket@bbva.com
¿Para qué y por qué utilizamos tus datos personales?
Para la ejecución y gestión de tu solicitud, en concreto, descargar el e-book/s solicitado.
BBVA informa te informa de que, salvo que indiques tu oposición enviando un correo a la siguiente dirección:contact.bbvaapimarket@bbva.com, BBVA podrá enviarte comunicaciones comerciales, encuestas y eventos relativas a productos y/o servicios de BBVA API Market a través de medios electrónicos.
¿Durante cuánto tiempo conservaremos tus datos?
Conservaremos tus datos mientras sea necesario para la gestión de la solicitud, así como para el envío de comunicaciones comerciales, eventos y/o, encuestas. BBVAconservará tus datos hasta que te des de baja para dejar de recibir dichas comunicaciones o, en su caso, hasta que finalice el servicio.Después, destruiremos tus datos.
¿Cómo puedo darme de baja para dejar de recibir newsletters y/o comunicaciones de BBVA API Market?
Puedes darte de baja en cualquier momento y sin necesidad de indicarnos ninguna justificación, remitiendo un correo electrónico a la siguiente dirección:contact.bbvaapimarket@bbva.com
¿A quién comunicaremos tus datos?
No cederemos tus datos personales a terceros, salvo que estemos obligados por una ley o que tú lo consientas previamente.
¿Cuáles son tus derechos cuando nos facilitas tus datos?
Consultar los datos personales que se incluyan en los ficheros de BBVA (derecho de acceso)
Solicitar la modificación de tus datos personales (derecho de rectificación)
Solicitar que no se traten tus datos personales (derecho de oposición)
Solicitar la supresión de tus datos personales (derecho de supresión)
Limitar el tratamiento de tus datos personales en los supuestos permitidos (limitación del tratamiento)
Recibir así como a transmitir a otra entidad, en formato electrónico, los datos personales que nos hayas facilitado y aquellos que se han obtenido de tu relación con BBVA (derecho de portabilidad)
Puedes ejercitar ante BBVA los citados derechos a través de la siguiente dirección:contact.bbvaapimarket@bbva.com
Te responsabilizas de la veracidad de los datos personales que facilitas a BBVA y de mantenerlos debidamente actualizados.
Si consideras que no hemos tratado tus datos personales de acuerdo con la normativa, puedes contactar con el Delegado de Protección de Datos de BBVA en la dirección dpogrupobbva@bbva.com
Puedes encontrar más información en el documento “Política de Protección de Datos Personales ” de esta página web.
Banco Bilbao Vizcaya Argentaria, S.A. titular de este portal utiliza cookies y/o tecnologías similares propias y de terceros para fines técnicos, de personalización, analíticos, de publicidad comportamental o publicidad relacionada con tus preferencias sobre la base de un perfil elaborado a partir de tus hábitos de navegación (por ejemplo, páginas visitadas). Si deseas obtener información más detallada, consulta nuestra Política de Cookies.
Panel de configuración de cookies
Este es el configurador avanzado de cookies propias y de terceros. Aquí puedes modificar parámetros que afectarán directamente a tu experiencia de navegación en esta web.
Cookies técnicas (necesarias)
Estas cookies son importantes para darte acceso seguro a zonas con información personal o para reconocerte cuando inicias sesión.
Denominación
Titular
Duración
Finalidad
gobp.lang
BBVA
1 mes
Preferencia de idioma
aceptarCookies
BBVA
1 año
Configuración Cookies aceptadas
_abck
BBVA
1 año
Ayuda a protegerse contra los ataques de sitios web maliciosos
bm_sz
BBVA
4 horas
Ayuda a protegerse contra los ataques de sitios web maliciosos
ADRUM_BTs
Salesforce Marketing Cloud
Sesión
Requerido para la supervisión del servicio, inherente al SFMC
ADRUM_BT1
Salesforce Marketing Cloud
Sesión
Requerido para la supervisión del servicio, inherente al SFMC
ADRUM_BTa
Salesforce Marketing Cloud
Sesión
Requerido para la supervisión del servicio, inherente al SFMC
ADRUM_BT
Salesforce Marketing Cloud
Sesión
Requerido para la supervisión del servicio, inherente al SFMC
xt_0d95e
Salesforce Marketing Cloud
Sesión
Recordar las preferencias del usuario (si las hay)
__s9744cdb192d044faa1bf201d29fafd1e
Salesforce Marketing Cloud
Sesión
Recordar las preferencias del usuario (si las hay)
wpml_browser_redirect_test
WPML
Sesión
Traducción de textos del portal
wp-wpml_current_language
WPML
24 horas
Traducción de textos del portal
Permiten medir, de forma anónima, el número de visitas o la actividad. Gracias a ellas podemos mejorar constantemente tu experiencia de navegación.
Dispones de una mejora continua en la experiencia de navegación.
Con tu selección no podemos ofrecerte una mejora continua en la experiencia de navegación.
Denominación
Titular
Duración
Finalidad
AMCV_***
Adobe Analytics
Sesión
ID de visitante único que se usan en las soluciones de Marketing Cloud
AMCVS_***
Adobe Analytics
2 años
ID de visitante único que se usan en las soluciones de Marketing Cloud
demdex (safari)
Adobe Analytics
180 días
Crear y almacenar identificadores únicos y persistentes
sessionID
Adobe Analytics
Sesión
Cookie interna de Launch usada para identificar al usuario
gpv_URL
Adobe Analytics
Sesión
plugin Adobe Analytics: getPreviousValue Capturar el valor de una determinada variable en la siguiente vista de página, en este caso la prop1
gpv_level1
Adobe Analytics
Sesión
Cookie utilizada para almacenar el levl1 del DataLayer de la página anterior.
gpv_pageIntent
Adobe Analytics
Sesión
Cookie utilizada para almacenar el pageIntent de la página anterior.
gpv_pageName
Adobe Analytics
Sesión
Cookie utilizada para almacenar el pagename de la página anterior.
aocs
Adobe Analytics
Sesión
Cookie que almacena los primeros valores recogidos al inicio de un proceso.
TTC
Adobe Analytics
Sesión
Cookie usada para almacenar el tiempo transcurrido entre el evento App Page Visit y App Completed.
TTCL
Adobe Analytics
Sesión
Cookie usada para almacenar el tiempo transcurrido entre el evento LogIn y App Completed.
s_cc
Adobe Analytics
Sesión
Determinar si las cookies están activas
s_hc
Adobe Analytics
Sesión
Cookie usada por Adobe con propositos de analítica.
s_ht
Adobe Analytics
Sesión
Cookie usada por Adobe con propositos de analítica.
s_nr
Adobe Analytics
2 años
Determinar el número de visitas de usuario
s_ppv
Adobe Analytics
Persistente
plugin Adobe Analytics: getPercentPageViewed Determinar el procentaje de página que visualiza un usuario
s_sq
Adobe Analytics
Sesión
Funcionalidades ClickMap/ActivityMap
s_tp
Adobe Analytics
Sesión
Cookie usada por Adobe con propositos de analítica.
s_visit
Adobe Analytics
2 años
Cookie usada por Adobe para saber cunado una sesión se ha iniciado.
Permiten que la publicidad que te mostramos sea personalizada y relevante para ti. Gracias a estas cookies no verás anuncios que no te interesen.
Dispones de una publicidad adaptada a ti y a tus preferencias.
Con tu selección pierdes la personalización de la publicidad, solo verás anuncios genéricos.
Denominación
Titular
Duración
Finalidad
OT2
VersaTag
90 días
Cookie de VersaTag usada para almacenar un id de usuario y el numero de visitas del usuario.
u2
VersaTag
90 días
Cookie de VersaTag en la que se almacena el ID del usuario
TargetingInfo 2
MediaMind
1 año
Cookie que sirve para asignar un número unico random que genera MediaMind.
Estas cookies están relacionadas con características generales como, por ejemplo, el navegador que utilizas.
Dispones de una experiencia y contenidos personalizados.
Con tu selección no podemos ofrecerte una navegación y contenidos personalizados.
Denominación
Titular
Duración
Finalidad
mbox
Adobe Target
9 días
Cookie usada por Adobe Target para hacer test de personalizacion de experencia del usuario.
×
Parece que estás navegando desde México, así que vamos a mostrarte el contenido personalizado para tu localización. Cambiar
Parece que estás navegando desde España, así que vamos a mostrarte el contenido personalizado para tu localización. Cambiar
Selecciona el país
Para poder acceder al área privada y sandbox correspondiente, selecciona el país de las APIs que quieres utilizar.
×
×
×
Preferencias de Navegación
Elige el país del que quieres que te mostremos su contenido por defecto.