Ana Laguna: “Mi reto era intentar traducir los llantos de mi bebé cuando naciese”

Ana Laguna tiene 31 años y es licenciada en Traducción e Interpretación pero su curiosidad científica la condujo al mundo de la informática, la estadística y la Inteligencia Artificial. Hoy combina su trabajo en el Dpto de Data & Analytics del BBVA con el de emprendedora de un proyecto propio: una app para identificar el motivo del llanto de los bebés gracias a la IA. Y, sí, la maternidad jugó un papel importante en esta última aventura.

 

1. Estudiaste un MSc en Inteligencia Artificial en la Universidad de París-Sorbonne y un Máster en Tecnología de la Información en la UAB. ¿De dónde viene tu pasión por el campo científico? ¿Siempre te habías querido dedicar a ello?

Desde niña siempre tuve el corazón partido entre la ciencia y los idiomas. Pensando que la última opción tendría más salidas opté por estudiar Traducción e Interpretación. Sin embargo, seguía con mucha curiosidad por la parte científica y ya en la última etapa de la carrera (y tras una estancia en Alemania) empecé a descubrir la opción de combinar mi bagaje más lingüístico con el mundo de la informática y la estadística. ¡Me encantó! Fue a partir de entonces cuando decidí combinar mi carrera profesional con ambos mundos tan multidisciplinares.

Mi primer trabajo en una startup francesa fue en temas de lingüística computacional, traducción automática, enseñar a hablar a robots…Muy relacionado con ambas disciplinas. Lo curioso es que los mismos algoritmos que se usan para el traductor automático se pueden usar para recomendar un anuncio publicitario o detectar fraude, como hacemos en BBVA. Todo ello gracias al famoso Big Data e Inteligencia Artificial de la que tanto se habla ahora.

 

2. Desde hace 5 años estás trabajando en el departamento de Data & Analytics de BBVA. ¿En qué consiste tu trabajo?

Empecé trabajando en la parte de Customer Intelligence, en proyectos de Marketing y Venta Digital. Nuestro objetivo era entender todo el proceso de contratación de un producto digital desde que, por ejemplo, el cliente veía un anuncio de una hipoteca en un periódico hasta que firmaba el contrato. Para ello construimos Customer Journeys, modelos de atribución de canales para ver cuales eran más rentables etc. Este 2018 nos reestructuramos y ahora nos encargamos de toda la parte de CRM Intelligence: dónde, cuándo, cómo y qué ofrecer a nuestros clientes entendiendo realmente sus necesidades y no las prioridades del banco.

 

3. Actualmente, en el ámbito empresarial en España, ¿se le da la importancia que merece al análisis de datos? ¿Disponemos de sistemas suficientemente avanzados para estudiar al detalle el comportamiento de los consumidores o estamos a la cola de otros países?

Por desgracia, hasta hace bien poco estábamos a la cola en la mayoría de ámbitos tecnológicos o de investigación científica con respecto a otras grandes potencias europeas, en algunos campos con casi un lustro de retraso. Cuando yo empecé en este mundo hace ya casi una década, en Francia ya estaban muy avanzados y no ha sido hasta hace unos 5 años que se ha empezado a hablar de esto en España. Sin embargo, a día de hoy, el boom del Big Data y la Ciencia de Datos ya es tan importante en España como en cualquier potencia mundial y estamos tan preparados como cualquiera de nuestros vecinos. La cuestión es el tiempo que se dedica a proyectos de I+D, que en España es más reducido que otros países y esto afecta a la publicación de investigaciones científicas.

 

4. Si no tenemos mal entendido, estás esperando tu segundo hijo…

Sí, en principio en una semana nacerá y podré conseguir un nuevo dataset 😉

 

5. Tras el primero, fue cuando empezaste a gestar tu proyecto para identificar el llanto de los bebés. ¿Cómo surgió la idea?

Como la mayoría de padres esperando un bebé, entre muchas de las cuestiones que nos hacemos está la de “¿lo entenderé cuando llore?”. Esto era finales de 2016 y en la recta final de mi primer embarazo. Busqué apps que me ayudasen a hacerlo y no encontré resultados satisfactorios (sólo existía una app china con muy malos comentarios que, por cuestiones de prosodia, probablemente no valdría para niños españoles). Por tanto, esta hipótesis combinada con mi bagaje en Inteligencia Artificial y ciencia de datos me planteaba un interesante reto: intentar traducir los llantos de mi propio bebé cuando naciese.

En el pasado ya había trabajado en el campo de la traducción automática, y el llanto del bebé no deja de ser otro medio de comunicación oral del ser humano. Además, si ya se han creado algoritmos para traducir el sonido de las ballenas o identificar aves y Jane Goodall comprende el lenguaje de los chimpancés, ¿por qué no intentar traducir las necesidades de un recién nacido usando un algoritmo de IA?

Aunque a priori pueda parecer una idea un tanto despiadada, como data scientist inmersa en el mundo de la IA estoy convencida de que igual que éste, lograremos otros muchos avances que aún nos cuesta imaginar y que a día de hoy, claro, suenan a madre chiflada. “¿Pero cómo deja llorar a su bebé para un experimento?”.

 

6. En varias entrevistas afirmas que tu reto era crear una app muy similar a Shazam (aplicación que reconoce canciones) pero aplicado al ámbito del lloro de los bebés. ¿Por dónde se empieza a crear una app así?

El primer paso es la recopilación de datos fiables, necesitamos una buena base de datos sobre la que entrenar nuestro modelo. Una vez que contamos con datos etiquetados (en este caso llantos y la causa del mismos),  “enseñaremos” a nuestro algoritmo (en nuestro caso una red neuronal artificial) a reconocer los distintos tipos de sonidos dependiendo de la etiqueta (hambre, sueño, mimos, molesto, dolor).

 

7. ¿Qué papel juegan los datos y la IA en este sentido?

En el mundo de la Ciencia de Datos el dato es nuestra piedra en bruto a pulir. Evidentemente, el resultado final diferirá dependiendo si la materia prima es un diamante o un cuarzo. Esa red neuronal artificial aprenderá de lo que nosotros le enseñemos: si los datos que le enseñamos no son de calidad, nuestro algoritmo final tampoco será lo suficientemente robusto.

 

8. Comentas que la aplicación se basa en algoritmos y patrones. ¿En qué consiste esta lógica?

El mundo de la IA es una réplica del funcionamiento del cerebro humano. En concreto, las técnicas de Deep Learning o redes neuronales que aquí se utilizan son lo más avanzado en IA a día de hoy y lo son, curiosamente, porque se basan en el modo en el que funcionan las neuronas del cerebro humano.

Llanto sueño

 

Llanto mimos

 

Llanto hambre

 

9. La app todavía no se encuentra en el mercado, pues necesitas más muestras de llantos de bebé para acabar de afinarla. De momento, has creado la ONG ‘So Good Data’ con el objetivo de ir recabando audios de llantos de bebés y ofrecer otras vías de colaboración a empresas o particulares. ¿Cómo podemos, como madre o padre, participar en la donación de llantos?

Simplemente rellenando el formulario disponible en la web, indicando la razón del llanto, nacionalidad de los padres, meses del bebé (0-6) y sexo. Estamos pensando otros modelos para que la recopilación sea más sencilla.

 

10. ¿Cuántos llantos de bebés estimas que necesitas antes de poder lanzar la app al mercado? ¿Cuándo calculas tenerla operativa?

Lo ideal sería conseguir tenerla para finales de 2019 o principios de 2020, pero depende de mucho de la cantidad y versatilidad de audios que recibamos para conseguir que el algoritmo sea lo suficientemente robusto y pueda generalizar correctamente.  1000 registros sería el punto mínimo de partida, sólo llevamos unos 150 en 3 semanas.

 

11. ¿Es posible, actualmente, reconocer el llanto de un bebé de cualquier país? ¿O será necesario crear bancos de datos (llantos) para cada uno teniendo en cuenta el idioma?

Es una de las hipótesis a validar, de ahí que se solicite la nacionalidad de los papás en los llantos recopilados. Hay varios estudios que confirman que por cuestiones de prosodia (rama de la lingüística que estudia el acento y la entonación de un idioma) lo que oye un bebé desde que está en el vientre y comienza a escuchar a partir de la semana 25 aproximadamente varía mucho dependiendo de la cultura y el idioma, y por tanto, su llanto a posteriori también es muy diferente.  Si esto es así, una app china no valdría para España y viceversa, pero quizás la española sí valga para Sudamérica… we will see ;).

 

12. Y en España, ¿se aprecian diferencias entre el lloro de un bebé de una CCAA o de otra?

Sinceramente no lo he contrastado estadísticamente hablando, pero a priori no se aprecian diferencias remarcables dentro de España. Sin embargo entre países es increíble, la diferencia de llanto de una muestra costariqueña con una francesa es sorprendente. Ambos bebés lloran por hambre, pero en la primera el llanto es de desesperación absoluta y la última parece un gatito.

 

13. Actualmente el sistema de algoritmos diferencia entre hambre, sueño, dolor y mimos, al ser los más relevantes. Más adelante, ¿tienes previsto incorporar más variantes? ¿cuáles?

En esta primera fase, nos centramos en necesidades básicas del recién nacido de 0 a 6 meses. Son llantos por necesidad primaria. Además, a partir del séptimo u octavo mes los bebés empiezan a desarrollar otros sentimientos como el miedo o la separación de la mamá que no tienen nada que ver con su etapa de recién nacido.

 

14. En un futuro próximo, si acabas teniendo un banco de datos suficientemente grande y actualizado, ¿será posible, por ejemplo, analizar y comparar el grado de felicidad o de nutrición de los bebés según su país o zona de residencia, cultura, educación, situación familiar…?

Sería genial llegar a esos niveles de comprensión, o incluso a detección precoz de ciertos trastornos que ya se perciben desde recién nacidos a través del llanto (por ejemplo, el autismo). Poco a poco…

 

15. Para acabar, desde So Good Data, trabajáis también en otras áreas que puedan tener un impacto social positivo como contaminación, transporte colaborativo, salud, historia o concienciación ciudadana sobre la IA. ¿Se están materializando, actualmente, en proyectos concretos? ¿Cuáles?

Hay varios proyectos en marcha sobre la contaminación de una ciudad y su posible relación con enfermedades EPOC entre los ciudadanos. Otros más relacionados con economía o historia aún arrancando. Ahora estamos empezando algunos en México y Argentina, pero aún estamos en fase exploratoria de fuentes de datos disponibles.

Además, estamos yendo a colegios de primaria e institutos de secundaria a dar charlas a los alumnos sobre AI, machine learning, ciencia de datos… como salidas profesionales relacionadas con el sector STEM, sobre todo potenciando la motivación de las niñas para reducir la brecha del sector.

Por |2019-03-13T11:15:07+00:00marzo 13th, 2019|Entrevistas|0 Comentarios

¿Te apetece comentar?