Ana Laguna: “El meu repte era intentar traduïr els plors del meu nadó quan naixés”

L’Ana Laguna té 31 anys i és llicenciada en Traducció i Interpretació, però la seva curiositat científica la va portar al món de la informàtica, l’estadística i la Intel·ligència Artificial. Avui combina el seu treball en el Dpt de Data & Analytics del BBVA amb el d’emprenedora d’un projecte propi: una app per a identificar el motiu del plor dels nadons gràcies a la IA. I, sí, la maternitat va jugar un paper important en aquesta última aventura.

 

1. Vas estudiar un MSc en Intel·ligència Artificial a la Universitat de París-Sorbonne i un Màster en Tecnologia de la Informació a la UAB. D’on ve la teva passió pel camp científic? Sempre t’havies volgut dedicar a això?

Des de petita sempre vaig tenir el cor partit entre la ciència i els idiomes. Pensant que l’última opció tindria més sortides vaig optar per estudiar Traducció i Interpretació. No obstant, continuava tenint molta curiositat per la part científica i, ja en l’última etapa de la carrera (i després d’una estada a Alemanya), vaig començar a descobrir l’opció de combinar el meu bagatge més lingüístic amb el món de la informàtica i l’estadística. Em va encantar! Va ser llavors quan vaig decidir combinar la meva carrera professional amb tots dos mons tan multidisciplinars.

La meva primera feina en una startup francesa va ser en temes de lingüística computacional, traducció automàtica, ensenyar a parlar a robots…Molt relacionat amb totes dues disciplines. El curiós és que els mateixos algoritmes que s’utilitzen per al traductor automàtic es poden utilitzar per a recomanar un anunci publicitari o detectar frau, com fem al BBVA. Tot això gràcies al famós Big Data i Intel·ligència Artificial de la qual tant es parla ara.

 

2. Des de fa 5 anys estàs treballant en el departament de Data & Analytics de BBVA. En què consisteix la teva feina?

Vaig començar treballant en la part de Customer Intelligence, en projectes de Màrqueting i Venda Digital. El nostre objectiu era entendre tot el procés de contractació d’un producte digital des que, per exemple, el client veia un anunci d’una hipoteca en un diari fins que signava el contracte. Per fer això vem construir Customer Journeys, models d’atribució de canals per a detectar quins eren més rendibles etc. L’any 2018 ens vem reestructurar i ara ens encarreguem de tota la part de CRM Intelligence: on, quan, com i què oferir als nostres clients entenent realment les seves necessitats i no les prioritats del banc.

3. Actualment, en l’àmbit empresarial a Espanya, se li dóna prou importància a l’anàlisi de dades? Disposem de sistemes suficientment avançats per a estudiar al detall el comportament dels consumidors o estem a la cua d’altres països?

Per desgràcia, fins fa ben poc estàvem a la cua en la majoria d’àmbits tecnològics o de recerca científica respecte a altres grans potències europees, en alguns camps amb gairebé un lustre de retard. Quan jo vaig començar en aquest món fa gairebé una dècada, a França ja estàven molt avançats i no ha estat fins fa uns 5 anys que s’ha començat a parlar d’això a Espanya. Tanmateix, avui dia, el boom del Big Data i la Ciència de Dades ja és tan important a Espanya com en qualsevol potència mundial i estem tan preparats com qualsevol dels nostres veïns. La qüestió és el temps que es dedica a projectes d’I+D, que a Espanya és més reduït que a altres països i això afecta en la publicació de recerques científiques.

 

4. Si no tenim mal entès, estàs esperant el teu segon fill…

Sí, en principi en una setmana naixerà i podré aconseguir un nou dataset 😉

 

5. Després del primer, va ser quan vas començar a gestar el teu projecte per a identificar el plor dels nadons. Com va sorgir la idea?

Com la majoria de pares esperant un bebè, entre moltes de les qüestions que ens fem està la de “l’entendré quan plori?”. Això era a finals de 2016 i en la recta final del meu primer embaràs. Vaig buscar apps que m’ajudessin a fer-ho i no vaig trobar-hi resultats satisfactoris (només existia una app xinesa amb ressenyes molt negatives que, per qüestions de prosòdia, probablement no valdria per a nens espanyols). Per tant, aquesta hipòtesi combinada amb el meu bagatge en Intel·ligència Artificial i Ciència de Dades em plantejava un interessant repte: intentar traduir els plors del meu propi nadó quan naixés.

En el passat ja havia treballat en el camp de la traducció automàtica, i el plor del bebè no deixa de ser un altre mitjà de comunicació oral de l’ésser humà. A més, si ja s’han creat algoritmes per a traduir el so de les balenes o identificar ocells i Jane Goodall comprèn el llenguatge dels ximpanzés, per què no intentar traduir les necessitats d’un nounat emprant un algoritme d’IA? Encara que a priori pugui semblar una idea una miqueta despietada, com a Data Scientist immersa en el món de la IA estic convençuda que igual que aquest, aconseguirem molts altres avanços que encara ens costa imaginar i que avui dia, clar, sonen a mare guillada. “Com pot ser que deixi plorar al seu nadó per a un experiment?”.

Foto: Picsea_Unsplash

6. En diverses entrevistes afirmes que el teu repte era crear una app molt similar a Shazam (aplicació que reconeix cançons) però aplicat a l’àmbit del plor dels nadons. Per on es comença a crear una app així?

El primer pas és la recopilació de dades fiables, necessitem una bona base de dades sobre la qual entrenar el nostre model. Una vegada que comptem amb dades etiquetades (en aquest cas plors i la causa del mateixos), “ensenyarem” al nostre algoritme (en el nostre cas una xarxa neuronal artificial) a reconèixer els diferents tipus de sons depenent de l’etiqueta (fam, son, ‘carantonyes’, empipament, dolor).

Plor de son

 

Plor de ‘carantonyes’

 

Plor de fam

 

7. Quin paper juguen les dades i la IA en aquest sentit?

En el món de la Ciència de Dades la dada és la nostra pedra en brut a polir. Evidentment, el resultat final diferirà depenent si la matèria primera és un diamant o un quars. Aquesta xarxa neuronal artificial aprendrà del que nosaltres li ensenyem: si les dades que li donem no són de qualitat, el nostre algoritme final tampoc  ho serà.

 

8. Comentes que l’aplicació es basa en algoritmes i patrons. En què consisteix aquesta lògica?

El món de la IA és una rèplica del funcionament del cervell humà. En concret, les tècniques de Deep Learning o xarxes neuronals que aquí s’utilitzen són el més avançat en IA avui dia i ho són, curiosament, perquè es basen en la manera en què funcionen les neurones del cervell humà.

 

9. L’app encara no es troba al mercat perquè necessites més mostres de plors de nadons per a acabar d’afinar-la. De moment, has creat l’ONG ‘Sota Good Data’ amb l’objectiu d’anar recaptant àudios de plors de bebès i oferir altres vies de col·laboració a empreses o particulars. Com podem, com a mare o pare, participar en la donació de plors?

Simplement emplenant el formulari disponible al web, indicant la raó del plor, nacionalitat dels pares, mesos del nounat (0-6) i sexe. Estem pensant altres models perquè la recopilació sigui més senzilla.

 

10. Quants plors estimes que necessites abans de poder llançar l’app al mercat? Quan calcules tenir-la operativa?

L’ideal seria aconseguir tenir-la per a finals de 2019 o principis de 2020, però depèn molt de la quantitat, qualitat i versatilitat dels àudios que rebem per a aconseguir que l’algoritme sigui prou robust i pugui generalitzar correctament. 1000 registres seria el punt mínim de partida i ara només en portem uns 150 en 3 setmanes.

 

11. És possible, actualment, reconèixer el plor d’un nadó de qualsevol país? O serà necessari crear bancs de dades (plors) per a cadascun tenint en compte l’idioma?

És una de les hipòtesis a validar, per aquest motiu sol·licitem la nacionalitat dels pares en els plors recopilats. Hi ha diversos estudis que confirmen que per qüestions de prosòdia (branca de la lingüística que estudia l’accent i l’entonació d’un idioma) el que sent un bebè des que està en el ventre i comença a escoltar -a partir de la setmana 25 aproximadament- varia molt depenent de la cultura i l’idioma i, per tant, el seu plor també és molt diferent. Si això és així, una app xinesa no serviria per a Espanya i viceversa, però potser l’espanyola sí que val per a Sud-amèrica… we will see ;).

 

12. I a Espanya, s’aprecien diferències entre el plor d’un bebè d’una CCAA o d’una altra?

Sincerament no ho he contrastat estadísticament parlant, però a priori no s’aprecien diferències remarcables dins d’Espanya. No obstant això, entre països és increïble la diferència de plor, per exemple, d’una mostra costariqueña respecte d’una francesa. Tots dos nadons ploren per fam, però en la primera el plor és de desesperació absoluta i l’última sembla un gatet.

 

13. Actualment el sistema d’algoritmes diferencia entre plors de fam, son, dolor i ‘carantonyes’, al ser els més rellevants. Més endavant, tens previst incorporar-ne més variants? Quins?

En aquesta primera fase ens centrem en necessitats bàsiques del nounat de 0 a 6 mesos. Són plors per necessitat primària. A més, a partir del setè o vuitè mes els bebès comencen a desenvolupar altres sentiments com la por o la separació de la mare que no tenen res a veure amb la seva etapa de nounat.

14. En un futur proper, si acabes tenint un banc de dades prou gran i actualitzat, serà possible, per exemple, analitzar i comparar el grau de felicitat o de nutrició dels bebès segons el seu país o zona de residència, cultura, educació, situació familiar…?

Seria genial arribar a aquests nivells de comprensió i, fins i tot, ajudar en la detecció precoç de certs trastorns que ja es perceben des de nounats a través del plor (per exemple, l’autisme). A poc a poc…

 

15. Per a acabar, des de So Good Data  treballeu també en altres àrees que poden tenir un impacte social positiu com contaminació, transport col·laboratiu, salut, història o conscienciació ciutadana sobre la IA. S’estan materialitzant, actualment, en projectes concrets? Quins?

Hi ha diversos projectes en marxa sobre la contaminació d’una ciutat i la seva possible relació amb malalties EPOC entre els ciutadans. Uns altres més relacionats amb economia o història encara els estem engegant. Ara estem començant alguns a Mèxic i l’Argentina, però encara estem en fase exploratòria de fonts de dades disponibles.
També estem anant a col·legis de primària i instituts de secundària a donar xerrades als alumnes sobre AI, machine learning, ciència de dades… com a sortides professionals relacionades amb el sector STEM, sobretot potenciant la motivació de les nenes per a reduir la bretxa del sector.

 

Per |2019-03-13T12:24:07+00:00març 13th, 2019|Entrevistes|0 Comentaris

T’animes a comentar?