11/3/25 · Salut

"Les bases de dades sintètiques acceleren la innovació i milloren la privacitat dels pacients"

Ferran Prados, investigador de la UOC en bioinformàtica aplicada al cervell

Ferran Prados

Guardonat amb el Premi Interdisciplinari de Recerca de la UOC (Foto: UOC)

Ferran Prados és un destacat investigador en el camp de la bioinformàtica aplicada al cervell. Des del NeuroADaS Lab de la Universitat Oberta de Catalunya (UOC), grup de recerca tecnològica que treballa per avançar en el coneixement del cervell, ha liderat una investigació publicada a Nature sobre la generació de dades sintètiques per avançar en la recerca sobre la fatiga crònica. Prados, professor dels Estudis d'Informàtica, Multimèdia i Telecomunicació de la UOC, parlarà d'aquest projecte, guanyador del Premi Interdisciplinari de Recerca de la UOC, en un acte de la Setmana del Cervell, que tindrà lloc a la Universitat el proper 12 de març.

 

Quin és l'objectiu de la vostra recerca sobre dades sintètiques? 

L'objectiu principal és desenvolupar mètodes per generar dades sintètiques de salut. En el cas de la nostra investigació, són dades relacionades amb tests de qualitat de vida per a pacients amb fatiga crònica. Són tests que requereixen un temps considerable per ser completats, i sovint els pacients no poden respondre'ls íntegrament a causa del seu estat de salut. El fet que hi hagi poques dades per a la investigació dificulta el desenvolupament de nous tractaments, biomarcadors i altres avenços clínics.

Per abordar aquest repte, les dades sintètiques poden ser una solució valuosa. Mitjançant una xarxa neuronal i a partir de tests ja completats, és possible aprendre els patrons de resposta dels pacients i generar respostes sintètiques que siguin estadísticament coherents amb les reals. Això permet enriquir les bases de dades i millorar la qualitat de la investigació sense comprometre la privacitat dels pacients.

Els resultats demostren que és possible generar conjunts de dades sintètiques que preserven la utilitat per a la investigació i l'anàlisi, alhora que es garanteix la protecció de dades sensibles dels individus.

 

Quins beneficis aporten aquest tipus de dades a la recerca mèdica? 

Nosaltres no només generem bases de dades sintètiques, sinó que les utilitzem per completar bases de dades reals amb l'objectiu de millorar la mida de la mostra i, així, reforçar la validesa dels estudis. Aquest enfocament permet optimitzar els conjunts de dades disponibles, especialment en casos en què no hi ha prou informació.

Les bases de dades sintètiques milloren la privacitat, ja que permeten compartir dades sense exposar informació personal identificable. També faciliten un accés més ampli a les dades, fet que beneficia els investigadors que, d'altra manera, podrien trobar restriccions a causa de les estrictes normatives sobre protecció de dades. A més, contribueixen a accelerar la innovació, tot proporcionant conjunts de dades per entrenar models d'intel·ligència artificial, fins i tot en situacions en què les dades reals són escasses, com en el cas de les malalties poc conegudes o de difícil accés.

 

Quines limitacions tenen?

La qualitat de les dades és fonamental, ja que, si les dades reals utilitzades per generar-ne de sintètiques són de baixa qualitat, els resultats poden no ser fiables. Així, aquests models poden reproduir biaixos presents en les dades originals, fet que pot perpetuar errors o desigualtats en la investigació. Finalment, la regulació continua sent un repte. En alguns casos, l'ús de dades sintètiques en estudis clínics no està ben vist i requereix una validació addicional per part de les autoritats competents abans de poder ser utilitzades en la pràctica clínica.

 

Una aplicació interessant de les dades sintètiques és la seva capacitat de simular imatges mèdiques. 

Al NeuroADaS Lab treballem en aquesta línia amb imatges generades sintèticament per simular estructures com el nervi òptic, les dents o les lesions d'esclerosi múltiple. 

Aquest procés es pot dur a terme mitjançant diferents tècniques. D'una banda, nosaltres fem servir mètodes bayesians, és a dir, que parteixen d'etiquetes per generar dades sintètiques amb una base física i morfològica sòlida. De l'altra, es podrien utilitzar xarxes generatives adversàries (GANs), que aprenen a partir d'imatges mèdiques reals i en creen de noves mantenint-ne les característiques essencials. Aquestes imatges sintètiques tenen un gran valor per a l'entrenament i l'optimització de les xarxes neuronals, i permeten que siguin més eficients en tasques de segmentació i anàlisi d'imatges mèdiques. 

 

Quines tècniques d'intel·ligència artificial utilitzeu en aquesta recerca?

N'hi ha diverses, entre elles les xarxes generatives adversàries (GANs), que són models que consten de dues xarxes neuronals que competeixen entre si per generar dades sintètiques realistes. També utilitzem l'anomenat aprenentatge profund (deep learning), que fa servir xarxes neuronals amb múltiples capes per modelar patrons complexos en les dades. I els models probabilístics, aproximacions que estimen la distribució de les dades per generar-ne de noves amb característiques similars.

 

A banda de les malalties neurològiques, és possible fer servir aquests models per a altres patologies?

Sí, els models de generació de dades sintètiques es poden aplicar a una àmplia gamma de patologies. Per exemple, en l'estudi de les malalties cardiovasculars, oncològiques i infeccioses, entre d'altres, per crear conjunts de dades que ajudin a desenvolupar nous tractaments. 

 

Quines diries que són les eines tecnològiques que aportaran més avenços al coneixement del cervell?

Les tècniques avançades d'intel·ligència artificial, el deep learning aplicat a la neuroimatge, la computació quàntica i la bioinformàtica seran clau en el futur de la neurociència. A més, tecnologies com la neuromodulació no invasiva, les interfícies cervell-màquina i la connectòmica (estudi de les connexions del sistema nerviós) ens permetran comprendre millor les xarxes neuronals i desenvolupar noves estratègies per al tractament de malalties.

 

Creus que la bioinformàtica pot ser un punt d'inflexió en el diagnòstic i el tractament de les malalties en un futur?

Sens dubte, i té el potencial de ser-ho en un futur immediat. La bioinformàtica combina les ciències biològiques amb tècniques computacionals per analitzar i interpretar grans volums de dades biomèdiques, i ha esdevingut fonamental en la recerca i la pràctica mèdica actual. 

A la UOC tenim un equip d'investigadors altament qualificats que treballen en medicina de precisió des de diferents perspectives, amb l'objectiu de desenvolupar solucions innovadores per avançar en el diagnòstic i el tractament personalitzat de diverses patologies. La nostra recerca s'enfoca a millorar la comprensió de les malalties i oferir estratègies terapèutiques adaptades a cada pacient, tot aprofitant el potencial de la bioinformàtica i la intel·ligència artificial.

 

També està transformant la manera de desenvolupar nous fàrmacs.

Aquest és un àmbit clau, i a la UOC hi ha un grup que fa recerca enfocada en aquest camp. 

Les noves eines computacionals permeten identificar dianes terapèutiques, simular l'eficàcia de nous compostos i optimitzar el descobriment de medicaments. Tot això reduint costos i aconseguint que els fàrmacs arribin als pacients més aviat.

A més, no podem oblidar l'anàlisi genòmica, que ens permet identificar mutacions genètiques associades a diverses malalties per, d'aquesta manera, poder-les detectar de manera precoç i personalitzar el tractament al pacient.

 

En quins altres projectes esteu treballant que poden tenir un impacte en els pacients?

D'una banda, treballem en un projecte que busca millorar la segmentació de lesions en ressonàncies magnètiques de pacients amb esclerosi múltiple. Hem desenvolupat una tècnica innovadora que genera dades sintètiques, tot simulant l'evolució real de les lesions davant de qualsevol contrast d'imatge, i d'aquesta manera millorem el model. 

Un altre projecte se centra en la segmentació del nervi òptic de pacients amb esclerosi múltiple, una estructura clau en el seguiment de la malaltia i que recentment s'ha incorporat com a factor diagnòstic de la malaltia. Estem desenvolupant solucions per facilitar als metges la interpretació de la morfologia i l'estat d'aquesta estructura.

D'altra banda, estem analitzant tant amb diferents tipus de tests com amb eines de neuroimatge la capacitat protectora del bilingüisme per al cervell.

 

Quina de les vostres investigacions està més a prop d'integrar-se en el sistema sanitari?

Incorporar eines de programari a la pràctica clínica no és fàcil a causa de la regulació vigent actual. El projecte d'anàlisi de lesions en pacients d'esclerosi múltiple s'utilitzarà aviat en assajos clínics internacionals sobre aquesta malaltia i ajudarà els investigadors a detectar i quantificar les lesions de manera més eficient, tot millorant el diagnòstic i personalitzant els tractaments a cada pacient. 

 

Parlem de la Setmana del Cervell. Per què creus que és important un esdeveniment d'aquest tipus?

Des del NeuroADaS Lab veiem la Setmana del Cervell com una activitat clau de divulgació per apropar la neurociència a la societat, conscienciar sobre la importància de la salut cerebral i divulgar els avenços en investigació que estem portant a terme. Amb aquest esdeveniment promovem el diàleg entre científics, metges i ciutadans, essencial per millorar la comprensió del públic dels trastorns neurològics i també per remarcar la necessitat d'invertir en recerca per millorar la qualitat de vida de les persones afectades.

Contacte de premsa

També et pot interessar

Més llegits

Veure més sobre Salut