Alumni
Máster universitario Ciencia de Datos
«La ventaja de comenzar pronto en la ciencia de datos es poderlo empezar todo»
Tu perfil de LinkedIn revela que la informática ha sido siempre tu foco de atención. ¿Qué te llevó a ella?
En primaria, cuando profesionales del tema vinieron a clase, me empezó a gustar. Acabé cursando un grado medio, un grado superior y luego la carrera de Ingeniería Informática en la Universidad de Barcelona. Un día, el profesor con el que hice el trabajo final de grado, Jordi Vitrià, nos comentó una noticia que decía que ser científico de datos era la profesión más sexi del siglo XXI. Y lo corroboro [se ríe]. Las asignaturas relacionadas con este tema me encantaban: predecir, sacar conclusiones, mostrar, ver. Así que decidí que quería ser data scientist, un científico de datos.
Parece, efectivamente, una profesión con bastante futuro, y para conseguirlo cursaste el máster de la UOC.
Sí. Pero al buscar trabajo me di cuenta de que en España aún se demandan pocos científicos de datos. En cambio, fuera de España hay un montón de ofertas. En Estados Unidos la mayoría de grandes empresas ya busca este perfil y en Europa, más de la mitad. En España, las pocas que pedían un científico de datos en realidad buscaban un experto en inteligencia de negocio (business intelligence).
¿Y cuál es la diferencia?
Un experto en inteligencia de negocio intenta mostrar los datos del pasado de una empresa para obtener una decisión. En cambio, un científico de datos también puede hacer eso, pero su objetivo es llegar un paso más allá. A partir de datos poco relacionados entre sí, encuentra nuevas soluciones, objetivos o técnicas. Es mirar hacia el futuro.
Habrá que tener paciencia...
De hecho, en la empresa en la que estoy, hago un mitad y mitad. Al entrar, propuse dedicar la mitad de mi tiempo a programación y la otra mitad a ciencia de datos (dar valor a los datos de los que disponen, analizar el pasado y mirar hacia el futuro: qué cosas puede mejorar la empresa, cómo llevar mejor a las personas…).
Incluso tiene repercusión en el tema de los recursos humanos, entonces.
Sí, sobre cualquier tema.
Eres pionero en tu empresa. Eso está bien, ¿no?
La ventaja de comenzar pronto es poderlo empezar todo, porque no hay nada. Me gusta construirlo.
Tu trabajo de máster toca un tema muy de actualidad: cómo afrontar los mensajes tóxicos por vía de la inteligencia artificial.
Lo que analizamos es el lenguaje natural de las personas. Fue en el contexto de una competición de Google. Bajo unos datos o patrones podías llegar a saber qué tipo de persona podía tender a expresar mensajes tóxicos. La idea era cómo evitar equivocarse en esas predicciones.
¿A qué conclusión llegaste?
La conclusión final es que hay muchísimos algoritmos que tratan sobre el lenguaje natural, pero pienso que la mejor solución es mezclar algoritmos para conseguir verificar que lo haces bien.
Inteligencia artificial colectiva…
Sí. A fin de cuentas, la inteligencia artificial aprende de la nada a partir de los datos que tienes. Y, entre todos, hacen la mejor predicción.
Todo ello, ¿para luchar contra las malas consecuencias de las nuevas tecnologías?
Más que hablar de bien o mal, el debate está en hasta qué punto debe llegar la libertad de expresión. A día de hoy, Facebook o Twitter pueden eliminar un mensaje en el momento en el que alguien lo reporta como tóxico. No suele haber una persona detrás, sino que ya acostumbra a hacerlo una máquina de inteligencia artificial.
En tu trabajo de máster recuerdas que el odio es una bomba fácil de activar y difícil de controlar. ¿Algún ejemplo?
Imagina, en Twitter, que una persona importante publica un comentario en el que no critica potencialmente a nadie, pero un sector de personas se siente ofendido por el mensaje. Y se genera odio en esa red, y cada vez más.
¿Cómo lo arreglamos?
Si una inteligencia artificial es capaz de detectar que un mensaje es potencialmente tóxico, podría ser adecuado que te avise antes de apretar el botón para publicarlo, y así conseguir que te preguntes si estás seguro de hacerlo. Ese paso intermedio podría ser una forma de conseguir que alguien se lo piense dos veces, una forma de prevenir.
¿Cómo puede evolucionar la ciencia de datos a diez años vista?
Actualmente, podríamos decir que la inteligencia artificial es un niño. Dentro de diez años, las redes neuronales, un tipo de inteligencia artificial, pueden llegar a aprender mucho más. Y creo que se notará mucho en el ámbito sanitario. Por ejemplo, esta tecnología puede fijarse en datos de todas las personas que tienen una enfermedad y aprender de ellos. Sabemos que hay un medicamento que cura solo a una parte de las personas, pero no sabemos por qué, y hay un dato al cual los profesionales no han dado importancia, pongamos el grupo sanguíneo. Analizando datos, la inteligencia artificial puede encontrar que el motivo es el grupo sanguíneo.
¿Y en el ámbito más doméstico?
Quizás puede ayudarnos en temas de reconocimiento de voz; por ejemplo poder dar instrucciones a los electrodomésticos a medida que escuchan y aprenden sobre nuestra manera de hablar. Todo es lenguaje natural, tanto el escrito como el hablado. Y todo es cuestión de tiempo y ganas.
Y tú, ¿hacia dónde vas?
Me encanta tratar con grandes volúmenes de datos y sacarles valor. Datos son imágenes, textos, números. Me da igual. Me gusta coger los datos que no se usan y darles un valor de verdad. Creo que esto es una profesión de futuro y que en España mucha gente estará trabajando en este tema. Y recordemos que la ciencia de datos toca la inteligencia artificial, pero también las matemáticas, la ciencia computacional y ser experto en el sector en el que trabajes. Y también debemos plantearnos si la inteligencia de las máquinas es realmente inteligencia.
¿Está condenada a ir de la mano de las personas y no sola, como en las películas?
Es ciencia ficción. Llegaremos muy lejos, pero con lo que tenemos ahora, lo de las películas es ciencia ficción.