Para predecir que sucederá un terremoto o se producirán las condiciones necesarias para la aparición de una pandemia no se necesita analizar datos masivos, sino que es posible hacerlo con un sistema avanzado de aprendizaje automático junto con muestreo secuencial.
En un estudio que difunde Nature Computational Science, investigadores de la Universidad de Brown y del MIT recuerdan que, cuando se trata de predecir desastres provocados por eventos extremos (terremotos, pandemias u olas rebeldes que podrían destruir estructuras costeras), el modelado informático se enfrenta a un desafío casi insuperable.
Desde un punto de vista meramente estadístico, estos eventos son tan raros que simplemente no hay suficientes datos sobre ellos para usar modelos predictivos con el fin de pronosticar con precisión cuándo sucederán.
Pero este equipo de investigadores opina que no tiene por qué ser así. En este innovador estudio, describen cómo combinaron algoritmos estadísticos, que necesitan menos datos para hacer predicciones precisas y eficientes, con una poderosa técnica de aprendizaje automático desarrollada en la Universidad de Brown.
Así, consiguieron predecir escenarios, probabilidades y, a veces, incluso la línea de tiempo de sucesos raros a pesar de la falta de registro histórico sobre ellos. “Tienes que darte cuenta de que estos son eventos estocásticos”, enfatiza George Karniadakis, profesor de matemáticas aplicadas e ingeniería en Brown y autor del estudio.
“Un estallido de pandemia como Covid-19, un desastre ambiental en el Golfo de México, un terremoto, enormes incendios forestales en California, una ola de 30 metros que vuelca un barco, son eventos raros. No tenemos suficientes muestras del pasado para predecirlos en el futuro. La pregunta que abordamos en el documento es: ¿Cuál es la mejor información posible que podemos usar para minimizar la cantidad de datos que necesitamos?”.
Aprendizaje activo
Los investigadores encontraron la respuesta en una técnica de muestreo secuencial denominado aprendizaje activo. Estos tipos de algoritmos estadísticos no solo pueden analizar la entrada de datos en ellos, sino que pueden aprender de la información para etiquetar nuevos puntos de datos relevantes que son igual o incluso más importantes para el resultado que se está calculando. En el nivel más básico, permiten hacer más con menos.
Eso es fundamental para el modelo de aprendizaje automático que los investigadores usaron en el estudio. Llamado DeepOnet, el modelo es un tipo de red neuronal artificial, que utiliza nodos interconectados en capas sucesivas que imitan aproximadamente las conexiones realizadas por las neuronas en el cerebro humano.
DeepOnet es un operador neuronal profundo. Es más avanzado y poderoso que las típicas redes neuronales artificiales porque en realidad son dos redes neuronales en una, procesando datos en dos redes paralelas. Esto le permite analizar conjuntos gigantes de datos y escenarios a una velocidad vertiginosa para escupir conjuntos igualmente masivos de probabilidades una vez que aprende lo que está buscando.
El cuello de botella con esta poderosa herramienta, especialmente en lo que se refiere a eventos raros, es que los operadores neuronales profundos necesitan toneladas de datos para estar capacitados para realizar cálculos que sean efectivos y precisos.
Predecir un terremoto, pandemia, huracán…
En este estudio, se ha demostrado que combinado con técnicas de aprendizaje activo, puede entrenarse sobre qué parámetros o precursores buscar que conduzcan al evento desastroso que se analiza, incluso cuando no hay muchos datos.
“El objetivo no es tomar todos los datos posibles y ponerlos en el sistema, sino buscar de manera proactiva eventos raros. Puede que no tengamos muchos ejemplos del evento real, pero podemos tener esos precursores. A través de las matemáticas, los identificamos, lo que junto con hechos reales nos ayudarán a entrenar a este operador ávido de datos”, explica Karniadakis.
En su estudio, los investigadores aplicaron el enfoque para identificar parámetros y diferentes rangos de probabilidades de picos peligrosos durante una pandemia, encontrar y predecir un terremoto y estimar cuándo un barco se partirá por la mitad.
Así, descubrieron que su nuevo método superó los esfuerzos de modelado más tradicionales y creen que presenta un marco que puede descubrir y predecir de manera eficiente todo tipo de eventos raros.
En este trabajo se describe cómo los científicos deberían diseñar futuros experimentos para que puedan minimizar los costos y aumentar la precisión de los pronósticos. Ahora, George Karniadakis está trabajando con científicos ambientales para usar su innovador método para pronosticar eventos climáticos, entre ellos, huracanes.