La inteligencia artificial ha impregnado nuestra existencia cotidiana. Inicialmente fue evidente en ChatGPT y actualmente es visible en los anuncios de pizza y cerveza generados por IA. Si bien la IA puede no ser completamente confiable, parece que a veces nuestro propio tratamiento de la IA tampoco es completamente confiable.
El profesor asistente del Laboratorio Cold Spring Harbor (CSHL), Peter Koo, descubrió que los científicos que utilizan herramientas computacionales populares para interpretar las predicciones de IA están captando demasiado «ruido» o información adicional al analizar el ADN. Y encontró una manera de arreglarlo. Ahora, con solo unas pocas líneas de código nuevas, los científicos pueden obtener explicaciones más confiables de poderosas IA conocidas como redes neuronales profundas. Esto significa que pueden continuar persiguiendo rasgos de ADN genuinos. Estas características pueden indicar el próximo avance en la salud y la medicina. Pero los científicos no verán las señales si son ahogadas por demasiado ruido.
Entonces, ¿qué causa el ruido entrometido? Es una fuente misteriosa e invisible como la «materia oscura» digital. Físicos y astrónomos creen que la mayor parte del universo está lleno de materia oscura, un material que ejerce efectos gravitatorios pero que nadie ha visto todavía. Del mismo modo, Koo y su equipo descubrieron que los datos en los que se está entrenando la IA carecen de información crítica, lo que genera importantes puntos ciegos. Peor aún, estos puntos ciegos se tienen en cuenta al interpretar las predicciones de la IA sobre la función del ADN.
Koo dice: “La red neuronal profunda está incorporando este comportamiento aleatorio porque aprende una función en todas partes. Pero el ADN está solo en un pequeño subespacio de eso. Y hace mucho ruido. Y así mostramos que este problema en realidad introduce mucho ruido en una amplia variedad de modelos de IA prominentes”.
La materia oscura digital es el resultado de que los científicos tomen prestadas técnicas computacionales de la IA de visión artificial. Los datos de ADN, a diferencia de las imágenes, se limitan a una combinación de cuatro letras de nucleótidos: A, C, G, T. Pero los datos de imágenes en forma de píxeles pueden ser largos y continuos. En otras palabras, estamos alimentando la entrada de IA que no sabe cómo manejar adecuadamente.
Al aplicar la corrección computacional de Koo, los científicos pueden interpretar los análisis de ADN de la IA con mayor precisión.
Koo dice: “Terminamos viendo sitios que se vuelven mucho más nítidos y limpios, y hay menos ruido falso en otras regiones. Los nucleótidos individuales que se consideran muy importantes desaparecen repentinamente”.
Koo cree que la perturbación del ruido afecta más que los analizadores de ADN alimentados por IA. Él piensa que es una aflicción generalizada entre los procesos computacionales que involucran tipos de datos similares. Recuerda, la materia oscura está en todas partes. Afortunadamente, la nueva herramienta de Koo podría ayudar a sacar a los científicos de la oscuridad a la luz.
Referencia: «Corrección de interpretaciones basadas en gradientes de redes neuronales profundas para genómica» por Antonio Majdandzic, Chandana Rajesh y Peter K. Koo, 9 de mayo de 2023, biología genómica.
DOI: 10.1186/s13059-023-02956-3
El estudio fue financiado por los Institutos Nacionales de Salud y el Centro Simons de Biología Cuantitativa.