Un nuevo estudio publicado en la revista Nature Biotechnology ha utilizado el aprendizaje automático para acelerar el desarrollo de la edición primaria, una prometedora tecnología de edición de genes. El estudio analizó miles de secuencias de ADN introducidas en el genoma utilizando editores líderes y utilizó los datos para entrenar un algoritmo de aprendizaje automático para diseñar la mejor solución para un defecto genético determinado. Al utilizar el aprendizaje automático para agilizar el proceso de creación de correcciones genéticas, esta investigación podría ayudar a acelerar los esfuerzos para llevar la edición maestra al uso clínico.
Los investigadores del Instituto Wellcome Sanger han desarrollado una nueva herramienta para predecir las posibilidades de insertar con éxito una secuencia de ADN editada genéticamente en el genoma de una célula, utilizando una técnica conocida como edición primaria. Una evolución de la tecnología de edición de genes CRISPR-Cas9, la edición primaria tiene un enorme potencial para tratar enfermedades genéticas en humanos, desde el cáncer hasta la fibrosis quística. Pero hasta ahora, los factores que determinan el éxito de las ediciones no se comprenden bien.
El estudio, publicado hoy (16 de febrero de 2023) en la revista Nature Biotechnology, evaluó miles de secuencias de ADN diferentes introducidas en el genoma utilizando editores líderes. Luego, esos datos se usaron para entrenar un algoritmo de aprendizaje automático para ayudar a los investigadores a diseñar la mejor solución para un defecto genético determinado, lo que promete acelerar los esfuerzos para llevar el problema principal a la clínica.
Desarrollada en 2012, CRISPR-Cas9 fue la primera tecnología de edición de genes fácilmente programable.[1] Estas ‘tijeras moleculares’ permitieron a los investigadores cortar el ADN en cualquier posición del genoma para eliminar, agregar o alterar secciones de la secuencia de ADN. La tecnología se ha utilizado para estudiar qué genes son importantes para diversas afecciones, desde el cáncer hasta enfermedades raras, y para desarrollar tratamientos que corrigen o desactivan mutaciones o genes dañinos.
Los editores de base fueron una innovación floreciente en CRISPR-Cas9 y fueron llamados «lápices moleculares» por su capacidad para reemplazar bases de ADN individuales. Las herramientas de edición de genes más nuevas creadas en 2019 se denominan editores principales. Su capacidad para realizar operaciones de búsqueda y reemplazo directamente en el genoma con un alto grado de precisión los ha llevado a ser denominados «procesadores de texto moleculares».
El objetivo final de estas tecnologías es corregir mutaciones dañinas en los genes de las personas.[2] Más de 16.000 variantes de deleción pequeña, en las que se ha eliminado una pequeña cantidad de bases de ADN del genoma, se han relacionado causalmente con la enfermedad. Esto incluye la fibrosis quística, en la que el 70% de los casos son causados por la eliminación de solo tres bases de ADN. En 2022, las células T editadas se usaron con éxito para tratar la leucemia de un paciente en el que la quimioterapia y el trasplante de médula ósea habían fallado.
En este nuevo estudio, los investigadores del Instituto Wellcome Sanger diseñaron 3604 secuencias de ADN de una a 69 bases de ADN de longitud. Estas secuencias se insertaron en tres líneas celulares humanas diferentes usando diferentes sistemas de entrega de editor principal en varios contextos de reparación de ADN.[3] Después de una semana, se secuenció el genoma de las células para ver si las ediciones fueron exitosas o no.
Se evaluó la eficiencia de inserción, o tasa de éxito, de cada secuencia para determinar los factores comunes en el éxito de cada edición. La longitud de la secuencia se consideró un factor clave, al igual que el tipo de mecanismo de reparación del ADN implicado.
Jonas Koeppel, primer autor del estudio del Instituto Wellcome Sanger, dijo: «Las variables involucradas en las ediciones primarias exitosas del genoma son muchas, pero estamos comenzando a descubrir qué factores aumentan las posibilidades de éxito. La longitud de la cuerda es uno de esos factores, pero no es tan simple como que cuanto más larga sea la cuerda, más difícil será insertarla. También encontramos que un tipo de reparación de ADN impidió la inserción de secuencias cortas, mientras que otro tipo de reparación impidió la inserción de secuencias largas”.
Para ayudar a dar sentido a estos datos, los investigadores recurrieron al aprendizaje automático para detectar patrones que determinan el éxito de la inserción, como la longitud y el tipo de reparación del ADN involucrada. Una vez entrenado con los datos existentes, el algoritmo se probó con nuevos datos y se descubrió que predecía con precisión el éxito de la inserción.
Juliane Weller, una de las primeras autoras del estudio del Instituto Wellcome Sanger, dijo: «En pocas palabras, varias combinaciones diferentes de tres letras de ADN pueden codificar el mismo aminoácido en una proteína. Es por eso que hay cientos de formas de editar un gen para obtener el mismo resultado a nivel de proteína. Al introducir estas posibles ediciones de genes en un algoritmo de aprendizaje automático, creamos un modelo para clasificarlas según la probabilidad de que funcionen. Esperamos que esto elimine gran parte del proceso de prueba y error involucrado en la edición principal y acelere el progreso considerablemente”.
Los próximos pasos del equipo serán modelar todas las enfermedades genéticas humanas conocidas para comprender mejor si se pueden corregir mediante la edición primaria y cómo. Esto involucrará a otros grupos de investigación del Instituto Sanger y sus colaboradores.
el medico Leopold Parts, autor principal del estudio del Instituto Wellcome Sanger, dijo: «El potencial de la edición primaria para mejorar la salud humana es enorme, pero primero debemos comprender las formas más fáciles, eficientes y seguras de realizar estas ediciones. Se trata de entender las reglas del juego, que los datos y la herramienta resultantes de este estudio nos ayudarán a hacer”.
Los grados
- Más información sobre CRISPR-Cas9 está disponible en el sitio web de YourGenome.
- El ensayo clínico CRISPR-Cas9 más avanzado es un tratamiento para la enfermedad de células falciformes. Los glóbulos rojos de los pacientes se editan para activar el gen que produce la hemoglobina fetal que, a diferencia de la hemoglobina adulta, no se ve afectada por la dañina mutación de las células falciformes. Puede encontrar más información sobre los ensayos clínicos actuales aquí.
- Todas las formas de tecnología de edición de genes se basan en los mecanismos intrínsecos de reparación del ADN de la célula para volver a unir las hebras de ADN después de la edición. Las líneas celulares humanas son colonias de células humanas cultivadas en el laboratorio y se utilizan para modelar sistemas biológicos complejos.
Referencia: «Determinantes de reparación de secuencias y ADN para escribir secuencias cortas en el genoma usando edición primaria» por Jonas Koeppel, Juliane Weller, Elin Madli Peets, Ananth Pallaseni, Ivan Kuzmin, Uku Raudvere, Hedi Peterson, Fabio Giuseppe Liberante y Leopold Parts, 16 Febrero 2023, Nature Biotechnology.
DOI: 10.1038/s41587-023-01678-y