Articles

Secuenciación de próxima generación

secuenciación de próxima generación

Introducción

la secuenciación del genoma humano se completó en 2003, después de 13 años de colaboración internacional e inversión de USD 3 mil millones. El proyecto del genoma humano utilizó la secuenciación de Sanger (aunque muy optimizada), el principal método de secuenciación de ADN desde su invención en la década de 1970.

hoy en día, la demanda de secuenciación está creciendo exponencialmente, con grandes cantidades de ADN genómico que necesitan ser analizadas de forma rápida, barata y precisa., Gracias a las nuevas tecnologías de secuenciación conocidas colectivamente como secuenciación de próxima generación, ahora es posible secuenciar todo un genoma humano en cuestión de horas.

secuenciación de Sanger y secuenciación de próxima generación

el principio detrás de la secuenciación de próxima generación (NGS) es similar al de la secuenciación de Sanger, que se basa en la electroforesis capilar. La hebra genómica está fragmentada, y las bases de cada fragmento se identifican mediante señales emitidas cuando los fragmentos se ligan contra una hebra plantilla.,el método Sanger requería pasos separados para la secuenciación, la separación (por electroforesis) y la detección, lo que dificultaba la automatización de la preparación de la muestra y era limitado en rendimiento, escalabilidad y resolución. El método NGS utiliza la secuenciación basada en matrices que combina las técnicas desarrolladas en la secuenciación Sanger para procesar millones de reacciones en paralelo, lo que resulta en una velocidad y un rendimiento muy altos a un costo reducido., Los proyectos de secuenciación del genoma que tardaron muchos años con los métodos Sanger ahora se pueden completar en horas con NGS, aunque con longitudes de lectura más cortas (el número de bases que se secuencian a la vez) y menos precisión.,

Los métodos de secuenciación de ADN de próxima generación tienen tres pasos generales:

  • Preparación de la Biblioteca: las bibliotecas se crean utilizando fragmentación aleatoria del ADN, seguida de ligadura con enlazadores personalizados
  • amplificación: la biblioteca se amplifica utilizando métodos de amplificación clonal y PCR
  • secuenciación: el ADN se secuenciaes utilizando uno de varios enfoques diferentes

preparación de la Biblioteca

En primer lugar, el ADN se fragmenta por sonicación (excitación usando ultrasonido) para crear hebras más pequeñas., Los adaptadores (piezas cortas de doble cadena de ADN sintético) se ligan a estos fragmentos con la ayuda de la ligasa de ADN, una enzima que se une a las hebras de ADN. Los adaptadores permiten que la secuencia se vincule a una contraparte complementaria.

Los adaptadores se sintetizan de manera que un extremo es ‘pegajoso’ mientras que el otro es ‘romo’ (no cohesivo) con el fin de unir el extremo romo al ADN con el extremo romo. Esto podría conducir al problema potencial de emparejamiento de bases entre moléculas y, por lo tanto, la formación de dímeros., Para evitar esto, se utiliza la estructura química del ADN, ya que la ligadura tiene lugar entre los extremos 3′-OH y 5′-p. Al eliminar el fosfato del extremo pegajoso del adaptador y, por lo tanto, crear un extremo 5′-OH en su lugar, la ligasa de ADN es incapaz de formar un puente entre los dos terminales (Figura 1).,

Figura 1 / Preparación de la biblioteca de secuenciación de próxima generación

para que la secuenciación sea exitosa, los fragmentos de la biblioteca deben agruparse espacialmente en colonias de PCR o ‘polonías’ como se les conoce convencionalmente, que consisten en muchas copias de un fragmento de biblioteca en particular. Dado que estas polonías están unidas de manera plana, las características de la matriz pueden manipularse enzimáticamente en paralelo. Este método de construcción de bibliotecas es mucho más rápido que el anterior Procedimiento Intensivo de recolección de colonias y E., la clonación de coli se utiliza para aislar y amplificar el ADN para la secuenciación de Sanger, sin embargo, esto es a expensas de la longitud de lectura de los fragmentos.

amplificación

Se requiere amplificación de biblioteca para que la señal recibida del secuenciador sea lo suficientemente fuerte como para ser detectada con precisión. Con la amplificación enzimática, fenómenos tales como’ sesgo ‘y’ duplicación ‘ pueden ocurrir llevando a la amplificación preferencial de ciertos fragmentos de la biblioteca. En cambio, Hay varios tipos de proceso de amplificación que utilizan PCR para crear un gran número de grupos de ADN.,

emulsión PCR

El aceite de emulsión, las perlas, la mezcla de PCR y el ADN de la biblioteca se mezclan para formar una emulsión que conduce a la formación de micro pocillos (Figura 2).

Figura 2 / emulsión PCR

para que el proceso de secuenciación sea exitoso, cada micro pocillo debe contener un cordón con una hebra de ADN (aproximadamente el 15% de los micro pocillos son de esta composición). La PCR luego desnaturaliza el fragmento de la biblioteca que conduce a dos hebras separadas, una de las cuales (la hebra inversa) se recubre a la cuenta., El ADN recocido es amplificado por la polimerasa a partir de la cuenta hacia el sitio de imprimación. La hebra inversa original se desnaturaliza y se libera de la cuenta solo para volver a recocirse en la cuenta para dar dos hebras separadas. Ambos se amplifican para dar dos hebras de ADN unidas a la cuenta. El proceso se repite a lo largo de 30-60 ciclos que conducen a grupos de ADN. Esta técnica ha sido criticada por su naturaleza lenta, ya que requiere muchos pasos (formar y romper la emulsión, amplificación de PCR, enriquecimiento, etc.) a pesar de su amplio uso en muchas de las plataformas NGS., También es relativamente ineficiente, ya que solo alrededor de dos tercios de los micro reactores de emulsión contendrán realmente un grano. Por lo tanto, se requiere un paso adicional para separar los sistemas vacíos que conducen a más inexactitudes potenciales.

PCR Puente

la superficie de la célula de flujo está densamente recubierta con cebadores que son complementarios a los cebadores Unidos a los fragmentos de la biblioteca de ADN (Figura 3). El ADN se une entonces a la superficie de la célula al azar, donde se expone a reactivos para la extensión basada en la polimerasa., En la adición de nucleótidos y enzimas, los extremos libres de las hebras individuales de ADN se adhieren a la superficie de la célula a través de cebadores complementarios, creando estructuras de puente. Las enzimas luego interactúan con los puentes para hacerlos de doble cadena, de modo que cuando se produce la desnaturalización, dos fragmentos de ADN de una sola cadena se unen a la superficie en estrecha proximidad. La repetición de este proceso conduce a grupos clonales de hebras idénticas localizadas. Con el fin de optimizar la densidad de los conglomerados, las concentraciones de reactivos deben monitorizarse muy de cerca para evitar el hacinamiento.,

Figure 3 / Bridging PCR

Sequencing

varias empresas han desarrollado métodos competitivos de secuenciación de próxima generación.

454 pirosecuenciación

La pirosecuenciación se basa en el principio de «secuenciación por síntesis», donde se sintetiza una cadena complementaria en presencia de la enzima polimerasa (Figura 4). En contraste con el uso de dideoxinucleótidos para terminar la amplificación de la cadena (como en la secuenciación de Sanger), la pirosecuenciación detecta la liberación de pirofosfato cuando se agregan nucleótidos a la cadena de ADN., Inicialmente utiliza la técnica de PCR de emulsión para construir las polonías necesarias para la secuenciación y elimina la hebra complementaria. A continuación, un cebador de secuenciación ssDNA hibrida hasta el final de la hebra (región de unión del cebador), luego los cuatro dNTPs diferentes se hacen fluir secuencialmente Dentro y fuera de los pozos sobre las polonías. Cuando el dNTP correcto se incorpora enzimáticamente en la hebra, causa la liberación de pirofosfato. En presencia de ATP sulfurilasa y adenosina, el pirofosfato se convierte en ATP., Esta molécula de ATP se utiliza para la conversión catalizada por luciferasa de luciferina a oxiluciferina, que produce luz que se puede detectar con una cámara. La intensidad relativa de la luz es proporcional a la cantidad de base añadida (es decir, un pico del doble de la intensidad indica que se han añadido dos bases idénticas en sucesión).,

Figure 4 | 454 Pyrosequencing

Pyrosequencing, desarrollado por 454 Life Sciences, fue uno de los primeros éxitos de la secuenciación de próxima generación; de hecho, 454 Life Sciences produjo el primer secuenciador de próxima generación disponible comercialmente. Sin embargo, el método fue eclipsado por otras tecnologías y, en 2013, los nuevos propietarios Roche anunciaron el cierre de 454 Life Sciences y la interrupción de la plataforma de pirosecuenciación 454.,

Ion torrent semiconductor sequencing

Ion torrent sequencing uses a «sequencing by synthesis» approach, in which a new DNA strand, complementary to the target strand, is synthesized one base at a time. Un chip semiconductor detecta los iones de hidrógeno producidos durante la polimerización del ADN (Figura 5).

Después de la formación de polonía usando emulsión PCR, el fragmento de la biblioteca de ADN se inunda secuencialmente con cada nucleósido trifosfato (dNTP), como en la pirosecuenciación. El dNTP es entonces incorporado a la nueva hebra si es complementario al nucleótido en la hebra objetivo., Cada vez que se agrega un nucleótido con éxito, se libera un ion de hidrógeno, y es detectado por el sensor de pH del secuenciador. Al igual que en el método de pirosecuenciación, si se agrega más de uno del mismo nucleótido, el cambio en la intensidad de pH/señal es correspondientemente mayor.

la Figura 5 | Ion Torrent semiconductor de secuenciación

Ion torrent secuenciación es la primera técnica comercial no utilizar la fluorescencia y la cámara de exploración; por lo tanto, es más rápido y más barato que muchos de los otros métodos., Desafortunadamente, puede ser difícil enumerar el número de bases idénticas agregadas consecutivamente. Por ejemplo, puede ser difícil diferenciar el cambio de pH para un homorepeat de longitud 9 a uno de longitud 10, lo que dificulta la decodificación de secuencias repetitivas.

secuenciación por ligadura (sólido)

El sólido es un método enzimático de secuenciación que utiliza ADN ligasa, una enzima ampliamente utilizada en Biotecnología por su capacidad para ligar cadenas de ADN de doble cadena (Figura 6)., La emulsión PCR se utiliza para inmovilizar / amplificar una región de unión de cebador ssDNA (conocida como adaptador) que se ha conjugado con la secuencia objetivo (es decir, la secuencia que se va a secuenciar) en un cordón. Estas perlas se depositan en una superficie de vidrio – una alta densidad de perlas se puede lograr que a su vez, aumenta el rendimiento de la técnica.

una vez que se ha producido la deposición de perlas, se hibrida una imprimación de longitud N al adaptador, luego las perlas se exponen a una biblioteca de sondas de 8-mer que tienen diferentes colorantes fluorescentes en el extremo 5′ y un grupo hidroxilo en el extremo 3′., Las Bases 1 y 2 son complementarias a los nucleótidos a secuenciar mientras que las bases 3-5 son degeneradas y las bases 6-8 son bases de inosina. Solo una sonda complementaria hibridará a la secuencia objetivo, adyacente a la imprimación. La ligasa de ADN se utiliza para unir la sonda 8-mer a la imprimación. Un enlace de fosforotioato entre las bases 5 y 6 permite que el tinte fluorescente sea escindido del fragmento usando iones de plata., Esta escisión permite medir la fluorescencia (se utilizan cuatro tintes fluorescentes diferentes, todos los cuales tienen diferentes espectros de emisión) y también genera un grupo de 5′-fosfato que puede someterse a una ligadura adicional. Una vez que se completa la primera ronda de secuenciación, el producto de extensión se funde y luego se realiza una segunda ronda de secuenciación con una imprimación de longitud N−1. Muchas rondas de secuenciación utilizando cebadores más cortos cada vez (es decir, N−2, n-3, etc.) y la medición de la fluorescencia garantiza que el objetivo se secuencie.,

debido al método de secuenciación de dos bases (ya que cada base se secuenció efectivamente dos veces), La técnica SOLiD es altamente precisa (al 99.999% con un sexto primer, es la más precisa de las plataformas de segunda generación) y también económica. Puede completar una sola ejecución en 7 días y en ese tiempo puede producir 30 Gb de datos. Desafortunadamente, su principal desventaja es que las longitudes de lectura son cortas, por lo que no es adecuado para muchas aplicaciones.,

Figure 6/Sequencing by ligation

Reversible terminator sequencing (Illumina)

Reversible terminator sequencing differs from the traditional Sanger method in that, instead of terminating the primer extension irreversibly using dideoxynucleotide, modified nucleotides are used in reversible termination. Mientras que muchas otras técnicas utilizan PCR de emulsión para amplificar los fragmentos de la biblioteca de ADN, la terminación reversible utiliza PCR puente, mejorando la eficiencia de esta etapa del proceso.,

los terminadores reversibles se pueden agrupar en dos categorías: terminadores reversibles 3′-o-bloqueados y terminadores reversibles 3′-desbloqueados.

3′-o-bloqueados terminadores reversibles

el mecanismo utiliza un enfoque de secuenciación por síntesis, alargando la imprimación de una manera gradual. En primer lugar, los cebadores de secuenciación y las plantillas se fijan a un soporte sólido. El soporte está expuesto a cada una de las cuatro bases de ADN, que tienen un fluoróforo diferente unido (a la base nitrogenada) además de un grupo 3′-o-azidometil (Figura 7).,

Figura 7 / estructura del azidometil dNTP marcado fluorescentemente utilizado en la secuenciación de Illumina

solo la base correcta se recuece al objetivo y posteriormente se liga a la imprimación. El soporte sólido es entonces fotografiado y los nucleótidos que no han sido incorporados son lavados y la rama fluorescente es escindida usando TCEP (Tris (2-carboxietil)fosfina). TCEP también elimina el grupo 3 ‘- o-azidometil, regenerando 3 ‘ – OH, y el ciclo puede repetirse (Figura 8) .,

Figura 8 | secuenciación Reversible de terminadores

3 ‘- terminadores reversibles desbloqueados

el grupo de terminación reversible de 3′-terminadores reversibles desbloqueados está vinculado tanto al grupo de base como al grupo de fluorescencia, que ahora actúa como parte del grupo de terminación, así como un reportero. Este método difiere del método de los terminadores reversibles 3 ‘- o-blocked en tres formas: en primer lugar, la posición 3’no está bloqueada (i. e., la base tiene libre 3’-OH); el fluoróforo es el mismo para las cuatro bases; y cada base modificada fluye secuencialmente en lugar de al mismo tiempo.

la principal desventaja de estas técnicas radica en su mala longitud de lectura, que puede ser causada por uno de dos fenómenos. Con el fin de evitar la incorporación de dos nucleótidos en un solo paso, un bloque se pone en su lugar, sin embargo, en el caso de no adición de bloques debido a una mala síntesis, las hebras pueden quedar fuera de fase creando ruido que limita la longitud de lectura. El ruido también se puede crear si el fluoróforo se une o elimina sin éxito., Estos problemas prevalecen en otros métodos de secuenciación y son los principales factores limitantes para la longitud de lectura.

Esta técnica fue pionera por Illumina, con sus plataformas HiSeq y MiSeq. HiSeq es el más barato de los secuenciadores de segunda generación con un costo de 0 0.02 por millón de bases. También tiene una alta salida de datos de 600 Gb por ejecución que tarda alrededor de 8 días en completarse.

secuenciación de tercera generación

desde entonces se ha desarrollado una nueva cohorte de técnicas utilizando secuenciación de molécula única y secuenciación única en tiempo real, eliminando la necesidad de amplificación clonal., Esto reduce los errores causados por la PCR, simplifica la preparación de la biblioteca y, lo más importante, proporciona una longitud de lectura mucho mayor utilizando plataformas de mayor rendimiento. Los ejemplos incluyen la plataforma de Pacific Biosciences que utiliza la secuenciación SMRT (single molecule real time) para dar longitudes de lectura de alrededor de mil bases y Helicos Biosciences que utiliza la secuenciación de una sola molécula y, por lo tanto, no requiere amplificación antes de la secuenciación. Oxford Nanopore Technologies está desarrollando actualmente nanoporos basados en silicio que están sujetos a una corriente que cambia a medida que el ADN pasa a través del poro., Se prevé que este sea un método rápido de secuenciación de ADN de alto rendimiento, aunque primero deben abordarse problemas como la desaceleración del transporte a través del poro.

secuenciación modificaciones epigenéticas

así como la secuenciación de última generación permitió la secuenciación genómica a gran escala, recientemente se ha puesto de manifiesto que el código genético no contiene toda la información necesaria para los organismos. Las modificaciones epigenéticas a las bases del ADN, en particular la 5-metilcitosina, también transmiten información importante.,

todas las plataformas de secuenciación de segunda generación dependen, como la secuenciación de Sanger, de la PCR y, por lo tanto, no pueden secuenciar bases de ADN modificadas. De hecho, tanto la 5-metilcitosina como la 5-hidroximetilcitosina son tratadas como citosina por las enzimas involucradas en la PCR; por lo tanto, la información epigenética se pierde durante la secuenciación.,

secuenciación de bisulfito

la secuenciación de bisulfito explota la diferencia en la reactividad de la citosina y la 5-metilcitosina con respecto al bisulfito: la citosina es deaminada por el bisulfito para formar uracilo (que se lee Como T cuando se secuenció), mientras que la 5-metilcitosina no es reactiva (es decir, se lee como C). Si se realizan dos series de secuenciación en paralelo, una con tratamiento de bisulfito y otra sin, las diferencias entre las salidas de las dos series indican citosinas metiladas en la secuencia original., Esta técnica también se puede utilizar para dsDNA, ya que después del tratamiento con bisulfito, las hebras ya no son complementarias y se pueden tratar como ssDNA.

La 5-Hidroximetilcitosina, otra modificación epigenética importante, reacciona con el bisulfito para formar citosina-5-metilsulfonato (que se lee como C cuando se secuencian). Esto complica un poco las cosas, y significa que la secuenciación de bisulfito no se puede utilizar como un verdadero indicador de metilación en sí misma.,

secuenciación oxidativa del bisulfito

la secuenciación oxidativa del bisulfito añade un paso químico de la oxidación, que convierte 5-hydroxymethylcytosine a 5-formylcytosine usando perruthenate del potasio, KRuO4, antes del tratamiento del bisulfito. La 5-Formilcitosina es deformilada y desaminada para formar uracilo mediante tratamiento con bisulfito. Ahora, son necesarias tres series de secuenciación separadas para distinguir la citosina, la 5-metilcitosina y la 5-hidroximetilcitosina (ver Figura 9).,

Figura 9 / secuenciación de modificaciones epigenéticas utilizando bisulfito

las aplicaciones de secuenciación de próxima generación

la secuenciación de próxima generación ha permitido a los investigadores recopilar grandes cantidades de datos de secuenciación genómica., Esta tecnología tiene una plétora de aplicaciones, tales como: diagnóstico y comprensión de enfermedades complejas; secuenciación del genoma completo; análisis de modificaciones epigenéticas; secuenciación mitocondrial; secuenciación del transcriptoma-comprender cómo la expresión alterada de variantes genéticas afecta a un organismo; y secuenciación del exoma − se cree que las mutaciones en el exoma contienen hasta el 90% de las mutaciones en el genoma humano, lo que conduce a la enfermedad., Se han utilizado técnicas de ADN para identificar y aislar genes responsables de ciertas enfermedades, y proporcionar la copia correcta del gen defectuoso conocido como «terapia génica».

una gran área de enfoque en la terapia génica es el tratamiento del cáncer: un método potencial sería introducir un ARN antisentido (que impide específicamente la síntesis de una proteína dirigida) en el oncogén, que se activa para formar células tumorales. Otro método se llama «terapia génica suicida», que introduce genes para matar las células cancerosas de forma selectiva., Se conocen muchos códigos genéticos para proteínas y enzimas tóxicas, y la introducción de estos genes en las células tumorales provocaría la muerte celular. La dificultad en este método es asegurar un sistema de entrega muy preciso para evitar la destrucción de células sanas.estos métodos son posibles gracias a la secuenciación para analizar los genomas tumorales, lo que permite a los expertos médicos adaptar la quimioterapia y otros tratamientos contra el cáncer de manera más efectiva a la composición genética única de sus pacientes, revolucionando las etapas diagnósticas de la medicina personalizada.,

a medida que el costo de la secuenciación del ADN disminuye, se generalizará, lo que trae una serie de problemas. La secuenciación produce grandes volúmenes de datos, y hay muchos desafíos computacionales asociados con el procesamiento y almacenamiento de los datos. También hay cuestiones éticas, como la propiedad del ADN de un individuo cuando el ADN es secuenciado. Los datos de secuenciación de ADN deben almacenarse de forma segura, ya que existe la preocupación de que los grupos de seguros, los corredores de hipotecas y los empleadores puedan usar estos datos para modificar las cotizaciones de seguros o distinguir entre los candidatos., La secuenciación también puede ayudar a averiguar si un individuo tiene un mayor riesgo de una enfermedad en particular, pero si el paciente está informado o si hay una cura para la enfermedad es otro tema en conjunto.

Ahmadian, A.; Svahn, H.; Masivamente Paralelo. Plataformas de secuenciación utilizando tecnologías Lab on a Chip. Chip De Laboratorio, 11, 2653 − 2655 (2011).

Balasubramanian, S.; secuenciación de ácidos nucleicos: de la química a la medicina. Chem. Commun. 47, 7281 − 7286 (2011).

Mardis, E.; Next-Generation DNA Sequencing Methods. Annu. Modif. De La Genómica Hum. Genet. 9, 387 − 402 (2008).

Mardis, E.,; Plataformas de secuenciación de ADN de próxima generación. Annu. Apo. Anal. Chem. 6, 287-303 (2013).

Shendure, J.; Ji, H.; Next-Generation DNA Sequencing. NAT. Biotecnología. 26, 10 1135-1144 (2008).

vea también

nuestro libro en línea gratuito de ácidos nucleicos contiene información sobre todos los aspectos de la química y biología de los ácidos nucleicos.