Articles

Séquençage de nouvelle génération

séquençage de nouvelle génération

Introduction

le séquençage du génome humain a été achevé en 2003, après 13 ans de collaboration internationale et d’investissement de 3 milliards de dollars. Le Projet Génome Humain a utilisé le séquençage Sanger (bien que fortement optimisé), la principale méthode de séquençage de l’ADN depuis son invention dans les années 1970.

Aujourd’hui, la demande de séquençage augmente de façon exponentielle, de grandes quantités d’ADN génomique devant être analysées rapidement, à moindre coût et avec précision., Grâce aux nouvelles technologies de séquençage connues sous le nom de séquençage de nouvelle génération, il est désormais possible de séquencer un génome humain entier en quelques heures.

séquençage Sanger et séquençage de nouvelle génération

le principe du séquençage de nouvelle génération (NGS) est similaire à celui du séquençage Sanger, qui repose sur l’électrophorèse capillaire. Le brin génomique est fragmenté et les bases de chaque fragment sont identifiées par des signaux émis lorsque les fragments sont ligaturés contre un brin de gabarit.,
la méthode Sanger nécessitait des étapes distinctes pour le séquençage, la séparation (par électrophorèse) et la détection, ce qui rendait difficile l’automatisation de la préparation des échantillons et elle était limitée en débit, en évolutivité et en résolution. La méthode NGS utilise le séquençage basé sur un réseau qui combine les techniques développées dans le séquençage Sanger pour traiter des millions de réactions en parallèle, ce qui se traduit par une vitesse et un débit très élevés à un coût réduit., Les projets de séquençage du génome qui ont pris de nombreuses années avec les méthodes Sanger peuvent maintenant être achevés en quelques heures avec NGS, bien qu’avec des longueurs de lecture plus courtes (le nombre de bases séquencées à la fois) et moins de précision.,

Les méthodes de prochaine génération de séquençage de L’ADN comportent trois étapes générales:

  • préparation de la bibliothèque: les bibliothèques sont créées à l’aide d’une fragmentation aléatoire de L’ADN, suivie d’une ligature avec des lieurs personnalisés
  • Amplification: la Bibliothèque est amplifiée à l’aide de méthodes d’amplification clonale et sonication (excitation à l’aide d’ultrasons) pour créer des brins plus petits., Les adaptateurs (courts morceaux d’ADN synthétique à double brin) sont ensuite ligatés à ces fragments à l’aide de L’ADN ligase, une enzyme qui joint les brins d’ADN. Les adaptateurs permettent à la séquence de devenir liée à une contrepartie complémentaire.

    Les adaptateurs sont synthétisés de sorte qu’une extrémité soit « collante » tandis que l’autre est « émoussée » (non cohésive) en vue de joindre l’extrémité émoussée à L’ADN émoussé. Cela pourrait conduire au problème potentiel de l’appariement des bases entre les molécules et donc de la formation de dimères., Pour éviter cela, la structure chimique de L’ADN est utilisée, car la ligature a lieu entre les extrémités 3′-OH et 5′-p. En enlevant le phosphate de l’extrémité collante de l’adaptateur et donc en créant une extrémité 5′-OH à la place, L’ADN ligase est incapable de former un pont entre les deux termini (Figure 1).,

    Figure 1/Préparation de la bibliothèque du séquençage de nouvelle génération

    pour que le séquençage réussisse, les fragments de bibliothèque doivent être regroupés spatialement dans des colonies de PCR ou « polonies » comme on les appelle classiquement, qui consistent en de nombreuses copies d’un fragment de bibliothèque particulier. Étant donné que ces polonies sont attachées de manière plane, les caractéristiques du réseau peuvent être manipulées enzymatiquement en parallèle. Cette méthode de construction de la Bibliothèque est beaucoup plus rapide que la procédure précédente de cueillette de colonies et E., le clonage coli utilisé pour isoler et amplifier L’ADN pour le séquençage Sanger, cependant, cela se fait au détriment de la longueur de lecture des fragments.

    Amplification

    L’amplification de la Bibliothèque est nécessaire pour que le signal reçu du séquenceur soit suffisamment fort pour être détecté avec précision. Avec l’amplification enzymatique, des phénomènes tels que « polarisation » et « duplication » peuvent se produire conduisant à une amplification préférentielle de certains fragments de bibliothèque. Au lieu de cela, il existe plusieurs types de processus d’amplification qui utilisent la PCR pour créer un grand nombre de grappes D’ADN.,

    emulsion PCR

    l’huile D’émulsion, les billes, le mélange PCR et l’ADN de la bibliothèque sont mélangés pour former une émulsion qui conduit à la formation de micro puits (Figure 2).

    Figure 2/PCR en émulsion

    pour que le processus de séquençage soit réussi, chaque micro puits doit contenir un cordon avec un brin D’ADN (environ 15% des micro puits sont de cette composition). La PCR dénature alors le fragment de bibliothèque menant deux brins distincts, dont l’un (le brin inverse) recèle au bourrelet., L’ADN recuit est amplifié par la polymérase à partir de la perle vers le site d’amorce. Le brin inverse d’origine se dénature alors et n’est libéré de la perle que pour recuire à la perle pour donner deux brins séparés. Ceux-ci sont tous deux amplifiés pour donner deux brins D’ADN attachés à la perle. Le processus est ensuite répété sur 30-60 cycles conduisant à des grappes d’ADN. Cette technique a été critiquée pour sa nature chronophage, car elle nécessite de nombreuses étapes (formation et rupture de l’émulsion, amplification par PCR, enrichissement, etc.) malgré son utilisation intensive dans de nombreuses plates-formes NGS., Il est également relativement inefficace puisque seulement environ deux tiers des micro-réacteurs à émulsion contiendront réellement un cordon. Par conséquent, une étape supplémentaire est nécessaire pour séparer les systèmes vides, ce qui entraîne davantage d’inexactitudes potentielles.

    Bridge PCR

    la surface de la cellule d’écoulement est densément recouverte d’amorces complémentaires aux amorces fixées aux fragments de la bibliothèque D’ADN (Figure 3). L’ADN est ensuite fixé à la surface de la cellule au hasard où il est exposé à des réactifs pour l’extension à base de polymérase., Lors de l’ajout de nucléotides et d’enzymes, les extrémités libres des brins simples d’ADN se fixent à la surface de la cellule via des amorces complémentaires, créant des structures pontées. Les Enzymes interagissent ensuite avec les ponts pour les rendre double brin, de sorte que lorsque la dénaturation se produit, deux fragments d’ADN simple brin sont attachés à la surface à proximité. La répétition de ce processus conduit à des clones de brins identiques localisés. Afin d’optimiser la densité des grappes, les concentrations de réactifs doivent être surveillées de très près pour éviter le surpeuplement.,

    la Figure 3 | Pont PCR

    le Séquençage

    Plusieurs concurrents méthodes de Séquençage de Prochaine Génération ont été développés par des sociétés différentes.

    454 Pyroséquencing

    Le Pyroséquencing est basé sur le principe du « séquençage par synthèse », où un brin complémentaire est synthétisé en présence d’une enzyme polymérase (Figure 4). Contrairement à l’utilisation de didésoxynucléotides pour terminer l’amplification de la chaîne (comme dans le séquençage Sanger), le pyroséquençage détecte plutôt la libération de pyrophosphate lorsque des nucléotides sont ajoutés à la chaîne D’ADN., Il utilise initialement la technique de PCR en émulsion pour construire les polonies nécessaires au séquençage et supprime le brin complémentaire. Ensuite, une amorce de séquençage d’adnss s’hybride à l’extrémité du brin (région de liaison d’amorce), puis les quatre dNTP différents sont ensuite séquentiellement amenés à s’écouler dans et hors des puits sur les polonies. Lorsque le dNTP correct est enzymatiquement incorporé dans le brin, il provoque la libération de pyrophosphate. En présence D’ATP sulfurylase et d’adénosine, le pyrophosphate est converti en ATP., Cette molécule D’ATP est utilisée pour la conversion catalysée par la luciférase de la luciférine en oxyluciférine, qui produit de la lumière qui peut être détectée avec une caméra. L’intensité relative de la lumière est proportionnelle à la quantité de base ajoutée (c’est-à-dire qu’un pic de deux fois l’intensité indique que deux bases identiques ont été ajoutées successivement).,

    Figure 4/454 Pyroséquencing

    Le Pyroséquencing, développé par 454 Life Sciences, a été l’un des premiers succès du séquençage de nouvelle génération; en effet, 454 Life Sciences a produit le premier séquenceur de nouvelle génération disponible dans le commerce. Cependant, la méthode a été éclipsée par d’autres technologies et, en 2013, les nouveaux propriétaires Roche ont annoncé la fermeture de 454 Life Sciences et l’arrêt de la plate-forme de pyroséquençage 454.,

    Ion torrent semiconductor sequencing

    Ion torrent sequencing utilise une approche de « séquençage par synthèse », dans laquelle un nouveau brin D’ADN, complémentaire du brin cible, est synthétisé une base à la fois. Une puce semi-conductrice détecte les ions hydrogène produits lors de la polymérisation de l’ADN (Figure 5).

    suite à la formation de polony par PCR en émulsion, le fragment de la bibliothèque D’ADN est inondé séquentiellement avec chaque nucléoside triphosphate (dNTP), comme dans le pyroséquençage. Le dNTP est alors incorporé dans le nouveau brin s’il est complémentaire du nucléotide sur le brin cible., Chaque fois qu’un nucléotide est ajouté avec succès, un ion hydrogène est libéré et détecté par le capteur de pH du séquenceur. Comme dans la méthode de pyroséquençage, si plus d’un même nucléotide est ajouté, le changement de pH/intensité du signal est proportionnellement plus important.

    Figure 5/Ion Torrent semiconductor sequencing

    Ion torrent sequencing est la première technique commerciale à ne pas utiliser la fluorescence et la numérisation par caméra; il est donc plus rapide et moins cher que beaucoup d’autres méthodes., Malheureusement, il peut être difficile d’énumérer le nombre de bases identiques ajoutés successivement. Par exemple, il peut être difficile de différencier le changement de pH d’un homorepeat de longueur 9 d’un homorepeat de longueur 10, ce qui rend difficile le décodage de séquences répétitives.

    séquençage par ligature (solide)

    Le solide est une méthode enzymatique de séquençage qui utilise L’ADN ligase, une enzyme largement utilisée en biotechnologie pour sa capacité à ligaturer les brins D’ADN double brin (Figure 6)., La PCR en émulsion est utilisée pour immobiliser/amplifier une région de liaison d’amorce d’adnss (appelée adaptateur) qui a été conjuguée à la séquence cible (c’est-à-dire la séquence à séquencer) sur un cordon. Ces perles sont ensuite déposées sur une surface de verre − une densité élevée de perles peut être obtenue qui, à son tour, augmente le débit de la technique.

    Une fois le dépôt du bourrelet effectué, une amorce de longueur N est hybridée à l’adaptateur, puis les bourrelets sont exposés à une bibliothèque de sondes 8-mer qui présentent un colorant fluorescent différent à l’extrémité 5′ et un groupe hydroxyle à l’extrémité 3′., Les Bases 1 et 2 sont complémentaires aux nucléotides à séquencer tandis que les bases 3-5 sont dégénérées et les bases 6-8 sont des bases inosines. Seule une sonde complémentaire s’hybridera à la séquence cible, adjacente à l’amorce. L’ADN ligase est ensuite utilisé pour joindre la sonde 8-mer à l’amorce. Une liaison phosphorothioate entre les bases 5 et 6 permet au colorant fluorescent d’être clivé du fragment à l’aide d’ions d’argent., Ce clivage permet de mesurer la fluorescence (quatre colorants fluorescents différents sont utilisés, qui ont tous des spectres d’émission différents) et génère également un groupe 5’-phosphate qui peut subir une ligature supplémentaire. Une fois le premier cycle de séquençage terminé, le produit d’extension est fondu, puis un deuxième cycle de séquençage est réalisé avec une amorce de longueur N−1. De nombreux cycles de séquençage en utilisant des amorces plus courtes à chaque fois (c.−à−d. N-2, N-3, etc.) et en mesurant la fluorescence garantissent que la cible est séquencée.,

    en raison de la méthode de séquençage à deux bases (puisque chaque base est effectivement séquencée deux fois), la technique solide est très précise (à 99,999% avec une sixième amorce, c’est la plus précise des plates-formes de deuxième génération) et aussi peu coûteuse. Il peut effectuer une seule exécution en 7 jours et dans ce temps peut produire 30 Go de données. Malheureusement, son principal inconvénient est que les longueurs de lecture sont courtes, ce qui le rend inadapté à de nombreuses applications.,

    Figure 6/séquençage par ligature

    séquençage réversible du terminateur (Illumina)

    le séquençage réversible du terminateur diffère de la méthode Sanger traditionnelle en ce que, au lieu de terminer l’extension de l’amorce de manière irréversible en utilisant du didésoxynucléotide, des nucléotides modifiés sont utilisés Alors que de nombreuses autres techniques utilisent la PCR en émulsion pour amplifier les fragments de la bibliothèque D’ADN, la terminaison réversible utilise la PCR en pont, améliorant ainsi l’efficacité de cette étape du processus.,

    les terminateurs réversibles peuvent être regroupés en deux catégories: les terminateurs réversibles 3′-o-bloqués et les terminateurs réversibles 3′-débloqués.

    terminateurs réversibles 3′-o-bloqués

    le mécanisme utilise une approche de séquençage par synthèse, allongeant l’amorce de manière progressive. Tout d’abord, les amorces et les modèles de séquençage sont fixés sur un support solide. Le support est exposé à chacune des quatre bases D’ADN, qui ont un fluorophore différent attaché (à la base azotée) en plus d’un groupe 3’-o-azidométhyle (Figure 7).,

    Figure 7/Structure de l’azidométhyl dNTP marqué par fluorescence utilisé dans le séquençage Illumina

    seule la base correcte recuit à la cible et est ensuite ligaturée à l’amorce. Le support solide est ensuite imagé et les nucléotides qui n’ont pas été incorporés sont emportés et la branche fluorescente est clivée à L’aide de TCEP (TRIS(2-carboxyéthyl)phosphine). TCEP supprime également le groupe 3 ‘-o-azidométhyle, régénérant 3 ‘ – OH, et le cycle peut être répété (Figure 8) .,

    Figure 8/séquençage réversible des terminateurs

    3′-terminateurs réversibles débloqués

    le groupe de terminaison réversible des terminateurs réversibles 3′-non bloqués est lié à la fois au groupe de base et au groupe de fluorescence, qui fait maintenant partie du groupe de terminaison ainsi qu’un rapporteur. Cette méthode diffère de la méthode des terminateurs réversibles 3 ‘- o-bloqués de trois manières: premièrement, la position 3’-n’est pas bloquée (c’est-à-dire, la base a 3’-OH libre); le fluorophore est le même pour les quatre bases; et chaque base modifiée est coulée séquentiellement plutôt qu’en même temps.

    le principal inconvénient de ces techniques réside dans leur faible longueur de lecture, qui peut être causée par l’un des deux phénomènes. Afin d’éviter l’incorporation de deux nucléotides en une seule étape, un bloc est mis en place, cependant en cas d’absence d’ajout de bloc dû à une mauvaise synthèse, les brins peuvent devenir déphasés créant un bruit qui limite la longueur de lecture. Le bruit peut également être créé si le fluorophore est attaché ou retiré sans succès., Ces problèmes sont répandus dans d’autres méthodes de séquençage et sont les principaux facteurs limitant la longueur de lecture.

    Cette technique a été lancée par Illumina, avec leurs plates-formes HiSeq et MiSeq. HiSeq est le moins cher des séquenceurs de deuxième génération avec un coût de 0,02 per par million de bases. Il a également une sortie de données élevée de 600 Go par exécution, ce qui prend environ 8 jours.

    séquençage de troisième génération

    Une nouvelle cohorte de techniques a depuis été développée en utilisant le séquençage à molécule unique et le séquençage en temps réel unique, éliminant ainsi le besoin d’amplification clonale., Cela réduit les erreurs causées par la PCR, simplifie la préparation de la bibliothèque et, surtout, donne une longueur de lecture beaucoup plus élevée en utilisant des plates-formes à débit plus élevé. Les exemples incluent la plate-forme de Pacific Biosciences qui utilise le séquençage SMRT (single molecule real time) Pour donner des longueurs de lecture d’environ un millier de bases et Helicos Biosciences qui utilise le séquençage à une seule molécule et ne nécessite donc pas d’amplification avant le séquençage. Oxford Nanopore Technologies développe actuellement des nanopores à base de silicium qui sont soumis à un courant qui change lorsque l’ADN traverse le pore., On s’attend à ce qu’il s’agisse d’une méthode rapide de séquençage de l’ADN à haut débit, bien que des problèmes tels que le ralentissement du transport à travers le pore doivent d’abord être résolus.

    séquençage modifications épigénétiques

    tout comme le séquençage de nouvelle génération a permis le séquençage génomique à grande échelle, il est devenu clair récemment que le code génétique ne contient pas toutes les informations nécessaires aux organismes. Les modifications épigénétiques des bases de L’ADN, en particulier la 5-méthylcytosine, transmettent également des informations importantes.,

    toutes les plates-formes de séquençage de deuxième génération dépendent, comme le séquençage Sanger, de la PCR et ne peuvent donc pas séquencer les bases d’ADN modifiées. En fait, la 5-méthylcytosine et la 5-hydroxyméthylcytosine sont traitées comme de la cytosine par les enzymes impliquées dans la PCR; par conséquent, l’information épigénétique est perdue pendant le séquençage.,

    séquençage du Bisulfite

    le séquençage du Bisulfite exploite la différence de réactivité de la cytosine et de la 5-méthylcytosine par rapport au bisulfite: la cytosine est désaminée par le bisulfite pour former de l’uracile (qui se lit comme T lorsqu’il est séquencé), tandis que la 5-méthylcytosine n’est pas active (c.-à-d. se lit comme C). Si deux cycles de séquençage sont effectués en parallèle, l’un avec traitement au bisulfite et l’autre sans traitement, les différences entre les sorties des deux cycles indiquent des cytosines méthylées dans la séquence d’origine., Cette technique peut également être utilisée pour l’adnsd, car après traitement au bisulfite, les brins ne sont plus complémentaires et peuvent être traités comme de l’adnsd.

    La 5-Hydroxyméthylcytosine, une autre modification épigénétique importante, réagit avec le bisulfite pour former la cytosine-5-méthylsulfonate (qui se lit comme C lorsqu’elle est séquencée). Cela complique quelque peu les choses et signifie que le séquençage du bisulfite ne peut pas être utilisé comme un véritable indicateur de méthylation en soi.,

    séquençage du bisulfite oxydatif

    Le séquençage du bisulfite oxydatif ajoute une étape d’oxydation chimique, qui convertit la 5-hydroxyméthylcytosine en 5-formylcytosine en utilisant le perruthénate de potassium, KRuO4, avant le traitement au bisulfite. La 5-Formylcytosine est déformylée et désaminée pour former de l’uracile par traitement au bisulfite. Maintenant, trois séries de séquençage distinctes sont nécessaires pour distinguer la cytosine, la 5-méthylcytosine et la 5-hydroxyméthylcytosine (voir Figure 9).,

    Figure 9/séquençage modifications épigénétiques à l’aide de bisulfite

    Applications du séquençage de nouvelle génération

    Le séquençage de nouvelle génération a permis aux chercheurs de collecter de grandes quantités de données de séquençage génomique., Cette technologie a une pléthore d’applications, telles que: diagnostiquer et comprendre les maladies complexes; séquençage du génome entier; analyse des modifications épigénétiques; séquençage mitochondrial; séquençage du transcriptome-comprendre comment l’expression altérée des variants génétiques affecte un organisme; et séquençage de l’exome − on pense que les mutations de l’exome contiennent jusqu’à 90% des mutations du génome humain, ce qui conduit à la maladie., Des techniques D’ADN ont été utilisées pour identifier et isoler les gènes responsables de certaines maladies, et fournir la copie correcte du gène défectueux connu sous le nom de « thérapie génique ».

    en thérapie génique, le traitement du cancer est un domaine important – une méthode potentielle consisterait à introduire un ARN antisens (qui empêche spécifiquement la synthèse d’une protéine ciblée) dans l’oncogène, qui est déclenché pour former des cellules tumorales. Une autre méthode est appelée « thérapie génique du suicide » qui introduit des gènes pour tuer sélectivement les cellules cancéreuses., De nombreux codes génétiques pour les protéines et les enzymes toxiques sont connus, et l’introduction de ces gènes dans les cellules tumorales entraînerait la mort cellulaire. La difficulté de cette méthode est d’assurer un système d’administration très précis pour éviter de tuer les cellules saines.
    ces méthodes sont rendues possibles par le séquençage pour analyser les génomes tumoraux, permettant aux experts médicaux d’adapter plus efficacement la chimiothérapie et d’autres traitements contre le cancer à la composition génétique unique de leurs patients, révolutionnant ainsi les étapes diagnostiques de la médecine personnalisée.,

    à mesure que le coût du séquençage de l’ADN diminue, il deviendra plus répandu, ce qui pose un certain nombre de problèmes. Le séquençage produit d’énormes volumes de données, et il existe de nombreux défis informatiques associés au traitement et au stockage des données. Il y a aussi des questions éthiques, telles que la propriété de l’ADN d’un individu lorsque l’ADN est séquencé. Les données de séquençage de L’ADN doivent être stockées en toute sécurité, car il existe des craintes que les groupes d’assurance, les courtiers en hypothèques et les employeurs puissent utiliser ces données pour modifier les devis d’assurance ou faire la distinction entre les candidats., Le séquençage peut également aider à déterminer si une personne a un risque accru pour une maladie particulière, mais si le patient est informé ou s’il existe un remède pour la maladie est un autre problème.

    Ahmadian, A.; Svahn, H.; massivement parallèle. Plates-formes de séquençage utilisant les Technologies Lab on a Chip. Puce De Laboratoire, 11, 2653 − 2655 (2011).

    Balasubramanian, S.; séquençage des acides nucléiques: de la chimie à la médecine. Chem. Commun. 47, 7281 − 7286 (2011).

    Mardis, E.; ADN de la Prochaine Génération des Méthodes de Séquençage. Annu. Rév. Génomique Hum. Genet. 9, 387 − 402 (2008).

    Mardis, E.,; Plates-formes de séquençage de L’ADN de nouvelle génération. Annu. Rév. Anal. Chem. 6, 287-303 (2013).

    Shendure, J.; Ji, H.; séquençage de L’ADN de nouvelle génération. NAT. La Biotech. 26, 10 1135-1144 (2008).

    Voir aussi

    notre livre en ligne gratuit sur les acides nucléiques contient des informations sur tous les aspects de la chimie et de la biologie des acides nucléiques.