Next generation sequencing (Italiano)
Next generation sequencing
Introduzione
Il sequenziamento del genoma umano è stato completato nel 2003, dopo 13 anni di collaborazione internazionale e investimenti per 3 miliardi di dollari. Il progetto Genoma umano ha utilizzato Sanger sequenziamento (anche se fortemente ottimizzato), il metodo principale di sequenziamento del DNA dalla sua invenzione nel 1970.
Oggi, la domanda di sequenziamento è in crescita esponenziale, con grandi quantità di DNA genomico che necessitano di essere analizzati rapidamente, a buon mercato, e con precisione., Grazie alle nuove tecnologie di sequenziamento conosciute collettivamente come Next Generation Sequencing, è ora possibile sequenziare un intero genoma umano in poche ore.
Sequenziamento Sanger e sequenziamento di nuova generazione
Il principio alla base del sequenziamento di nuova generazione (NGS) è simile a quello del sequenziamento Sanger, che si basa sull’elettroforesi capillare. Il filamento genomico è frammentato e le basi in ogni frammento sono identificate dai segnali emessi quando i frammenti sono legati contro un filamento del modello.,
Il metodo Sanger richiedeva passaggi separati per il sequenziamento, la separazione (mediante elettroforesi) e il rilevamento, il che rendeva difficile automatizzare la preparazione del campione ed era limitato in throughput, scalabilità e risoluzione. Il metodo NGS utilizza il sequenziamento basato su array che combina le tecniche sviluppate nel sequenziamento Sanger per elaborare milioni di reazioni in parallelo, con conseguente velocità e throughput molto elevati a un costo ridotto., I progetti di sequenziamento del genoma che hanno richiesto molti anni con i metodi Sanger possono ora essere completati in ore con NGS, anche se con lunghezze di lettura più brevi (il numero di basi che vengono sequenziate alla volta) e meno precisione.,
la Prossima generazione di metodi di sequenziamento del DNA hanno tre passi:
- Biblioteca preparazione: le librerie sono creati utilizzando casuale frammentazione del DNA, seguita da legatura personalizzati con il linker
- Amplificazione: la biblioteca è amplificato utilizzando metodi di amplificazione clonale e PCR
- Sequenziamento: DNA sequenziato utilizzando uno dei diversi approcci
la preparazione di Libreria
in Primo luogo, il DNA è frammentato o enzimaticamente o mediante sonicazione (eccitazione mediante ultrasuoni) per creare piccoli filamenti., Gli adattatori (brevi pezzi a doppio filamento di DNA sintetico) vengono quindi legati a questi frammenti con l’aiuto della DNA ligasi, un enzima che unisce i filamenti di DNA. Gli adattatori consentono alla sequenza di legarsi a una controparte complementare.
Gli adattatori sono sintetizzati in modo che un’estremità sia “appiccicosa” mentre l’altra sia “smussata” (non coesiva) al fine di unire l’estremità smussata al DNA smussato. Ciò potrebbe portare al potenziale problema dell’accoppiamento di base tra molecole e quindi alla formazione di dimeri., Per evitare ciò, viene utilizzata la struttura chimica del DNA, poiché la legatura avviene tra le estremità 3′-OH e 5′-P. Rimuovendo il fosfato dall’estremità appiccicosa dell’adattatore e quindi creando un’estremità 5′-OH, la DNA ligasi non è in grado di formare un ponte tra i due termini (Figura 1).,
Figura 1/Preparazione della libreria del sequenziamento di nuova generazione
Affinché il sequenziamento abbia successo, i frammenti della libreria devono essere raggruppati spazialmente in colonie PCR o ‘polonie’ come sono convenzionalmente conosciute, che consistono in molte copie di un particolare frammento della libreria. Poiché queste polonie sono attaccate in modo planare, le caratteristiche dell’array possono essere manipolate enzimaticamente in parallelo. Questo metodo di costruzione della biblioteca è molto più veloce rispetto alla precedente procedura ad alta intensità di lavoro di raccolta colonia ed E., coli clonazione utilizzato per isolare e amplificare il DNA per Sanger sequenziamento, tuttavia, questo è a scapito della lunghezza di lettura dei frammenti.
Amplificazione
Libreria di amplificazione è necessaria in modo che il segnale ricevuto dal sequencer è abbastanza forte per essere rilevato con precisione. Con l’amplificazione enzimatica, fenomeni come “polarizzazione” e “duplicazione” possono verificarsi portando all’amplificazione preferenziale di alcuni frammenti di libreria. Invece, ci sono diversi tipi di processo di amplificazione che utilizzano la PCR per creare un gran numero di cluster di DNA.,
Emulsion PCR
Emulsion oil, beads, PCR mix e la library DNA vengono miscelati per formare un’emulsione che porta alla formazione di micro pozzetti (Figura 2).
Figura 2/Emulsion PCR
Affinché il processo di sequenziamento abbia successo, ogni micro pozzetto deve contenere un tallone con un filamento di DNA (circa il 15% dei micro pozzetti è di questa composizione). La PCR denatura quindi il frammento della libreria che porta due fili separati, uno dei quali (il filo inverso) ricuce al tallone., Il DNA ricotto viene amplificato dalla polimerasi a partire dal tallone verso il sito del primer. Il filo inverso originale poi denatura e viene rilasciato dal tallone solo per ricottura al tallone per dare due fili separati. Questi sono entrambi amplificati per dare due filamenti di DNA attaccati al tallone. Il processo viene quindi ripetuto su 30-60 cicli che portano a gruppi di DNA. Questa tecnica è stata criticata per la sua natura dispendiosa in termini di tempo, poiché richiede molti passaggi (formazione e rottura dell’emulsione, amplificazione PCR, arricchimento ecc.) , È anche relativamente inefficiente poiché solo circa due terzi dei micro reattori a emulsione conterranno effettivamente un tallone. Pertanto è necessario un ulteriore passaggio per separare i sistemi vuoti che portano a maggiori potenziali inesattezze.
Bridge PCR
La superficie della cella di flusso è densamente rivestita con primer complementari ai primer collegati ai frammenti della libreria di DNA (Figura 3). Il DNA viene quindi attaccato alla superficie della cellula in modo casuale dove viene esposto ai reagenti per l’estensione basata sulla polimerasi., All’aggiunta di nucleotidi ed enzimi, le estremità libere dei singoli filamenti di DNA si attaccano alla superficie della cellula tramite primer complementari, creando strutture a ponte. Gli enzimi quindi interagiscono con i ponti per renderli a doppio filamento, in modo che quando si verifica la denaturazione, due frammenti di DNA a singolo filamento sono attaccati alla superficie nelle immediate vicinanze. La ripetizione di questo processo porta a gruppi clonali di filamenti identici localizzati. Al fine di ottimizzare la densità dei cluster, le concentrazioni dei reagenti devono essere monitorate molto attentamente per evitare il sovraffollamento.,
Figura 3/Bridging PCR
Sequenziamento
Diversi metodi concorrenti di sequenziamento di nuova generazione sono stati sviluppati da diverse aziende.
454 Pirosequenziamento
Il pirosequenziamento si basa sul principio del “sequenziamento per sintesi”, in cui un filamento complementare viene sintetizzato in presenza dell’enzima polimerasi (Figura 4). In contrasto con l’utilizzo di dideossinucleotidi per terminare l’amplificazione a catena (come nel sequenziamento di Sanger), il pirosequenziamento rileva invece il rilascio di pirofosfato quando i nucleotidi vengono aggiunti alla catena del DNA., Inizialmente utilizza la tecnica PCR emulsione per costruire le polonie necessarie per il sequenziamento e rimuove il filo complementare. Successivamente, un primer di sequenziamento ssDNA ibridizza all’estremità del filo (regione di legame del primer), quindi i quattro diversi DNTP vengono quindi fatti in sequenza per fluire dentro e fuori dai pozzetti sopra le polonie. Quando il dNTP corretto è enzimaticamente incorporato nel filo, provoca il rilascio di pirofosfato. In presenza di ATP sulfurilasi e adenosina, il pirofosfato viene convertito in ATP., Questa molecola di ATP viene utilizzata per la conversione catalizzata dalla luciferasi della luciferina in ossiluciferina, che produce luce che può essere rilevata con una telecamera. L’intensità relativa della luce è proporzionale alla quantità di base aggiunta (cioè un picco del doppio dell’intensità indica che due basi identiche sono state aggiunte in successione).,
Figura 4/454 Pyrosequencing
Pyrosequencing, sviluppato da 454 Life Sciences, è stato uno dei primi successi del sequenziamento di nuova generazione; infatti, 454 Life Sciences ha prodotto il primo sequencer di nuova generazione disponibile in commercio. Tuttavia, il metodo è stato eclissato da altre tecnologie e, in 2013, i nuovi proprietari Roche hanno annunciato la chiusura di 454 Life Sciences e l’interruzione della piattaforma 454 pyrosequencing.,
Ion torrent semiconductor sequencing
Ion torrent sequencing utilizza un approccio “sequenziamento per sintesi”, in cui un nuovo filamento di DNA, complementare al filamento bersaglio, viene sintetizzato una base alla volta. Un chip semiconduttore rileva gli ioni idrogeno prodotti durante la polimerizzazione del DNA (Figura 5).
Dopo la formazione di polonia mediante PCR in emulsione, il frammento della libreria di DNA viene inondato sequenzialmente con ciascun trifosfato nucleosidico (dNTP), come nel pirosequenziamento. Il dNTP viene quindi incorporato nel nuovo filamento se complementare al nucleotide sul filamento bersaglio., Ogni volta che un nucleotide viene aggiunto con successo, uno hydrogen idrogeno viene rilasciato e rilevato dal sensore di pH del sequencer. Come nel metodo di pyrosequencing, se viene aggiunto più di uno dello stesso nucleotide, la variazione di pH/intensità del segnale è corrispondentemente maggiore.
Figura 5/Ion Torrent semiconductor sequencing
Ion torrent sequencing è la prima tecnica commerciale a non utilizzare la fluorescenza e la scansione della fotocamera; è quindi più veloce ed economico di molti altri metodi., Sfortunatamente, può essere difficile enumerare il numero di basi identiche aggiunte consecutivamente. Ad esempio, può essere difficile differenziare la variazione di pH per un homorepeat di lunghezza 9 a uno di lunghezza 10, rendendo difficile decodificare sequenze ripetitive.
Il sequenziamento per legatura (solido)
Il solido è un metodo enzimatico di sequenziamento che utilizza la DNA ligasi, un enzima ampiamente utilizzato nelle biotecnologie per la sua capacità di legare filamenti di DNA a doppio filamento (Figura 6)., L’emulsione PCR viene utilizzata per immobilizzare / amplificare una regione di legame del primer ssDNA (nota come adattatore) che è stata coniugata alla sequenza target (cioè la sequenza che deve essere sequenziata) su un tallone. Queste perle vengono quindi depositate su una superficie di vetro: è possibile ottenere un’alta densità di perline che a sua volta aumenta il rendimento della tecnica.
Una volta che si è verificata la deposizione del tallone, un primer di lunghezza N viene ibridato all’adattatore, quindi le perle vengono esposte a una libreria di sonde 8-mer che hanno un colorante fluorescente diverso all’estremità 5′ e un gruppo idrossile all’estremità 3′., Le basi 1 e 2 sono complementari ai nucleotidi da sequenziare mentre le basi 3-5 sono degenerate e le basi 6-8 sono basi inosine. Solo una sonda complementare si ibriderà alla sequenza target, adiacente al primer. DNA ligasi è quindi utilizza per unire la sonda 8-mer al primer. Un legame fosforotioato tra le basi 5 e 6 consente di scindere il colorante fluorescente dal frammento utilizzando ioni d’argento., Questa scissione consente di misurare la fluorescenza (vengono utilizzati quattro diversi coloranti fluorescenti, tutti con diversi spettri di emissione) e genera anche un gruppo 5’-fosfato che può subire un’ulteriore legatura. Una volta completato il primo ciclo di sequenziamento, il prodotto di estensione viene sciolto e quindi un secondo ciclo di sequenziamento viene perfomato con un primer di lunghezza N−1. Molti cicli di sequenziamento utilizzando primer più brevi ogni volta (cioè N-2, N-3 ecc.) e misurando la fluorescenza si assicura che il bersaglio sia sequenziato.,
A causa del metodo di sequenziamento a due basi (poiché ogni base è effettivamente sequenziata due volte), la tecnica SOLIDA è altamente accurata (al 99,999% con un sesto primer, è la più accurata delle piattaforme di seconda generazione) e anche economica. Può completare una singola esecuzione in 7 giorni e in quel tempo può produrre 30 Gb di dati. Sfortunatamente, il suo principale svantaggio è che le lunghezze di lettura sono brevi, rendendolo inadatto per molte applicazioni.,
Figura 6 / Sequenziamento per legatura
Reversible terminator sequencing (Illumina)
Reversible terminator sequencing differisce dal metodo Sanger tradizionale in quanto, invece di terminare l’estensione del primer in modo irreversibile utilizzando dideossinucleotide, nucleotidi modificati sono utilizzati nella terminazione reversibile. Mentre molte altre tecniche utilizzano la PCR in emulsione per amplificare i frammenti della libreria di DNA, la terminazione reversibile utilizza la PCR a ponte, migliorando l’efficienza di questa fase del processo.,
I terminatori reversibili possono essere raggruppati in due categorie: terminatori reversibili 3′-O-bloccati e terminatori reversibili 3′-sbloccati.
3′-O-blocked reversibili terminatori
Il meccanismo utilizza un sequenziamento per sintesi approccio, allungando il primer in modo graduale. In primo luogo, i primer e i modelli di sequenziamento sono fissati su un supporto solido. Il supporto è esposto a ciascuna delle quattro basi del DNA, che hanno un fluoroforo diverso attaccato (alla base azotata) oltre a un gruppo 3’-O-azidometil (Figura 7).,
Figura 7/Struttura dell’azidometil dNTP fluorescentemente etichettato utilizzato nel sequenziamento Illumina
Solo la base corretta ricrea il bersaglio e viene successivamente legata al primer. Il supporto solido viene quindi ripreso e i nucleotidi che non sono stati incorporati vengono lavati via e il ramo fluorescente viene scisso usando TCEP (tris(2-carbossietil)fosfina). TCEP rimuove anche il gruppo 3 ‘- O-azidometil, rigenerando 3 ‘ – OH, e il ciclo può essere ripetuto (Figura 8) .,
Figura 8/Sequenziamento del terminatore reversibile
terminatori reversibili sbloccati da 3′
Il gruppo di terminazione reversibile dei terminatori reversibili sbloccati da 3’è collegato sia alla base che al gruppo di fluorescenza, che ora agisce come parte del gruppo di terminazione nonché come reporter. Questo metodo differisce dal metodo dei terminatori reversibili 3 ‘- O-bloccati in tre modi: in primo luogo, la posizione 3’non è bloccata (cioè, la base ha libero 3 ‘ – OH); il fluoroforo è lo stesso per tutte e quattro le basi; e ogni base modificata è fluita in sequenza piuttosto che allo stesso tempo.
Lo svantaggio principale di queste tecniche risiede nella loro scarsa lunghezza di lettura, che può essere causata da uno dei due fenomeni. Al fine di evitare l’incorporazione di due nucleotidi in un unico passaggio, viene messo in atto un blocco, tuttavia in caso di assenza di aggiunta di blocchi a causa di una scarsa sintesi, i trefoli possono diventare fuori fase creando rumore che limita la lunghezza di lettura. Il rumore può anche essere creato se il fluoroforo viene attaccato o rimosso senza successo., Questi problemi sono prevalenti in altri metodi di sequenziamento e sono i principali fattori limitanti per leggere la lunghezza.
Questa tecnica è stata introdotta da Illumina, con le loro piattaforme HiSeq e MiSeq. HiSeq è il più economico dei sequencer di seconda generazione con un costo di bases 0,02 per milione di basi. Ha anche un output di dati elevato di 600 Gb per esecuzione che richiede circa 8 giorni per essere completato.
Sequenziamento di terza generazione
Da allora è stata sviluppata una nuova coorte di tecniche che utilizzano il sequenziamento a singola molecola e il sequenziamento in tempo reale, eliminando la necessità di amplificazione clonale., Ciò riduce gli errori causati dalla PCR, semplifica la preparazione della libreria e, soprattutto, offre una lunghezza di lettura molto più elevata utilizzando piattaforme di throughput più elevate. Gli esempi includono la piattaforma di Pacific Biosciences che utilizza il sequenziamento SMRT (single molecule real time) per fornire lunghezze di lettura di circa mille basi e Helicos Biosciences che utilizza il sequenziamento a singola molecola e quindi non richiede amplificazione prima del sequenziamento. Oxford Nanopore Technologies stanno attualmente sviluppando nanopori a base di silicio che sono sottoposti a una corrente che cambia come DNA passa attraverso il poro., Si prevede che questo sia un metodo rapido di sequenziamento del DNA ad alto rendimento, anche se prima devono essere affrontati problemi come il rallentamento del trasporto attraverso il poro.
Sequenziamento modificazioni epigenetiche
Proprio come il sequenziamento di prossima generazione ha permesso il sequenziamento genomico su larga scala, è diventato chiaro di recente che il codice genetico non contiene tutte le informazioni necessarie agli organismi. Anche le modifiche epigenetiche alle basi del DNA, in particolare la 5-metilcitosina, trasmettono informazioni importanti.,
Tutte le piattaforme di sequenziamento di seconda generazione dipendono, come il sequenziamento Sanger, dalla PCR e quindi non possono sequenziare basi di DNA modificate. Infatti, sia la 5-metilcitosina che la 5-idrossimetilcitosina sono trattate come citosina dagli enzimi coinvolti nella PCR; pertanto, le informazioni epigenetiche vengono perse durante il sequenziamento.,
Sequenziamento del bisolfito
Il sequenziamento del bisolfito sfrutta la differenza di reattività della citosina e della 5-metilcitosina rispetto al bisolfito: la citosina viene deaminata dal bisolfito per formare uracile (che si legge come T quando sequenziato), mentre la 5-metilcitosina non è reattiva (cioè si legge come C). Se due sequenze di sequenziamento vengono eseguite in parallelo, una con trattamento bisolfito e una senza, le differenze tra le uscite delle due sequenze indicano citosine metilate nella sequenza originale., Questa tecnica può essere utilizzata anche per dsDNA, poiché dopo il trattamento con bisolfito, i fili non sono più complementari e possono essere trattati come ssDNA.
5-Idrossimetilcitosina, un’altra importante modifica epigenetica, reagisce con bisolfito per formare citosina-5-metilsulfonato (che si legge come C quando sequenziato). Ciò complica un po ‘ le cose e significa che il sequenziamento del bisolfito non può essere utilizzato come un vero indicatore della metilazione in sé.,
Sequenziamento del bisolfito ossidativo
Il sequenziamento del bisolfito ossidativo aggiunge una fase di ossidazione chimica, che converte la 5-idrossimetilcitosina in 5-formilcitosina utilizzando il perrutenato di potassio, KRuO4, prima del trattamento con bisolfito. La 5-formilcitosina è deformilata e deaminata per formare uracile mediante trattamento con bisolfito. Ora, sono necessarie tre sequenze di sequenziamento separate per distinguere citosina, 5-metilcitosina e 5-idrossimetilcitosina (vedere Figura 9).,
Figura 9 | Sequenziamento modifiche epigenetiche utilizzo di bisolfito
Applicazioni di sequenziamento di nuova generazione
Next generation sequencing ha permesso ai ricercatori di raccogliere grandi quantità di dati di sequenziamento genomico., Questa tecnologia ha una pletora di applicazioni, come: diagnosi e comprensione di malattie complesse; sequenziamento dell’intero genoma; analisi delle modifiche epigenetiche; sequenziamento mitocondriale; sequenziamento del trascrittoma-capire come l’espressione alterata delle varianti genetiche influisce su un organismo; e sequenziamento dell’esoma − si pensa che le mutazioni nell’esoma contengano fino al 90% delle mutazioni nel genoma umano, che porta alla malattia., Tecniche di DNA sono state utilizzate per identificare e isolare i geni responsabili di alcune malattie, e fornire la copia corretta del gene difettoso noto come ‘terapia genica’.
Una vasta area di messa a fuoco nella terapia genica è il trattamento del cancro – un metodo potenziale sarebbe quello di introdurre un RNA antisenso (che impedisce specificamente la sintesi di una proteina mirata) all’oncogene, che viene attivato per formare cellule tumorali. Un altro metodo è chiamato ‘terapia genica suicida’ che introduce geni per uccidere le cellule tumorali in modo selettivo., Sono noti molti codici genetici per proteine ed enzimi tossici e l’introduzione di questi geni nelle cellule tumorali comporterebbe la morte cellulare. La difficoltà in questo metodo è garantire un sistema di consegna molto preciso per prevenire l’uccisione di cellule sane.
Questi metodi sono resi possibili dal sequenziamento per analizzare i genomi tumorali, consentendo agli esperti medici di adattare la chemioterapia e altri trattamenti contro il cancro in modo più efficace alla composizione genetica unica dei loro pazienti, rivoluzionando le fasi diagnostiche della medicina personalizzata.,
Man mano che il costo del sequenziamento del DNA diminuisce, diventerà più diffuso, il che comporta una serie di problemi. Il sequenziamento produce enormi volumi di dati e ci sono molte sfide computazionali associate all’elaborazione e alla memorizzazione dei dati. Ci sono anche questioni etiche, come la proprietà del DNA di un individuo quando il DNA viene sequenziato. I dati di sequenziamento del DNA devono essere archiviati in modo sicuro, poiché vi sono preoccupazioni che gruppi assicurativi, broker ipotecari e datori di lavoro possano utilizzare questi dati per modificare le quotazioni assicurative o distinguere tra i candidati., Sequenziamento può anche aiutare a scoprire se un individuo ha un aumentato rischio di una particolare malattia, ma se il paziente è informato o se c’è una cura per la malattia è un altro problema del tutto.
Ahmadian, A.; Svahn, H.; Massicciamente parallelo. Piattaforme di sequenziamento utilizzando tecnologie Lab on a Chip. Chip di laboratorio, 11, 2653 − 2655 (2011).
Balasubramanian, S.; Sequenziamento degli acidi nucleici: dalla chimica alla medicina. Chimica. Comune. 47, 7281 − 7286 (2011).
Mardis, E.; Metodi di sequenziamento del DNA di nuova generazione. Annu. Rev. Genomica Ronzio. Genet. 9, 387 − 402 (2008).
Mardis, E.,; Piattaforme di sequenziamento del DNA di nuova generazione. Annu. Rev. Anale. Chimica. 6, 287-303 (2013).
Shendure, J.; Ji, H.; Sequenziamento del DNA di nuova generazione. NAT. Biotecnologia. 26, 10 1135-1144 (2008).
Vedi anche
Il nostro libro di acidi nucleici online contiene informazioni su tutti gli aspetti della chimica e della biologia degli acidi nucleici.