Neste generasjons sekvensering
Neste generasjons sekvensering
Innledning
sekvensering av det humane genom ble ferdigstilt i 2003, etter 13 år med internasjonalt samarbeid og investering på USD 3 mrd. Det Humane Genom-Prosjektet brukes Sanger-sekvensering (riktignok sterkt optimalisert), den viktigste metoden for DNA-sekvensering siden sin oppfinnelse i 1970-årene.
i Dag, er det behov for sekvensering vokser eksponentielt, med store mengder av genomisk DNA som trenger å bli analysert raskt, billig og effektivt., Takket være nye sekvensering teknologi kjent som Neste Generasjons Sekvensering, det er nå mulig å arrangere en hel menneskelige genom i løpet av noen timer.
Sanger-sekvensering og Neste generasjons sekvensering
prinsippet bak Neste Generasjons Sekvensering (NGS) er lik som Sanger-sekvensering, som baserer seg på kapillær elektroforese. Den genom strand er fragmentert, og baser i hvert fragment er identifisert av slippes ut signaler når fragmenter er ligated mot en mal strand.,
Sanger metode som kreves separate trinn for sekvensering, separasjon (ved elektroforese) og gjenkjenning, noe som gjorde det vanskelig å automatisere prøveopparbeidelse og det var begrenset i gjennomstrømning, skalerbarhet og oppløsning. Den NGS metoden bruker array-basert sekvenser som kombinerer teknikker utviklet i Sanger-sekvensering for å behandle millioner av reaksjoner i parallell, noe som resulterer i svært høy hastighet og produksjon til en redusert kostnad., Den genom sekvensering av prosjekter det tok mange år med Sanger metoder kan nå være ferdig i timer med NGS, men med kortere les lengde (antall baser som er sekvensert på en gang) og mindre nøyaktighet.,
Neste generasjon metoder for DNA-sekvensering har tre generelle fremgangsmåte:
- Bibliotek forberedelse: bibliotekene er opprettet ved hjelp av tilfeldige fragmentering av DNA, etterfulgt av ligation med tilpasset linkers
- Forsterkning: biblioteket er forsterket ved hjelp av clonal forsterkning metoder og PCR
- Sekvensering: DNA er sekvensert ved hjelp av én av flere ulike tilnærminger
Bibliotek forberedelse
for det Første, DNA er fragmentert enten enzymatically eller ved sonikering (eksitasjon ved hjelp av ultralyd) til å opprette mindre tråder., Adaptere (kort, dobbel-strandet biter av syntetiske DNA) er så ligated til disse fragmenter med hjelp av DNA-ligase, et enzym som blir DNA-tråder. Den adaptere aktivere rekkefølge for å bli bundet til en utfyllende motstykke.
Adaptere er syntetisk, slik at den ene enden er «trege» mens den andre er ‘butt’ (ikke sammenhengende) med henblikk på å bli med i den butte enden til den butte endte DNA. Dette kan føre til potensielle problemet med base sammenkobling mellom molekyler og derfor dimer dannelse., For å unngå dette, kjemisk struktur av DNA er benyttet, siden ligation finner sted mellom 3′-OH-og 5′-P ender. Ved å fjerne fosfat fra klissete enden av adapteren og skaper derfor en 5′-OH-enden i stedet, DNA ligase er i stand til å danne en bro mellom de to termini (Figur 1).,
Figur 1 | Bibliotek forberedelse av Neste generasjons sekvensering
for sekvensering for å være vellykket, bibliotek fragmenter trenger å være romlig gruppert i PCR-kolonier eller ‘polonies» som de er konvensjonelt kjent, som består av mange kopier av et bestemt bibliotek-fragment. Siden disse polonies er festet i en plan mote, funksjoner av tabellen kan manipuleres enzymatically i parallell. Denne metoden for bibliotek konstruksjon er mye raskere enn den forrige arbeidskrevende prosedyre av kolonien plukking og E., coli kloning brukes til å isolere og amplifisere DNA for Sanger-sekvensering, men dette er på bekostning av lese lengde av fragmenter.
Forsterkning
Bibliotek forsterkning er nødvendig, slik at signalet fra sequencer er sterk nok til å bli oppdaget nøyaktig. Med enzymatisk amplifikasjon, fenomener som «vekting» og «dobbeltarbeid» kan oppstå som fører til fortrinnsrett forsterkning av visse bibliotek fragmenter. I stedet, det er flere typer forsterkning prosess som kan bruke PCR for å opprette et stort antall DNA-klynger.,
Emulsjon PCR
Emulsjon av olje, perler, PCR-miks og bibliotek DNA er blandet for å danne en emulsjon som fører til dannelse av små brønner (Figur 2).
Figur 2 | Emulsjon PCR –
– >
for sekvensering prosessen skal være vellykket, hver micro godt bør inneholde en perle med en tråd av DNA (ca 15% av mikro-brønner er av denne sammensetning). PCR-så denatures biblioteket fragment ledende to separate tråder, og en av disse (omvendt strand) anneals til kulen., Det glødet DNA er forsterket med polymerase fra perle mot primer nettstedet. Den opprinnelige omvendt strand deretter denatures og er gitt ut fra perle bare å re-bindes spesifikt til kulen til å gi to separate tråder. Disse er både forsterket for å gi to DNA-tråder som er festet til kulen. Prosessen er så gjentatt over 30-60 sykluser som fører til klynger av DNA. Denne teknikken har blitt kritisert for sin tidkrevende natur, siden det krever mange trinn (forming og bryte emulsjonen, PCR-amplifikasjon, berikelse etc) til tross for sin omfattende bruk i mange av NGS-plattformer., Det er også relativt ineffektivt siden bare rundt to tredjedeler av mikro-emulsjon reaktorer vil faktisk inneholder en perle. Derfor et ekstra trinn er nødvendig for å skille tom systemer fører til flere potensielle feil.
Bridge PCR
overflaten av flyten celle er tett belagt med primere som er komplementære til primere knyttet til DNA-bibliotek fragmenter (Figur 3). DNA er da festet til overflaten av cellen tilfeldig hvor det er utsatt for reagenser for polymerase basert extension., På tillegg av nukleotider og enzymer, den frie ender på enkelt tråder av DNA-feste seg til overflaten av cellen via utfyllende primere, skape brokoblet strukturer. Enzymer så samhandle med broer for å gjøre dem dobbel-strandet, slik at når denaturering skjer, to enkle strandet DNA-fragmentene er festet til overflaten i umiddelbar nærhet. Repetisjon av denne prosessen fører til clonal klynger av lokalisert identiske tråder. For å optimalisere klynge tetthet, konsentrasjoner av reagenser må overvåkes meget nøye for å unngå overbefolkning.,
Figur 3 | bygge bro mellom PCR –
– >
– Sekvensering
Flere konkurrerende metoder for Neste Generasjons Sekvensering har blitt utviklet av forskjellige selskaper.
454 Pyrosequencing
Pyrosequencing er basert på «sekvensering av syntese» – prinsippet, der en utfyllende strand er syntetisert i nærvær av polymerase enzym (Figur 4). I motsetning til ved hjelp av dideoxynucleotides å avslutte kjede forsterkning (som i Sanger-sekvensering), pyrosequencing i stedet oppdager utgivelsen av pyrophosphate når nukleotider er lagt til DNA-kjeden., Det i utgangspunktet bruker emulsjon PCR-teknikk for å konstruere polonies nødvendig for sekvensering og fjerner utfyllende strand. Neste, en ssDNA sekvensering primer hybridizes til slutten av strand (primer-bindende region), så er de fire forskjellige dntp-er så sekvensielt laget for å strømme inn og ut av brønner over polonies. Når riktig dNTP er enzymatically innlemmet i strand, det fører til utgivelsen av pyrophosphate. I nærvær av ATP sulfurylase og adenosin, den pyrophosphate er omgjort til ATP., Dette ATP-molekylet brukes for luciferase-catalysed konvertering av luciferin å oxyluciferin, som produserer lys som kan oppdages med et kamera. Den relative intensiteten av lyset er proporsjonal med mengden av base lagt til (dvs. en topp på to ganger intensiteten viser to identiske baser har blitt lagt på rad).,
Figur 4 | 454 Pyrosequencing
Pyrosequencing, utviklet av 454 Life Sciences, var en av de tidlige suksesser av Neste generasjons sekvensering, ja, 454 Life Sciences produsert den første kommersielt tilgjengelige Neste-generasjon sequencer. Men metoden ble overskygget av andre teknologier, og i 2013, nye eiere Roche annonsert nedleggelse av 454 Life Sciences og avviklingen av 454 pyrosequencing plattform.,
Ion torrent semiconductor sekvensering
Ion torrent-sekvensering bruker en «sekvensering av syntese» – tilnærming, der en ny DNA-tråd, som er komplementære til målet strand, er syntetisert en base av gangen. En halvleder chip oppdager hydrogen ioner som dannes under DNA-polymerisering (Figur 5).
Følgende polony formasjon med emulsjon PCR, DNA-bibliotek fragment er oversvømmet i serie med hver nucleoside trifosfat (dNTP), som i pyrosequencing. Den dNTP er så innarbeidet i den nye strand hvis komplementær til nukleotid på mål-strand., Hver gang en nukleotid er lagt til, en hydrogen ion er utgitt, og det oppdaget av sequencer er pH-sensoren. Som i pyrosequencing metode, hvis mer enn en av samme nukleotid er lagt til, endring i pH/signal intensitet er tilsvarende større.
Figur 5 | Ion Torrent semiconductor sekvensering
Ion torrent-sekvensering er den første kommersielle teknikken ikke å bruke fluorescens og kameraet skanning; det er derfor raskere og billigere enn mange av de andre metodene., Dessverre, kan det være vanskelig å spesifisere antall identiske baser lagt til fortløpende. For eksempel kan det være vanskelig å skille mellom pH endring for en homorepeat av lengde 9 til en av lengde 10, noe som gjør det vanskelig å dekode repeterende sekvenser.
Sekvensering av ligation (SOLiD)
SOLiD er en enzymatisk metode for sekvensering som bruker DNA-ligase, et enzym som brukes mye i bioteknologi for sin evne til å ligate dobbel-strandet DNA-tråder (Figur 6)., Emulsjon PCR brukes til å immobilisere/forsterke en ssDNA primer-bindende regionen (kjent som en adapter), som har vært conjugated til målet sekvens (dvs. den sekvensen som er å bli sekvensert) på en perle. Disse perlene er da inn på en glassflate − en høy tetthet av perler kan oppnås som noe som i sin tur øker gjennomstrømningen av teknikken.
Når perle deponering har skjedd, en primer av lengde N er hybridiserte til adapteren, og deretter perlene er utsatt for et bibliotek av 8-mer prober som har ulike fluorescerende fargestoff i 5′ – enden og en hydroksyl gruppe i 3′ enden., Baser 1 og 2 er komplementære til nukleotider å bli sekvensert mens baser 3-5 er degenerert og baser 6-8 er inosine baser. Bare en utfyllende sonden vil hybridiserer til målsekvensen, ved siden av primer. DNA ligase er deretter bruker for å delta i 8-mer sonde til primeren. En phosphorothioate sammenhengen mellom baser 5 og 6 kan fluorescerende fargestoff å være spaltet fra fragment ved hjelp av sølvioner., Dette spalting lar fluorescens som skal måles (fire ulike fluorescerende fargestoffer brukes, som alle har forskjellige utslipp spektra) og genererer også en 5′-fosfat gruppe som kan gjennomgå ytterligere ligation. Etter at den første runden av sekvensering er fullført, utvidelse produktet er smeltet av og deretter en ny runde med sekvensering er perfomed med en primer av lengde N−1. Mange runder med sekvensering ved hjelp av kortere primere hver gang (dvs. N−2, N−3, osv) og måling av fluorescens sikrer at målet er sekvensert.,
på Grunn av den to-base-sekvensering metode (siden hver base er effektivt sekvensert to ganger), SOLiD teknikk er svært nøyaktige (på 99.999% med en sjette primer, det er den mest nøyaktige av andre generasjon plattformer) og også billig. Det kan fullføre en enkelt kjøre i 7 dager og på den tiden kan produsere 30 Gb data. Dessverre, dens største ulempe er at lese lengder er kort, noe som gjør det egnet for mange applikasjoner.,
Figur 6 | Sekvensering av ligation
Reversible terminator sekvensering (Illumina)
Reversible terminator sekvensering skiller seg fra den tradisjonelle Sanger metode i dette, i stedet for å avslutte primer extension irreversibelt ved hjelp av dideoxynucleotide, endret nukleotider er brukt i reversible oppsigelse. Mens mange andre teknikker bruker emulsjon PCR for å amplifisere DNA-bibliotek fragmenter, reversibel oppsigelse bruker bridge PCR, bedre effektiviteten i denne fasen av prosessen.,
Reversible terminators kan grupperes i to kategorier: 3′-O-blokkert reversible terminators og 3′-frigjort reversible terminators.
3′-O-blokkert reversible terminators
mekanismen bruker en sekvensering av syntese tilnærming, elongating primer i en trinnvis måte. For det første, sekvensering primere og maler er festet til en solid støtte. Støtten er utsatt for hver av de fire DNA-baser, og som har en annen separeres fluoroforen vedlagt (til nitrogenholdige base) i tillegg til et 3′-O-azidomethyl gruppe (Figur 7).,
Figur 7 | Struktur av fluorescentmerkede merket azidomethyl dNTP brukt i Illumina-sekvensering
Bare riktig base anneals til mål, og er senere ligated til primeren. Solid støtte er så avbildes og nukleotider som ikke er inkorporert er vasket bort og fluorescerende gren er spaltet ved hjelp av TCEP (tris(2-carboxyethyl)fosfin). TCEP fjerner også 3′-O-azidomethyl gruppe, regenererende 3′-OH, og syklusen kan gjentas (Figur 8) .,
Figur 8 | Reversibel terminator sekvensering
3′-frigjort reversible terminators
Den reversible oppsigelse gruppe i 3′-frigjort reversible terminators er knyttet til både base og fluorescens-gruppen, som nå fungerer som en del av oppsigelse gruppen så vel som en reporter. Denne metoden er forskjellig fra 3′-O-blokkert reversible terminators metode på tre måter: for det første, 3′-posisjon er ikke blokkert (dvs., basen har fri 3′-OH); fluoroforen er den samme for alle fire baser, og hvert endret base er strømmet inn etter hverandre snarere enn på samme tid.
Den viktigste ulempen med disse teknikkene ligger med sin dårlige lese lengde, som kan være forårsaket av en av to fenomener. For å hindre at inkorporering av to nukleotider i en enkel trinn, en blokk er satt på plass, men i tilfelle av ingen blokk tillegg på grunn av en dårlig syntese, tråder kan bli ute av fase skape støy som begrenser les lengde. Støy kan også være opprettet hvis fluoroforen er mislykket koblet til eller fjernet., Disse problemer er utbredt i andre metoder for sekvensering og er den viktigste begrensende faktorene for å lese lengde.
Denne teknikken ble utviklet av Illumina, med sine HiSeq og MiSeq plattformer. HiSeq er den laveste av andre generasjon sequencere med en kostnad på $0.02 per millioner baser. Det har også en data med høy produksjon på 600 Gb per kjøre som tar rundt 8 dager å fullføre.
Tredje generasjons sekvensering
En ny kohort av teknikker har siden blitt utviklet ved hjelp av ett molekyl sekvensering og enkelt sanntid sekvensering, noe som eliminerer behovet for clonal forsterkning., Dette reduserer feil forårsaket av PCR, forenkler bibliotek forberedelse og, viktigst, gir en mye høyere lese lengde ved hjelp av høyere gjennomstrømning plattformer. Eksempler inkluderer Pacific Biovitenskap’ plattform som bruker SMRT (enkelt molekyl sanntid) sekvensering for å gi les lengder på rundt ett tusen baser og Helicos Biovitenskap som bruker enkelt molekyl sekvensering og derfor ikke krever forsterkning før sekvensering. Oxford Nanopore Teknologi er i ferd med å utvikle silisium-basert nanopores som er utsatt for en gjeldende at endringer som DNA passerer gjennom porene., Dette er antatt å være en høy gjennomstrømning rask metode for DNA-sekvensering, selv om slike problemer som langsom transport gjennom porene må først tas opp.
– Sekvensering epigenetisk modifikasjoner
Akkurat som Neste generasjons sekvensering aktivert genom sekvensering på en massiv skala, har det blitt klart nylig at den genetiske koden ikke inneholder alle opplysninger som er nødvendige av organismer. Epigenetisk modifikasjoner for å DNA-baser, og i særdeleshet 5-methylcytosine, også formidle viktig informasjon.,
Alle av andre generasjons sekvensering plattformer er avhengig av, som Sanger-sekvensering, på PCR og kan derfor ikke sekvens modifisert DNA-baser. Faktisk er både 5-methylcytosine og 5-hydroxymethylcytosine er behandlet som cytosine av enzymer som er involvert i PCR, derfor, epigenetisk informasjon går tapt ved sekvensering.,
Bisulfite-sekvensering
Bisulfite-sekvensering utnytter forskjeller i reaktivitet av cytosine og 5-methylcytosine med hensyn til bisulfite: cytosine er deaminated av bisulfite å danne uracil (som lyder som T når sekvensert), mens 5-methylcytosine er unreactive (dvs. lyder som C). Hvis to sekvensering kjører er gjort i parallell, en med bisulfite behandling og en uten, forskjellene mellom resultatene av de to kjører indikere denaturert cytosines i den opprinnelige rekkefølgen., Denne teknikken kan også brukes for dsDNA, siden etter behandling med bisulfite, trådene er ikke lenger komplementære og kan behandles som ssDNA.
5-Hydroxymethylcytosine, en annen viktig epigenetisk endring, reagerer med bisulfite å danne cytosine-5-methylsulfonate (som lyder som C når sekvensert). Dette kompliserer saker noe, og betyr at bisulfite-sekvensering kan ikke brukes som en sann indikator av metylering i seg selv.,
Oksidativt bisulfite-sekvensering
Oksidativt bisulfite-sekvensering legger til en kjemisk oksidasjon trinn, som konverterer 5-hydroxymethylcytosine til 5-formylcytosine ved hjelp av kalium perruthenate, KRuO4, før bisulfite behandling. 5-Formylcytosine er deformylated og deaminated å danne uracil av bisulfite behandling. Nå, tre separate sekvenser kjører er nødvendig å skille cytosine, 5-methylcytosine og 5-hydroxymethylcytosine (se Figur 9).,
Figur 9 | Sekvensering epigenetisk endringer ved hjelp av bisulfite
Programmer av Neste generasjons sekvensering
Neste generasjons sekvensering har gjort det mulig for forskere å samle inn store mengder av genom-sekvensering data., Denne teknologien har en mengde programmer, for eksempel: å diagnostisere og forstå komplekse sykdommer; hel-genom-sekvensering, analyse av epigenetisk modifikasjoner; mitokondrie-sekvensering; transcriptome sekvensering − forstå hvordan endret uttrykk av genetiske varianter som påvirker en organisme, og exome sekvensering − mutasjoner i exome er tenkt å inneholde opp til 90% av mutasjoner i det menneskelige genom, noe som fører til sykdom., DNA-teknikker har blitt brukt til å identifisere og isolere gener ansvarlig for visse sykdommer, og gi de riktige kopi av det defekte genet er kjent som ‘gene therapy’.
Et stort fokusområde i genterapi er kreft – en mulig metode ville være å innføre en antisense RNA (som spesifikt hindrer syntese av en målrettet protein) til onkogenet, som er utløst å danne tumorous celler. En annen metode som er kalt «selvmord gene therapy», som introduserte gener å drepe kreft celler selektivt., Mange genetiske koder for giftige proteiner og enzymer som er kjent, og innføring av disse genene i svulsten cellene ville resultere i cellen død. Vanskeligheten i denne metoden er å sikre en svært presis levering system for å hindre drepe friske celler.
Disse metodene er gjort mulig ved sekvensering for å analysere svulst genomer, slik medisinske eksperter til å skreddersy kjemoterapi og andre kreft behandlinger, mer effektivt til sine pasienter’ unike genetiske sammensetning, revolusjonerer den diagnostiske stadier av persontilpasset medisin.,
Som kostnadene ved DNA-sekvensering går ned, vil det bli mer utbredt, noe som bringer med seg en rekke problemer. Sekvensering produserer store mengder data, og det er mange computational utfordringer knyttet til prosessering og lagring av data. Det er også etiske spørsmål, slik som eierskap av en persons DNA-når DNA er sekvensert. DNA-sekvensering data må lagres på en sikker måte, siden det er bekymringer for at forsikring grupper, boliglån meglere og arbeidsgivere kan bruke disse dataene til å endre forsikring sitater eller skille mellom kandidatene., Sekvensering kan også bidra til å finne ut om en person har en økt risiko for en bestemt sykdom, men om pasienten er informert, eller hvis det er en kur for sykdommen, er en annen sak helt.
Ahmadian, A.; Svahn, H.; Massivt Parallelle. Sekvensering Plattformer ved hjelp av Lab on a Chip-Teknologi. Lab Chip, 11, 2653 − 2655 (2011).
Balasubramanian, S.; Sekvensering nukleinsyrer: fra Kjemi for Medisin. Kem. Commun. 47, 7281 − 7286 (2011).
Mardis, E.; Neste Generasjon DNA-Sekvensering Metoder. Annu. Rev. Genomics Hum. Genet. 9, 387 − 402 (2008).
Mardis, E.,; Neste Generasjon DNA-Sekvensering Plattformer. Annu. Rev. Anal. Kem. 6, 287-303 (2013).
Shendure, J.; Ji, H.; Neste Generasjon DNA-Sekvensering. Nat. Biotech. 26, 10 1135-1144 (2008).
Se også:
Vår gratis online nukleinsyrer Boken inneholder informasjon om alle aspekter av nukleinsyrer kjemi og biologi.