Articles

Nästa generations sekvensering

nästa generations sekvensering

introduktion

sekvenseringen av det mänskliga genomet slutfördes 2003, efter 13 års internationellt samarbete och investeringar på 3 miljarder US-Dollar. Det humana genomprojektet använde Sanger-sekvensering (om än kraftigt optimerad), den huvudsakliga metoden för DNA-sekvensering sedan uppfinningen på 1970-talet.

idag växer efterfrågan på sekvensering exponentiellt, med stora mängder genomiskt DNA som behöver analyseras snabbt, billigt och noggrant., Tack vare ny sekvenseringsteknik som kallas kollektivt som nästa generations sekvensering är det nu möjligt att sekvensera ett helt mänskligt genom inom några timmar.

Sanger-sekvensering och nästa generations sekvensering

principen bakom nästa generations sekvensering (NGS) liknar principen för Sanger-sekvensering, som bygger på kapillärelektrofores. Den genomiska strängen är fragmenterad, och baserna i varje fragment identifieras av emitterade signaler när fragmenten ligeras mot en Mallsträng.,
Sanger-metoden krävde separata steg för sekvensering, separation (genom elektrofores) och detektering, vilket gjorde det svårt att automatisera provberedningen och det var begränsat i genomströmning, skalbarhet och upplösning. Ngs-metoden använder array-baserad sekvensering som kombinerar de tekniker som utvecklats i Sanger-sekvensering för att bearbeta miljontals reaktioner parallellt, vilket resulterar i mycket hög hastighet och genomströmning till en reducerad kostnad., Genomsekvenseringsprojekten som tog många år med Sanger-metoder kan nu slutföras i timmar med NGS, men med kortare läslängder (antalet baser som sekvenseras åt gången) och mindre noggrannhet.,

nästa generations metoder för DNA-sekvensering har tre allmänna steg:

  • Biblioteksförberedelse: bibliotek skapas med hjälp av slumpmässig fragmentering av DNA, följt av ligering med anpassade linkers
  • förstärkning: biblioteket förstärks med hjälp av klonala förstärkningsmetoder och PCR
  • sekvensering: DNA sekvenseras med hjälp av en av flera olika tillvägagångssätt

Biblioteksförberedelse

För det första är DNA fragmenterat antingen enzymatiskt eller genom sonication (excitation med ultraljud) för att skapa mindre strängar., Adaptrar (korta, dubbelsträngade bitar av syntetiskt DNA) ligeras sedan till dessa fragment med hjälp av DNA-ligas, ett enzym som förenar DNA-strängar. Adaptrarna gör det möjligt för sekvensen att bli bunden till en kompletterande motsvarighet.

adaptrarna syntetiseras så att den ena änden är ”klibbig” medan den andra är ”trubbig” (icke-sammanhängande) för att ansluta den trubbiga änden till det trubbiga slutade DNA. Detta kan leda till det potentiella problemet med basparning mellan molekyler och därmed dimerbildning., För att förhindra detta används den kemiska strukturen hos DNA, eftersom ligering sker mellan 3′-OH och 5 ’ – p-ändarna. Genom att avlägsna fosfatet från adapterns klibbiga ände och därmed skapa en 5’-OH-ände istället, kan DNA-ligaset inte bilda en bro mellan de två termini (Figur 1).,

Figur 1/biblioteksförberedelse av nästa generations sekvensering

för att sekvenseringen ska lyckas måste biblioteksfragmenten vara rumsligt klustrade i PCR-kolonier eller ”polonier” eftersom de är konventionellt kända, som består av många kopior av ett visst biblioteksfragment. Eftersom dessa polonier är fästa på ett plant sätt kan funktionerna i matrisen manipuleras enzymatiskt parallellt. Denna metod för biblioteksbyggnad är mycket snabbare än det tidigare arbetsintensiva förfarandet för koloniplockning och E., coli kloning används för att isolera och förstärka DNA för Sanger sekvensering, men detta är på bekostnad av läs längd av fragmenten.

förstärkning

biblioteksförstärkning krävs så att den mottagna signalen från sequencer är tillräckligt stark för att kunna detekteras exakt. Med enzymatisk förstärkning kan fenomen som ”förspänning” och ”dubbelarbete” uppstå vilket leder till förmånlig förstärkning av vissa biblioteksfragment. Istället finns det flera typer av förstärkningsprocess som använder PCR för att skapa ett stort antal DNA-kluster.,

Emulsion PCR

Emulsion olja, pärlor, PCR mix och biblioteket DNA blandas för att bilda en emulsion som leder till bildandet av mikrobrunnar (Figur 2).

Figur 2/Emulsion PCR

för att sekvenseringsprocessen ska lyckas bör varje mikrobrunn innehålla en pärla med en DNA-sträng (cirka 15% av mikrobrunnarna är av denna komposition). PCR denaturerar sedan bibliotekets fragment som leder två separata strängar, varav en (omvänd sträng) anneals till pärlan., Det glödgade DNA förstärks av polymeras från pärlan mot primerplatsen. Den ursprungliga omvänd strängen denaturerar sedan och frigörs från pärlan endast för att återgälda till pärlan för att ge två separata strängar. Dessa är båda förstärkta för att ge två DNA-strängar kopplade till pärlan. Processen upprepas sedan över 30-60 cykler som leder till kluster av DNA. Denna teknik har kritiserats för sin tidskrävande natur, eftersom det kräver många steg (formning och brytning av emulsionen, PCR-förstärkning, anrikning etc) trots dess omfattande användning i många av NGS-plattformarna., Det är också relativt ineffektivt eftersom endast cirka två tredjedelar av emulsionsmikroreaktorerna faktiskt innehåller en pärla. Därför krävs ett extra steg för att separera tomma system som leder till fler potentiella felaktigheter.

bro PCR

flödescellens yta är tätt belagd med primrar som kompletterar primrarna som är fästa vid DNA-bibliotekets fragment (Figur 3). DNA: t fästs sedan slumpmässigt på cellens yta där det exponeras för reagens för polymerasbaserad förlängning., Vid tillsats av nukleotider och enzymer fäster de fria ändarna av de enskilda strängarna av DNA sig på cellens yta via kompletterande primers, vilket skapar överbryggade strukturer. Enzymer interagerar sedan med broarna för att göra dem dubbla strandade, så att när denatureringen inträffar, är två enkla strandade DNA-fragment fästa vid ytan i närheten. Upprepning av denna process leder till klonkluster av lokaliserade identiska strängar. För att optimera klustertätheten måste koncentrationerna av reagenser övervakas mycket noggrant för att undvika överbeläggning.,

Figur 3/Bridging PCR

sekvensering

flera konkurrerande metoder för nästa generations sekvensering har utvecklats av olika företag.

454 Pyrosequencing

Pyrosequencing baseras på principen ”sekvensering genom syntes”, där en komplementär sträng syntetiseras i närvaro av polymerasenzym (Figur 4). I motsats till att använda dideoxinukleotider för att avsluta kedjeförstärkning (som i Sanger-sekvensering) detekterar pyrosequencing istället frisättningen av pyrofosfat när nukleotider läggs till i DNA-kedjan., Den använder initialt emulsion PCR-tekniken för att konstruera polonierna som krävs för sekvensering och tar bort den kompletterande strängen. Därefter hybridiserar en ssDNA-sekvenseringsprimer till slutet av strängen (primerbindningsregion), sedan görs de fyra olika dNTPs sekventiellt för att strömma in och ut ur brunnarna över polonierna. När den korrekta dNTP är enzymatiskt införlivad i strängen, orsakar det frisättning av pyrofosfat. I närvaro av ATP-sulfurylas och adenosin omvandlas pyrofosfatet till ATP., Denna ATP-molekyl används för luciferas-katalyserad omvandling av luciferin till oxyluciferin, vilket ger ljus som kan detekteras med en kamera. Ljusets relativa intensitet är proportionell mot mängden tillsatt bas (dvs. en topp på två gånger intensiteten indikerar att två identiska baser har tillsatts i följd).,

Figur 4/454 Pyrosequencing

Pyrosequencing, utvecklad av 454 biovetenskap, var en av de tidiga framgångarna med nästa generations sekvensering; 454 biovetenskap producerade faktiskt den första kommersiellt tillgängliga nästa generations sekvenseraren. Metoden förmörkades emellertid av annan teknik och i 2013 tillkännagav nya ägare Roche stängningen av 454 biovetenskap och avbrytandet av 454 pyrosequencing-plattformen.,

Ion torrent semiconductor sequencing

Ion torrent sequencing använder en ”sekvensering genom syntes” tillvägagångssätt, där en ny DNA-sträng, som kompletterar målsträngen, syntetiseras en bas i taget. Ett halvledarchip detekterar vätejoner som produceras under DNA-polymerisation (Figur 5).

efter polonbildning med emulsion PCR översvämmas DNA-bibliotekets fragment sekventiellt med varje nukleosidtrifosfat (dNTP), som i pyrosequencing. DNTP införlivas sedan i den nya strängen om komplementär till nukleotiden på målsträngen., Varje gång en nukleotid tillsätts framgångsrikt frigörs en vätejon, och den detekteras av sequencerns pH-sensor. Som i pyrosekvenseringsmetoden, om mer än en av samma nukleotid tillsätts, är förändringen i pH/signalintensiteten motsvarande större.

Figur 5/Ion Torrent semiconductor sequencing

Ion torrent sequencing är den första kommersiella tekniken att inte använda fluorescens och kameraskanning; det är därför snabbare och billigare än många av de andra metoderna., Tyvärr kan det vara svårt att räkna upp antalet identiska baser som läggs till i följd. Det kan till exempel vara svårt att skilja pH-förändringen för ett homorepeat av Längd 9 till en av Längd 10, vilket gör det svårt att avkoda repetitiva sekvenser.

sekvensering genom ligering (fast)

fast är en enzymatisk metod för sekvensering som använder DNA-ligas, ett enzym som används i stor utsträckning inom bioteknik för dess förmåga att ligera dubbelsträngade DNA-strängar (Figur 6)., Emulsion PCR används för att immobilisera / förstärka en ssDNA primer-bindande region (känd som en adapter) som har konjugerats till målsekvensen (dvs den sekvens som ska sekvenseras) på en pärla. Dessa pärlor deponeras sedan på en glasyta-en hög densitet av pärlor kan uppnås vilket i sin tur ökar genomströmningen av tekniken.

När bead deponering har inträffat, en primer av längd N hybridiseras till adaptern, då pärlorna utsätts för ett bibliotek av 8-mer sonder som har olika fluorescerande färgämne vid 5 ’änden och en hydroxylgrupp vid 3′ änden., Baser 1 och 2 kompletterar nukleotiderna som ska sekvenseras medan baser 3-5 är degenererade och baser 6-8 är inosinbaser. Endast en kompletterande sond kommer att hybridisera till målsekvensen, intill primern. DNA-ligas används sedan för att ansluta 8-mer sonden till primern. En fosforotioatlänk mellan baserna 5 och 6 gör det möjligt att klyva det fluorescerande färgämnet från fragmentet med hjälp av silverjoner., Denna klyvning gör det möjligt att mäta fluorescens (fyra olika fluorescerande färgämnen används, som alla har olika emissionsspektra) och genererar också en 5’-fosfatgrupp som kan genomgå ytterligare ligering. När den första omgången av sekvensering är klar, förlängningsprodukten smälts av och sedan en andra omgången av sekvensering är perforerad med en primer av längd N-1. Många omgångar av sekvensering med kortare primrar varje gång (dvs N−2, N−3 etc) och mätning av fluorescensen säkerställer att målet sekvenseras.,

på grund av den tvåbasbaserade sekvenseringsmetoden (eftersom varje bas effektivt sekvenseras två gånger) är den fasta tekniken mycket exakt (vid 99.999% med en sjätte primer, den är den mest exakta av andra generationens plattformar) och även billig. Det kan slutföra en enda körning på 7 dagar och på den tiden kan producera 30 Gb data. Tyvärr är dess största nackdel att läslängder är korta, vilket gör det olämpligt för många applikationer.,

Figur 6/sekvensering genom ligering

reversibel terminatorsekvensering (Illumina)

reversibel terminatorsekvensering skiljer sig från den traditionella Sangermetoden genom att, i stället för att avsluta primerförlängningen irreversibelt med dideoxinukleotid, används modifierade nukleotider vid reversibel avslutning. Medan många andra tekniker använder emulsion PCR för att förstärka DNA-bibliotekets fragment, använder reversibel uppsägning bro PCR, vilket förbättrar effektiviteten i detta skede av processen.,

vändbara terminatorer kan grupperas i två kategorier: 3′-o-blockerade vändbara terminatorer och 3′-oblockade vändbara terminatorer.

3′-o-blockerade reversibla terminatorer

mekanismen använder en sekvensering genom syntes tillvägagångssätt, förlänga primern på ett stegvis sätt. För det första är sekvensering primers och mallar fixerade till ett fast stöd. Stödet exponeras för var och en av de fyra DNA-baserna, som har en annan fluorophore fäst (till kvävebasen) förutom en 3′-o-azidometylgrupp (Figur 7).,

Figur 7/struktur av fluorescentmärkt azidometyl dNTP som används i Illumina-sekvensering

endast den korrekta basen annalerar målet och ligeras därefter till primern. Det fasta stödet imiteras sedan och nukleotider som inte har införlivats tvättas bort och den fluorescerande grenen klyvs med TCEP (tris(2-karboxietyl)fosfin). TCEP tar också bort 3 ’- o-azidometylgruppen, regenererar 3 ’ – OH, och cykeln kan upprepas (figur 8) .,

figur 8/reversibel terminatorsekvensering

3′-oblockade reversibla terminatorer

den reversibla termineringsgruppen för 3′-oblockade reversibla terminatorer är kopplad till både basen och fluorescensgruppen, som nu fungerar som en del av termineringsgruppen samt en reporter. Denna metod skiljer sig från 3′-o-blockerade reversibla terminatorer metod på tre sätt: för det första är 3 ’ – positionen inte blockerad (dvs, basen har fri 3 ’ – OH); fluoroforen är densamma för alla fyra baserna; och varje modifierad bas flödas i sekventiellt snarare än samtidigt.

den största nackdelen med dessa tekniker ligger med deras dåliga läslängd, vilket kan orsakas av ett av två fenomen. För att förhindra inkorporering av två nukleotider i ett enda steg, sätts ett block på plats, men i händelse av inget blocktillägg på grund av en dålig syntes kan strängar bli ur fas som skapar ljud som begränsar läslängden. Buller kan också skapas om fluoroforen misslyckas eller avlägsnas., Dessa problem är vanliga i andra sekvenseringsmetoder och är de viktigaste begränsande faktorerna för att läsa längd.

denna teknik var pionjär av Illumina, med sina hiseq och MiSeq plattformar. HiSeq är den billigaste av andra generationens sekvenser med en kostnad på $ 0,02 per miljon baser. Den har också en hög datautgång på 600 Gb per körning som tar cirka 8 dagar att slutföra.

tredje generationens sekvensering

en ny kohort av tekniker har sedan dess utvecklats med hjälp av single molecule-sekvensering och single real time-sekvensering, vilket eliminerar behovet av klonförstärkning., Detta minskar fel som orsakas av PCR, förenklar bibliotekets förberedelse och, viktigast av allt, ger en mycket högre läslängd med hjälp av högre genomströmningsplattformar. Exempel är Pacific Biosciences plattform som använder SMRT (single molecule real time) sekvensering för att ge läslängder på cirka tusen baser och Helicos Biosciences som använder enmolekyl sekvensering och därför inte kräver förstärkning före sekvensering. Oxford Nanopore Technologies utvecklar för närvarande kiselbaserade nanoporer som utsätts för en ström som förändras när DNA passerar genom porerna., Detta förväntas vara en snabb metod för DNA-sekvensering med hög genomströmning, även om problem som att sakta transport genom porren först måste åtgärdas.

sekvensering av epigenetiska modifieringar

precis som nästa generations sekvensering aktiverat genomisk sekvensering i stor skala, har det nyligen blivit klart att den genetiska koden inte innehåller all information som behövs av organismer. Epigenetiska modifieringar av DNA-baser, i synnerhet 5-metylcytosin, förmedlar också viktig information.,

alla andra generationens sekvenseringsplattformar beror, som Sanger-sekvensering, på PCR och kan därför inte sekvensera modifierade DNA-baser. Faktum är att både 5-metylcytosin och 5-hydroximetylcytosin behandlas som cytosin av enzymerna som är involverade i PCR; därför förloras epigenetisk information under sekvensering.,

bisulfit sekvensering

bisulfit sekvensering utnyttjar skillnaden i reaktivitet av cytosin och 5-metylcytosin med avseende på bisulfit: cytosin deamineras av bisulfit för att bilda uracil (som lyder som T när sekvenseras), medan 5-metylcytosin är oreaktivt (dvs läser som C). Om två sekvenseringskörningar görs parallellt, en med bisulfitbehandling och en utan, indikerar skillnaderna mellan utsignalerna från de två körningarna metylerade cytosiner i den ursprungliga sekvensen., Denna teknik kan också användas för dsDNA, eftersom efter behandling med bisulfit är strängarna inte längre komplementära och kan behandlas som ssDNA.

5-Hydroximetylcytosin, en annan viktig epigenetisk modifiering, reagerar med bisulfit för att bilda cytosin-5-metylsulfonat (som lyder som C när sekvenseras). Detta komplicerar saken något, och innebär att bisulfitsekvensering inte kan användas som en sann indikator på metylering i sig.,

oxidativ bisulfitsequencing

oxidativ bisulfitsequencing lägger till ett kemiskt oxidationssteg, som omvandlar 5-hydroximetylcytosin till 5-formylcytosin med kaliumperrutenat, KRuO4, före bisulfitbehandling. 5-Formylcytosin deformeras och deamineras för att bilda uracil genom bisulfitbehandling. Nu är tre separata sekvenser nödvändiga för att skilja cytosin, 5-metylcytosin och 5-hydroximetylcytosin (se Figur 9).,

Figur 9/sekvensering epigenetiska modifieringar med hjälp av bisulfit

tillämpningar av nästa generations sekvensering

nästa generations sekvensering har gjort det möjligt för forskare att samla in stora mängder genomisk sekvenseringsdata., Denna teknik har en uppsjö av applikationer, såsom: diagnostisera och förstå komplexa sjukdomar; helgenomsekvensering; analys av epigenetiska modifieringar; mitokondriell sekvensering; transcriptome sekvensering-förstå hur förändrat uttryck av genetiska varianter påverkar en organism; och exome sekvensering − mutationer i exomen tros innehålla upp till 90% av mutationer i det mänskliga genomet, vilket leder till sjukdom., DNA-tekniker har använts för att identifiera och isolera gener som är ansvariga för vissa sjukdomar och ge rätt kopia av den defekta genen som kallas ”genterapi”.

ett stort fokusområde i genterapi är cancerbehandling – en potentiell metod skulle vara att införa ett antisense RNA (som specifikt förhindrar syntesen av ett målinriktat protein) till onkogen, som utlöses för att bilda tumörceller. En annan metod heter ”suicide gen therapy” som introducerar gener för att döda cancerceller selektivt., Många genetiska koder för giftiga proteiner och enzymer är kända, och införandet av dessa gener i tumörceller skulle leda till celldöd. Svårigheten med denna metod är att säkerställa ett mycket exakt leveranssystem för att förhindra att friska celler dödas.
dessa metoder möjliggörs genom sekvensering för att analysera tumörgenom, vilket gör det möjligt för medicinska experter att skräddarsy kemoterapi och andra cancerbehandlingar mer effektivt till sina patienters unika genetiska sammansättning, revolutionera de diagnostiska stadierna av personlig medicin.,

när kostnaden för DNA-sekvensering går ner, blir det mer utbrett, vilket ger ett antal problem. Sekvensering ger stora volymer data, och det finns många beräkningsutmaningar i samband med bearbetning och lagring av data. Det finns också etiska frågor, såsom ägandet av en persons DNA när DNA sekvenseras. DNA-sekvenseringsdata måste lagras säkert, eftersom det finns oro för att försäkringsgrupper, inteckning mäklare och arbetsgivare kan använda dessa data för att ändra försäkring citat eller skilja mellan kandidater., Sekvensering kan också hjälpa till att ta reda på om en individ har en ökad risk för en viss sjukdom, men om patienten är informerad eller om det finns botemedel mot sjukdomen är en annan fråga helt och hållet.

Ahmadian, A.; Svahn, H.; massivt parallellt. Sekvenseringsplattformar med labb på en chipteknik. Lab Chip, 11, 2653 − 2655 (2011).

Balasubramanian, S.; sekvensering av nukleinsyror: från kemi till medicin. Chem. Commun. 47, 7281 − 7286 (2011).

Mardis, E.; Nästa Generations DNA-sekvenseringsmetoder. Annu. Rev. Genomik Hum. Genet. 9, 387 − 402 (2008).

Mardis, E.,; Nästa generations DNA-Sekvenseringsplattformar. Annu. Rev.Anal. Chem. 6, 287-303 (2013).

Shendure, J.; Ji, H.; nästa generations DNA-sekvensering. Nat. Bioteknik. 26, 10 1135-1144 (2008).

Se även

vår gratis online nukleinsyror bok innehåller information om alla aspekter av nukleinsyror Kemi och biologi.