Articles

Volgende generatie sequencing

volgende generatie sequencing

introductie

de sequencing van het menselijk genoom werd voltooid in 2003, na 13 jaar internationale samenwerking en investeringen van 3 miljard USD. Het menselijke genoomproject gebruikte het rangschikken van Sanger (zij het zwaar geoptimaliseerd), de belangrijkste methode van het rangschikken van DNA sinds zijn uitvinding in de jaren ‘ 70.

vandaag, groeit de vraag voor het rangschikken exponentieel, met grote hoeveelheden genomic DNA die snel, goedkoop, en nauwkeurig moeten worden geanalyseerd., Dankzij nieuwe sequencing technologieën die collectief bekend staan als Next Generation Sequencing, is het nu mogelijk om een volledig menselijk genoom te sequencen in een kwestie van uren.

Sanger sequencing en Next-generation sequencing

het principe achter Next Generation Sequencing (NGS) is vergelijkbaar met dat van Sanger sequencing, dat berust op capillaire elektroforese. De genomic bundel is gefragmenteerd, en de basissen in elk fragment worden geà dentificeerd door uitgezonden signalen wanneer de fragmenten tegen een malplaatje bundel worden ligated.,
De sanger methode vereiste afzonderlijke stappen voor het rangschikken, scheiding (door elektroforese) en opsporing, die het moeilijk maakten om de steekproefvoorbereiding te automatiseren en het was beperkt in doorvoer, schaalbaarheid en resolutie. De NGS methode gebruikt array-based rangschikkend die de technieken combineert die in Sanger worden ontwikkeld rangschikkend om miljoenen reacties parallel te verwerken, resulterend in zeer hoge snelheid en productie bij een verminderde kosten., Het genoom die projecten rangschikken die vele jaren met sanger methodes namen kan nu in uren met NGS worden voltooid, hoewel met kortere gelezen lengtes (het aantal basissen die tegelijkertijd worden gerangschikt) en minder nauwkeurigheid.,

de Volgende generatie methoden van DNA-sequencing hebben drie algemene stappen zijn:

  • Bibliotheek voorbereiding: bibliotheken zijn gemaakt met behulp van random fragmentatie van DNA, gevolgd door ligatie met aangepaste linkers
  • Versterking: de bibliotheek wordt versterkt met behulp van klonale amplificatie methoden en PCR
  • Sequencing: DNA wordt gesequenced met een van de vele verschillende benaderingen

Bibliotheek voorbereiding

ten eerste, is het DNA gefragmenteerd ofwel enzymatisch of door de (excitatie met behulp van echografie) om kleinere strengen., De adapters (korte, double-stranded stukken synthetisch DNA) worden dan ligated aan deze fragmenten met behulp van ligase van DNA, een enzym dat bundels van DNA verbindt. De adapters maken het mogelijk om de sequentie te binden aan een complementaire tegenhanger.

adapters worden zodanig gesynthetiseerd dat het ene uiteinde “kleverig” is, terwijl het andere uiteinde “stomp” (niet-samenhangend) is om het stompe uiteinde aan het stompe uiteinde DNA te verbinden. Dit zou tot het potentiële probleem van het basisparen tussen molecules en daarom dimeervorming kunnen leiden., Om dit te verhinderen, wordt de chemische structuur van DNA gebruikt, aangezien de afbinding tussen 3′-OH en 5′-P einden plaatsvindt. Door het Fosfaat van het kleverige eind van de adapter te verwijderen en daarom in plaats daarvan een 5′-OH eind te creëren, kan de ligase van DNA geen brug tussen de twee eindpunten vormen (figuur 1).,

figuur 1 | Bibliotheekvoorbereiding van de volgende generatie sequencing

om de sequencing succesvol te laten zijn, moeten de bibliotheekfragmenten ruimtelijk geclusterd zijn in PCR-kolonies of ‘polonies’ zoals ze conventioneel bekend zijn, die bestaan uit vele kopieën van een bepaald bibliotheekfragment. Aangezien deze polonies op een vlakke manier zijn bevestigd, kunnen de kenmerken van de reeks enzymatisch parallel worden gemanipuleerd. Deze methode van bibliotheekbouw is veel sneller dan de vorige arbeidsintensieve procedure van colony picking en E., coli het klonen wordt gebruikt om DNA voor het rangschikken van Sanger te isoleren en te vergroten, nochtans, is dit ten koste van gelezen lengte van de fragmenten.

versterking

versterking van de bibliotheek is nodig, zodat het ontvangen signaal van de sequencer sterk genoeg is om nauwkeurig te worden gedetecteerd. Met enzymatische amplificatie kunnen verschijnselen als ‘vooringenomenheid’ en ‘duplicatie’ optreden die leiden tot preferentiële amplificatie van bepaalde bibliotheekfragmenten. In plaats daarvan, zijn er verscheidene types van versterkingsproces die PCR gebruiken om grote aantallen clusters van DNA tot stand te brengen.,

emulsie PCR

Emulsieolie, parels, PCR-mix en het DNA van de bibliotheek worden gemengd tot een emulsie die leidt tot de vorming van microputjes (Figuur 2).

Figuur 2/Emulsion PCR

om het sequentieproces te laten slagen, moet elk microbutje één kraal met één streng DNA bevatten (ongeveer 15% van de microbussen zijn van deze samenstelling). De PCR denatureert dan het bibliotheekfragment dat twee afzonderlijke bundels leidt, waarvan één (de omgekeerde bundel) aan de parel onthardt., Ontharde DNA wordt vergroot door polymerase vanaf de kraal naar de inleidingsplaats. De originele omgekeerde bundel denatureert dan en wordt vrijgegeven van de kraal slechts opnieuw te ontharden aan de kraal om twee afzonderlijke bundels te geven. Deze worden beide vergroot om twee bundels van DNA in bijlage aan de parel te geven. Het proces wordt dan herhaald over 30-60 cycli die tot clusters van DNA leiden. Deze techniek is bekritiseerd voor zijn tijdrovende aard, aangezien het vele stappen (het vormen en het breken van de emulsie, PCR-versterking, verrijking enz.) ondanks zijn uitgebreid gebruik in veel van de platforms NGS vereist., Het is ook relatief inefficiënt omdat slechts ongeveer twee derde van de emulsiemicroreactoren daadwerkelijk één kraal zal bevatten. Daarom is een extra stap nodig om lege systemen te scheiden, wat leidt tot meer potentiële onnauwkeurigheden.

Bridge PCR

het oppervlak van de stroomcel is dicht gecoat met primers die complementair zijn aan de primers die aan de fragmenten van de DNA-bibliotheek zijn bevestigd (Figuur 3). DNA is dan willekeurig in bijlage aan de oppervlakte van de cel waar het aan reagentia voor polymerase gebaseerde uitbreiding wordt blootgesteld., Op toevoeging van nucleotiden en enzymen, hechten de vrije einden van de enige bundels van DNA zich aan de oppervlakte van de cel via aanvullende inleidingen, die bridged structuren creëren. De enzymen staan dan met de bruggen in wisselwerking om hen vastgelopen dubbel te maken, zodat wanneer de denaturatie voorkomt, twee enige vastgelopen fragmenten van DNA in bijlage aan de oppervlakte in dichte nabijheid zijn. Herhaling van dit proces leidt tot klonale clusters van gelokaliseerde identieke bundels. Om de clusterdichtheid te optimaliseren, moeten de concentraties van reagentia zeer nauwlettend worden gecontroleerd om overbevolking te voorkomen.,

Figuur 3/Bridging PCR

Sequencing

verschillende bedrijven hebben verschillende concurrerende methoden voor Sequencing van de volgende generatie ontwikkeld.

454 Pyrosequencing

Pyrosequencing is gebaseerd op het ‘sequencing door synthese’ – principe, waarbij een complementaire streng wordt gesynthetiseerd in aanwezigheid van polymerase-enzym (Figuur 4). In tegenstelling tot het gebruiken van dideoxynucleotides om kettingversterking te beëindigen (zoals in het rangschikken van Sanger), ontdekt het pyrosequencing in plaats daarvan de versie van pyrofosfaat wanneer de nucleotiden aan de ketting van DNA worden toegevoegd., Het gebruikt aanvankelijk de techniek van emulsiepcr om de polonies te construeren die voor het rangschikken worden vereist en verwijdert de aanvullende bundel. Vervolgens ssdna rangschikkend primerkruist aan het eind van de bundel (primer-bindend gebied), dan worden de vier verschillende dNTPs dan opeenvolgend gemaakt om in en uit de putten over de polonies te stromen. Wanneer de juiste dNTP enzymatisch in de bundel wordt opgenomen, veroorzaakt het versie van pyrofosfaat. In aanwezigheid van ATP sulfurylase en adenosine, wordt pyrofosfaat omgezet in ATP., Deze ATP molecule wordt gebruikt voor luciferase-gekatalyseerde omzetting van luciferin in oxyluciferin, die licht produceert dat met een camera kan worden ontdekt. De relatieve intensiteit van het licht is evenredig met de hoeveelheid toegevoegde base (dat wil zeggen dat een piek van tweemaal de intensiteit aangeeft dat twee identieke bases achter elkaar zijn toegevoegd).,

Figuur 4 / 454 Pyrosequencing

Pyrosequencing, ontwikkeld door 454 Life Sciences, was een van de vroege successen van Next-generation sequencing; inderdaad, 454 Life Sciences produceerde de eerste commercieel verkrijgbare next-generation sequencer. Nochtans, werd de methode verduisterd door andere technologieën en, in 2013, kondigde nieuwe eigenaars Roche de sluiting van 454 het levenswetenschappen en de stopzetting van het 454 pyrosequencing platform aan.,

Ion torrent semiconductor sequencing

Ion torrent sequencing maakt gebruik van een “sequencing by synthesis” – benadering, waarbij een nieuwe DNA-streng, die complementair is aan de doelstreng, base per keer wordt gesynthetiseerd. Een halfgeleiderchip detecteert de waterstofionen die tijdens de polymerisatie van DNA worden geproduceerd (Figuur 5).

na polonievorming met behulp van emulsiepcr wordt het fragment van de DNA-bibliotheek achtereenvolgens overspoeld met elk nucleosidetrifosfaat (dNTP), zoals bij pyrosequencing. DNTP wordt dan opgenomen in de nieuwe bundel als complementair aan het nucleotide op de doel bundel., Elke keer dat een nucleotide met succes wordt toegevoegd, wordt een waterstofion vrijgegeven, en het ontdekt door de pH-sensor van de sequencer. Zoals in de pyrosequencing methode, als meer dan één van dezelfde nucleotide wordt toegevoegd, is de verandering in ph/signaalintensiteit dienovereenkomstig groter.

Figuur 5/Ion Torrent semiconductor sequencing

Ion torrent sequencing is de eerste commerciële techniek die geen gebruik maakt van fluorescentie en camera scannen; het is daarom sneller en goedkoper dan veel van de andere methoden., Helaas kan het moeilijk zijn om het aantal identieke bases opeenvolgend toegevoegd op te sommen. Bijvoorbeeld, kan het moeilijk zijn om de pH verandering voor homorepeat van lengte 9 aan één van lengte 10 te onderscheiden, makend het moeilijk om herhaalde opeenvolgingen te decoderen.

Sequencing by ligation (SOLiD)

SOLiD is een enzymatische sequencingmethode waarbij gebruik wordt gemaakt van DNA-ligase, een enzym dat op grote schaal in de biotechnologie wordt gebruikt om dubbelstrengs DNA-strengen te binden (Figuur 6)., Emulsie PCR wordt gebruikt om een ssdna-primer-bindend gebied (als adapter wordt bekend) te immobiliseren/versterken dat aan de doelopeenvolging (d.w.z. de opeenvolging die moet worden gerangschikt) op een parel is vervoegd. Deze parels worden dan afgezet op een glasoppervlak − een hoge dichtheid van parels kan worden bereikt die op zijn beurt, verhoogt de doorvoer van de techniek.

zodra de afzetting van de parel heeft plaatsgevonden, wordt een primer van lengte N gehybridiseerd met de adapter, waarna de parels worden blootgesteld aan een bibliotheek van 8-mer-sondes met verschillende fluorescerende kleurstof aan het 5′ – uiteinde en een hydroxylgroep aan het 3′ – uiteinde., Basissen 1 en 2 zijn complementair aan de te rangschikken nucleotiden terwijl basissen 3-5 gedegenereerd zijn en basissen 6-8 inosine basissen zijn. Alleen een aanvullende sonde zal hybridiseren met de doelvolgorde, grenzend aan de primer. Ligase van DNA is dan gebruikt om de 8-Mer sonde aan de inleiding aan te sluiten. Een fosforothioate verbinding tussen basissen 5 en 6 staat de fluorescente kleurstof toe om van het fragment worden gespleten gebruikend zilveren ionen., Deze splitsing staat fluorescentie toe om te worden gemeten (vier verschillende fluorescente kleurstoffen worden gebruikt, die elk verschillende emissiespectra hebben) en produceert ook een 5′-fosfaatgroep die verdere afbinding kan ondergaan. Zodra de eerste ronde van het rangschikken wordt voltooid, wordt het uitbreidingsproduct gesmolten en dan wordt een tweede ronde van het rangschikken perfomed met een inleiding van lengte N−1. Vele rondes van het rangschikken gebruikend kortere inleidingen elke keer (d.w.z. N-2, n-3 enz.) en het meten van de fluorescentie verzekert dat het doel wordt gerangschikt.,

vanwege de twee-base sequencing methode (aangezien elke base effectief tweemaal wordt gesequenced), de vaste techniek is zeer nauwkeurig (bij 99,999% met een zesde primer, het is de meest nauwkeurige van de tweede generatie platforms) en ook goedkoop. Het kan een enkele run in 7 dagen voltooien en in die tijd kan 30 Gb aan gegevens produceren. Helaas is het grootste nadeel dat de leeslengtes kort zijn, waardoor het ongeschikt is voor veel toepassingen.,

Figuur 6/Sequencing door ligatie

reversibele terminatorsequencing (Illumina)

reversibele terminatorsequencing verschilt van de traditionele sanger-methode in die zin dat, in plaats van de primerextensie irreversibel te beëindigen met behulp van dideoxynucleotide, gemodificeerde nucleotiden worden gebruikt bij reversibele terminatie. Terwijl vele andere technieken emulsie PCR gebruiken om de fragmenten van de bibliotheek van DNA te versterken, gebruikt omkeerbare beëindiging brugpcr, die de efficiency van dit stadium van het proces verbeteren.,

reversibele terminatoren kunnen in twee categorieën worden ingedeeld: 3 ‘-O-geblokkeerde reversibele terminatoren en 3 ‘ – niet-geblokkeerde reversibele terminatoren.

3 ‘ -O-geblokkeerde reversibele terminatoren

het mechanisme maakt gebruik van een sequencing door synthesebenadering, waarbij de primer stapsgewijs wordt verlengd. Ten eerste, worden de rangschikkende primers en templates bevestigd aan een stevige steun. De steun wordt blootgesteld aan elk van de vier basissen van DNA, die een verschillende fluorophore in bijlage (aan de stikstofhoudende basis) naast een 3′-o-azidomethyl groep (Figuur 7) hebben.,

Figuur 7/structuur van fluorescent gelabeld azidomethyl dNTP gebruikt in Illumina sequencing

alleen de juiste base ontloeit aan het doel en wordt vervolgens gelieerd aan de primer. De stevige steun wordt dan imaged en nucleotiden die niet zijn opgenomen worden weggespoeld en de fluorescente tak wordt gespleten gebruikend tcep(tris (2-carboxyethyl)phosphine). TCEP verwijdert ook de 3 ‘- o-azidomethylgroep en regenereert 3 ‘ – OH, en de cyclus kan worden herhaald (Figuur 8).,

Figuur 8 / reversibele terminatorsequencing

3′-niet-geblokkeerde reversibele terminatoren

de reversibele terminatiegroep van 3′ – niet-geblokkeerde reversibele terminatoren is gekoppeld aan zowel de base-als de fluorescentiegroep, die nu als onderdeel van de terminatiegroep en als reporter fungeert. Deze methode verschilt op drie manieren van de 3′-O-geblokkeerde omkeerbare terminators-methode: ten eerste wordt de 3 ‘ – positie niet geblokkeerd (d.w.z., de basis heeft Vrije 3 ‘ – OH); fluorophore is hetzelfde voor alle vier basissen; en elke gewijzigde basis wordt in opeenvolgend eerder dan tegelijkertijd gestroomd.

het grootste nadeel van deze technieken ligt in hun slechte leeslengte, die kan worden veroorzaakt door een van de twee verschijnselen. Om incorporatie van twee nucleotiden in één enkele stap te verhinderen, wordt een blok opgezet, nochtans in het geval van geen bloktoevoeging toe te schrijven aan een slechte synthese, kunnen de bundels uit fase worden die lawaai veroorzaken dat gelezen lengte beperkt. Het lawaai kan ook worden gecreeerd als fluorophore zonder succes in bijlage of verwijderd is., Deze problemen zijn overwegend in andere het rangschikken methodes en zijn de belangrijkste beperkende factoren om lengte te lezen.

Deze techniek werd ontwikkeld door Illumina, met hun hiseq en MiSeq platforms. HiSeq is de goedkoopste van de tweede generatie sequencers met een kosten van $ 0,02 per miljoen bases. Het heeft ook een hoge data-output van 600 Gb per run die ongeveer 8 dagen duurt om te voltooien.

derde generatie sequencing

een nieuwe cohort van technieken is sindsdien ontwikkeld met behulp van single molecule sequencing en single real time sequencing, waardoor de behoefte aan klonale versterking wordt weggenomen., Dit vermindert fouten veroorzaakt door PCR, vereenvoudigt bibliotheek voorbereiding en, belangrijker, geeft een veel hogere leeslengte met behulp van hogere doorvoer platforms. De voorbeelden omvatten het vreedzame platform van Biosciences dat SMRT (enige molecuul real time) gebruikt rangschikkend om gelezen lengtes van rond duizend basissen en Helicos-Biosciences te geven die enig molecuul rangschikkend gebruikt en daarom geen versterking voorafgaand aan het rangschikken vereist. De technologieën van Oxford Nanopore ontwikkelen momenteel op silicium-gebaseerde nanopores die aan een stroom worden onderworpen die verandert aangezien DNA door de porie overgaat., Dit wordt verwacht om een hoog-productie snelle methode te zijn om DNA te rangschikken, hoewel de problemen zoals het vertragen van vervoer door de porie eerst moeten worden aangepakt.

Sequencing epigenetische modificaties

net zoals sequencing van de volgende generatie genomische sequencing op grote schaal mogelijk maakte, is het onlangs duidelijk geworden dat de genetische code niet alle informatie bevat die organismen nodig hebben. Epigenetische wijzigingen aan DNA-basissen, in het bijzonder 5-methylcytosine, brengen ook belangrijke informatie over.,

alle sequencingplatforms van de tweede generatie zijn, net als Sanger-sequencing, afhankelijk van PCR en kunnen daarom geen gemodificeerde DNA-basen sequencen. In feite, worden zowel 5-methylcytosine als 5-hydroxymethylcytosine behandeld als cytosine door de enzymen betrokken bij PCR; daarom, wordt epigenetische informatie verloren tijdens het rangschikken.,

Bisulfietsequencing

Bisulfietsequencing maakt gebruik van het verschil in reactiviteit van cytosine en 5-methylcytosine met betrekking tot bisulfiet: cytosine wordt door bisulfiet gedeamineerd tot uracil (dat als T wordt gelezen wanneer gesequenced), terwijl 5-methylcytosine niet reactief is (d.w.z. als C). Als twee het rangschikken looppas parallel worden gedaan, één met bisulfietbehandeling en één zonder, wijzen de verschillen tussen de outputs van de twee looppas op geméthyleerde cytosines in de originele opeenvolging., Deze techniek kan ook voor dsDNA worden gebruikt, aangezien na behandeling met bisulfiet, de bundels niet meer complementair zijn en als ssDNA kunnen worden behandeld.

5-Hydroxymethylcytosine, een andere belangrijke epigenetische modificatie, reageert met bisulfiet om cytosine-5-methylsulfonaat te vormen (dat luidt als C wanneer gesequenced). Dit compliceert zaken enigszins, en betekent dat het bisulfiet rangschikken niet als ware indicator van methylation in zelf kan worden gebruikt.,

oxidatieve bisulfietsequencing

oxidatieve bisulfietsequencing voegt een chemische oxidatiestap toe, die 5-hydroxymethylcytosine omzet in 5-formylcytosine met behulp van kaliumperruthenaat, KRuO4, vóór de bisulfietbehandeling. 5-Formylcytosine wordt misvormd en gedeamineerd om uracil door bisulfietbehandeling te vormen. Nu zijn drie afzonderlijke sequencing runs nodig om cytosine, 5-methylcytosine en 5-hydroxymethylcytosine te onderscheiden (zie Figuur 9).,

figuur 9 | Sequencing epigenetische modificaties met behulp van bisulfiet

Applications of Next-generation sequencing

Next generation sequencing heeft onderzoekers in staat gesteld grote hoeveelheden genomische sequencinggegevens te verzamelen., Deze technologie heeft een overvloed van toepassingen, zoals: het diagnosticeren en het begrijpen van complexe ziekten; geheel-genoom rangschikken; analyse van epigenetische wijzigingen; mitochondrial rangschikken; transcriptome rangschikken-begrip hoe veranderde uitdrukking van genetische varianten een organisme beà nvloedt; en exome rangschikken − de veranderingen in exome worden verondersteld om tot 90% van veranderingen in het menselijke genoom te bevatten, die tot ziekte leidt., DNA-technieken zijn gebruikt om genen te identificeren en te isoleren die verantwoordelijk zijn voor bepaalde ziekten, en om de juiste kopie van het defecte gen te verstrekken dat ‘gentherapie’wordt genoemd.

een groot aandachtsgebied in gentherapie is kankerbehandeling – een mogelijke methode zou zijn om een antisense RNA (dat specifiek de synthese van een gericht eiwit voorkomt) in het oncogeen te introduceren, dat wordt geactiveerd om tumorcellen te vormen. Een andere methode wordt genoemd ‘zelfmoord gentherapie’ die genen introduceert om kankercellen selectief te doden., Vele genetische codes voor giftige proteã nen en enzymen zijn gekend, en de introductie van deze genen in tumorcellen zou in celdood resulteren. De moeilijkheid in deze methode is om te zorgen voor een zeer nauwkeurig leveringssysteem om te voorkomen dat het doden van gezonde cellen.
deze methoden worden mogelijk gemaakt door sequencing om tumorgenamen te analyseren, waardoor medische experts chemotherapie en andere kankerbehandelingen effectiever kunnen afstemmen op de unieke genetische samenstelling van hun patiënten, wat een revolutie teweegbrengt in de diagnostische stadia van gepersonaliseerde geneeskunde.,

naarmate de kosten van DNA-sequencing dalen, zal het meer wijdverspreid worden, wat een aantal problemen met zich meebrengt. Het rangschikken produceert Reusachtige volumes van gegevens, en er zijn vele computational uitdagingen verbonden aan verwerking en het opslaan van de gegevens. Er zijn ook ethische kwesties, zoals het eigendom van DNA van een individu wanneer het DNA wordt gerangschikt. DNA-sequencinggegevens moeten veilig worden opgeslagen, omdat er bezorgdheid bestaat dat verzekeringsgroepen, hypotheekmakelaars en werkgevers deze gegevens kunnen gebruiken om verzekeringscitaten te wijzigen of onderscheid te maken tussen kandidaten., Het rangschikken kan ook helpen om uit te vinden of een individu een verhoogd risico aan een bepaalde ziekte heeft, maar of de patiënt wordt geïnformeerd of als er een remedie voor de ziekte is een andere kwestie helemaal.

Ahmadian, A.; Svahn, H.; Massively Parallel. Sequencing Platforms met behulp van Lab op een Chip technologieën. De Spaander Van Het Laboratorium, 11, 2653 − 2655 (2011).

Balasubramanian, S.; Sequencing Nucleic Acids: from Chemistry to Medicine. Scheikunde. Commun. 47, 7281 − 7286 (2011).

Mardis, E.; Next-Generation DNA Sequencing Methods. Annu. Rev. Genomics Hum. Genet. 9, 387 − 402 (2008).

Mardis, E.,; Next-Generation DNA Sequencing Platforms. Annu. Rev Anal. Scheikunde. 6, 287-303 (2013).

Shendure, J.; Ji, H.; Next-Generation DNA Sequencing. Nat. Biotech. 26, 10 1135-1144 (2008).

zie ook

ons gratis online nucleïnezuren boek bevat informatie over alle aspecten van nucleïnezuren chemie en biologie.