Articles

Sekwencjonowanie następnej generacji

sekwencjonowanie następnej generacji

wprowadzenie

sekwencjonowanie ludzkiego genomu zostało zakończone w 2003 roku, po 13 latach współpracy międzynarodowej i Inwestycji w wysokości 3 mld USD. Human Genome Project used Sanger sekwencjonowanie (choć mocno zoptymalizowany), główną metodą sekwencjonowania DNA od jego wynalazku w 1970 roku.

dzisiaj, zapotrzebowanie na sekwencjonowanie rośnie wykładniczo, z dużymi ilościami genomowego DNA muszą być analizowane szybko, tanio i dokładnie., Dzięki nowym technologiom sekwencjonowania znanym zbiorowo jako sekwencjonowanie nowej generacji, jest teraz możliwe sekwencjonowanie całego ludzkiego genomu w ciągu kilku godzin.

sekwencjonowanie Sangera i sekwencjonowanie następnej generacji

zasada sekwencjonowania następnej generacji (NGS) jest podobna do zasady sekwencjonowania Sangera, która opiera się na elektroforezie kapilarnej. Nić genomowa jest rozdrobniona, a zasady w każdym fragmencie są identyfikowane przez emitowane sygnały, gdy fragmenty są ligowane względem nici szablonu.,
metoda Sangera wymagała oddzielnych etapów sekwencjonowania, separacji (przez elektroforezę) i detekcji, co utrudniało automatyzację przygotowania próbki i było ograniczone pod względem przepustowości, skalowalności i rozdzielczości. Metoda NGS wykorzystuje sekwencjonowanie oparte na tablicy, która łączy techniki opracowane w sekwencjonowanie Sanger przetwarzać miliony reakcji równolegle, w wyniku bardzo dużej prędkości i przepustowości przy obniżonych kosztach., Projekty sekwencjonowania genomu, które zajęło wiele lat z Sanger metody mogą teraz być zakończone w godzinach z NGS, chociaż z krótszych długości odczytu (Liczba baz, które są sekwencjonowane w czasie)i mniej dokładności. ,

metody następnej generacji sekwencjonowania DNA mają trzy ogólne etapy:

  • przygotowanie biblioteki: biblioteki są tworzone przy użyciu losowej fragmentacji DNA, a następnie ligacji za pomocą niestandardowych linkerów
  • Amplifikacja: Biblioteka jest amplifikowana przy użyciu metod amplifikacji klonalnej i PCR
  • sekwencjonowanie: DNA jest sekwencjonowane przy użyciu jednego z kilku różnych podejść

przygotowanie Biblioteki

Po pierwsze, DNA jest fragmentowane enzymatycznie lub przez sonikacja (wzbudzenie za pomocą ultradźwięków) do tworzenia mniejszych pasm., Adaptory (krótkie, dwuniciowe fragmenty syntetycznego DNA) są następnie ligowane do tych fragmentów za pomocą ligazy DNA, enzymu, który łączy nici DNA. Adaptery umożliwiają Wiązanie sekwencji z komplementarnym odpowiednikiem.

adaptery są syntetyzowane tak, że jeden koniec jest „lepki”, podczas gdy drugi jest „tępy” (niespójny) w celu połączenia tępego końca z tępym zakończeniem DNA. Może to prowadzić do potencjalnego problemu parowania zasad między cząsteczkami, a tym samym tworzenia dimerów., Aby temu zapobiec, wykorzystuje się strukturę chemiczną DNA, ponieważ ligacja odbywa się między końcami 3′-OH i 5′-p. Usuwając fosforan z lepkiego końca adaptera i tworząc w ten sposób koniec 5′-OH, ligaza DNA nie jest w stanie utworzyć mostu między dwoma końcami (ryc. 1).,

Rysunek 1 | Przygotowanie biblioteki do sekwencjonowania następnej generacji

aby sekwencjonowanie zakończyło się sukcesem, fragmenty biblioteki muszą być sklastrowane przestrzennie w koloniach PCR lub „poloniach”, które składają się z wielu kopii określonego fragmentu biblioteki. Ponieważ Polonie te są przymocowane w sposób planarny, cechy tablicy mogą być manipulowane enzymatycznie równolegle. Ta metoda budowy biblioteki jest znacznie szybsza niż poprzednia pracochłonna procedura zbierania Kolonii i E., klonowanie coli używane do izolowania i amplifikacji DNA do sekwencjonowania Sangera, jednak odbywa się to kosztem długości odczytu fragmentów.

Amplifikacja

Amplifikacja biblioteki jest wymagana, aby odebrany sygnał z sekwencera był wystarczająco silny, aby został dokładnie wykryty. W przypadku amplifikacji enzymatycznej mogą wystąpić zjawiska takie jak „biasing” i „duplikacja” prowadzące do preferencyjnego amplifikacji niektórych fragmentów biblioteki. Zamiast, tam być kilka Typ amplification proces który używać PCR tworzyć duża liczba DNA klastry.,

Emulsja PCR

olej emulsyjny, koraliki, mieszanka PCR i DNA biblioteki są mieszane, tworząc emulsję, która prowadzi do powstawania mikro studni (ryc. 2).

Rysunek 2 | Emulsja PCR

aby proces sekwencjonowania przebiegał pomyślnie, każda mikro studnia powinna zawierać jeden koralik z jedną nicią DNA (około 15% mikro studni ma ten skład). PCR następnie denaturuje fragment biblioteki prowadzący dwie oddzielne nici, z których jedna (odwrotna nić) wyżarza się do koralika., Wyżarzone DNA jest wzmacniany przez polimerazę począwszy od koralika w kierunku miejsca podkładu. Oryginalna odwrotna nić następnie denaturuje i jest uwalniana z koralika tylko w celu ponownego wyżarzania do koralika, aby uzyskać dwa oddzielne pasma. Oba są wzmocnione, aby dać dwie nici DNA przymocowane do koralika. Proces jest następnie powtarzany przez 30-60 cykli prowadzących do klastrów DNA. Technika ta została skrytykowana za jej czasochłonność, ponieważ wymaga wielu etapów (formowania i rozbijania emulsji, wzmacniania PCR, wzbogacania itp.) pomimo jej szerokiego zastosowania w wielu platformach NGS., Jest to również stosunkowo nieefektywne, ponieważ tylko około dwóch trzecich mikro reaktorów emulsji będzie rzeczywiście zawierać jeden koralik. W związku z tym wymagany jest dodatkowy krok w celu oddzielenia pustych systemów, co prowadzi do większej liczby potencjalnych nieścisłości.

most PCR

powierzchnia komórki przepływowej jest gęsto pokryta podkładami, które są komplementarne do podkładów dołączonych do fragmentów biblioteki DNA (ryc. 3). DNA jest następnie dołączany do powierzchni komórki losowo, gdzie jest narażony na odczynniki do rozszerzenia polimerazy opartej., Po dodaniu nukleotydów i enzymów wolne końce pojedynczych nici DNA przyłączają się do powierzchni komórki za pomocą komplementarnych primerów, tworząc struktury mostkowe. Enzymy następnie wchodzą w interakcje z mostkami, aby uczynić je dwuniciowymi, tak że gdy następuje denaturacja, dwa jednoniciowe fragmenty DNA są przymocowane do powierzchni w bliskiej odległości. Powtarzanie tego procesu prowadzi do klonalnych klastrów zlokalizowanych identycznych pasm. W celu optymalizacji gęstości klastra, stężenia odczynników muszą być ściśle monitorowane, aby uniknąć przeludnienia.,

Rysunek 3 | mostkowanie PCR

sekwencjonowanie

kilka konkurencyjnych metod sekwencjonowania następnej generacji zostały opracowane przez różne firmy.

454 Pirosekwencjonowanie

Pirosekwencjonowanie opiera się na zasadzie „sekwencjonowania przez syntezę”, gdzie komplementarna nić jest syntetyzowana w obecności enzymu polimerazy (ryc. 4). W przeciwieństwie do stosowania dideoksynukleotydów do zakończenia amplifikacji łańcucha (jak w sekwencjonowaniu Sangera), pirosekwencjonowanie wykrywa zamiast tego uwalnianie pirofosforanu, gdy nukleotydy są dodawane do łańcucha DNA., Początkowo wykorzystuje technikę emulsji PCR do konstruowania polonów wymaganych do sekwencjonowania i usuwa komplementarną nić. Następnie podkład sekwencyjny ssDNA hybrydyzuje na końcu pasma( region wiążący podkład), następnie cztery różne dNTPs są następnie kolejno wykonane, aby przepływać do i z odwiertów nad polonami. Gdy prawidłowy dNTP jest enzymatycznie włączony do pasma, powoduje uwalnianie pirofosforanu. W obecności sulfurylazy ATP i adenozyny Pirofosforan przekształca się w ATP., Ta cząsteczka ATP jest używana do katalizowanej przez lucyferynę konwersji lucyferyny do oksylucyferyny, która wytwarza światło, które można wykryć za pomocą kamery. Względne natężenie światła jest proporcjonalne do ilości dodanej bazy(tj. pik dwukrotnie większy od natężenia wskazuje, że dwie identyczne bazy zostały dodane kolejno).,

Rysunek 4/454 Pyrosequencing

Pyrosequencing, opracowany przez 454 Life Sciences, był jednym z wczesnych sukcesów sekwencjonowania nowej generacji; rzeczywiście, 454 Life Sciences wyprodukował pierwszy dostępny komercyjnie sekwencer nowej generacji. Jednak metoda została przyćmiona przez inne technologie i w 2013 r. nowi właściciele Roche ogłosili zamknięcie 454 Life Sciences i zaprzestanie platformy pyrosequencing 454.,

Ion torrent semiconductor sequencing

Ion torrent sequencing uses a „sequencing by synthesis” approach, in which a new DNA strand, complementary to the target strand, is synthesized one base at a time. Układ półprzewodnikowy wykrywa jony wodorowe wytwarzane podczas polimeryzacji DNA (ryc. 5).

Po utworzeniu polonu za pomocą emulsji PCR, fragment biblioteki DNA jest zalewany sekwencyjnie z każdym trifosforanem nukleozydu (dNTP), jak w pirosekwencji. DNTP jest następnie włączany do nowej nici, jeśli komplementarny do nukleotydu na nici docelowej., Za każdym razem, gdy nukleotyd jest pomyślnie dodany, jon wodorowy jest uwalniany i wykrywany przez czujnik pH sekwencera. Podobnie jak w metodzie pirosekwencjonowania, jeśli dodaje się więcej niż jeden z tych samych nukleotydów, zmiana natężenia pH/sygnału jest odpowiednio większa.

Rysunek 5/Ion Torrent sekwencjonowanie półprzewodników

Ion torrent sekwencjonowanie jest pierwszą komercyjną techniką nie używać fluorescencji i skanowania kamery; dlatego jest szybsze i tańsze niż wiele innych metod., Niestety, może być trudno wyliczyć liczbę identycznych baz dodanych kolejno. Na przykład, może być trudno odróżnić zmianę pH dla homorepeat o długości 9 do jednej z długości 10, co utrudnia dekodowanie powtarzających się sekwencji.

sekwencjonowanie przez ligację (Ciało Stałe)

ciało stałe jest enzymatyczną metodą sekwencjonowania, która wykorzystuje ligazę DNA, enzym szeroko stosowany w biotechnologii ze względu na jego zdolność do ligowania dwuniciowych nici DNA (Rysunek 6)., Emulsja PCR służy do unieruchomienia / wzmocnienia regionu wiążącego ssdna (znanego jako adapter), który został sprzężony z sekwencją docelową (tj. sekwencją, która ma być zsekwencjonowana) na koraliku. Koraliki te są następnie osadzane na szklanej powierzchni − można uzyskać wysoką gęstość koralików, co z kolei zwiększa przepustowość techniki.

Po osadzaniu się koralików, podkład o długości N jest hybrydyzowany z adapterem, a następnie koraliki są narażone na bibliotekę sond 8-mer, które mają inny barwnik fluorescencyjny na końcu 5′ i grupę hydroksylową na końcu 3′., Zasady 1 i 2 uzupełniają się w stosunku do sekwencjonowanych nukleotydów, podczas gdy zasady 3-5 są zdegenerowane, a Zasady 6-8 są zasadami inozyny. / Align = „left” / Ligaza DNA jest następnie wykorzystywana do przyłączenia sondy 8-mer do podkładu. Wiązanie fosforotionianowe między zasadami 5 i 6 pozwala na odszczepienie fluorescencyjnego barwnika z fragmentu za pomocą jonów srebra., To rozszczepienie pozwala fluorescencji mierzyć (cztery różne fluorescencyjne barwniki są używane, z których wszystkie mają różne widmo emisji), a także generuje 5 ' – fosforan grupa która może ulegać dalszemu ligacji. Po zakończeniu pierwszej rundy sekwencjonowania produkt rozszerzenia jest stopiony, a następnie druga runda sekwencjonowania jest perfomed z podkładem o długości N-1. Wiele rund sekwencjonowania przy użyciu krótszych podkładów za każdym razem (N-2, N−3 itp.) i pomiar fluorescencji zapewnia, że cel jest sekwencjonowany.,

ze względu na metodę sekwencjonowania dwóch baz (ponieważ każda baza jest skutecznie sekwencjonowana dwukrotnie), technika stała jest bardzo dokładna (przy 99,999% z szóstym podkładem, jest najdokładniejsza z platform drugiej generacji), a także niedroga. Może ukończyć jeden bieg w ciągu 7 dni i w tym czasie może wyprodukować 30 Gb danych. Niestety, jego główną wadą jest to, że długości odczytu są krótkie, co sprawia, że nie nadaje się do wielu zastosowań.,

Rysunek 6 | sekwencjonowanie przez ligację

odwracalne sekwencjonowanie terminatora (Illumina)

odwracalne sekwencjonowanie terminatora różni się od tradycyjnej metody Sangera tym, że zamiast nieodwracalnego zakończenia rozszerzenia podkładu przy użyciu dideoksynukleotydu, zmodyfikowane nukleotydy są używane w odwracalnym zakończeniu. Podczas gdy wiele innych technik używać Emulsja PCR amplifikować DNA biblioteka fragmenty, odwracalny terminacja używa most PCR, ulepszający wydajność ten etap proces.,

terminatory odwracalne można podzielić na dwie kategorie: 3′-o-zablokowane terminatory odwracalne i 3′-odblokowane terminatory odwracalne.

3′-o-zablokowane terminatory odwracalne

mechanizm wykorzystuje podejście sekwencjonowania przez syntezę, wydłużając grunt w sposób stopniowy. Po pierwsze, podkłady sekwencyjne i szablony są przymocowane do solidnego podparcia. Podpora jest wystawiona na działanie każdej z czterech zasad DNA, które oprócz grupy 3′-O-azydometylowej (ryc. 7) mają przyłączony inny fluorofor (do zasady azotowej).,

Rysunek 7/struktura znakowanego fluorescencyjnie azydometylowego dNTP stosowanego w sekwencjonowaniu iluminacji

tylko prawidłowa podstawa wyżarzana jest do celu i następnie ligowana do podkładu. Stałe podparcie jest następnie obrazowane i nukleotydy, które nie zostały włączone, są wymywane, a fluorescencyjna gałąź jest rozszczepiana za pomocą TCEP(tris (2-karboksyetylo)fosfina). TCEP usuwa również grupę 3 '-O-azydometylową, regenerując 3 ' – OH, a cykl można powtórzyć (ryc. 8).,

Rysunek 8 | odwracalne sekwencjonowanie Terminatorów

3′-odblokowane terminatory odwracalne

odwracalna Grupa Terminatorów odwracalnych 3′-odblokowanych jest powiązana zarówno z grupą bazową, jak i grupą fluorescencyjną, która obecnie działa jako część grupy Terminatorów, a także jako reporter. Metoda ta różni się od metody 3′-o-zablokowanych Terminatorów odwracalnych na trzy sposoby: po pierwsze, pozycja 3 ' nie jest zablokowana (tj., baza ma wolne 3 ' – OH); fluorofor jest taki sam dla wszystkich czterech zasad; a każda zmodyfikowana baza jest przepływana sekwencyjnie, a nie w tym samym czasie.

główną wadą tych technik jest ich słaba długość odczytu, która może być spowodowana jednym z dwóch zjawisk. Aby zapobiec inkorporacji dwóch nukleotydów w jednym kroku, blok jest umieszczany, jednak w przypadku braku dodatku bloku z powodu słabej syntezy, nici mogą wyjść z fazy tworząc szum, który ogranicza długość odczytu. Hałas może być również wytwarzany, jeśli fluorofor jest bezskutecznie dołączony lub usunięty., Problemy te są powszechne w innych metodach sekwencjonowania i są głównymi czynnikami ograniczającymi długość odczytu.

technika ta została zapoczątkowana przez Illuminę, z ich platformami HiSeq i MiSeq. HiSeq jest najtańszym z sekwencerów drugiej generacji o koszcie 0,02 USD za milion baz. Ma również wysoką wydajność danych 600 Gb na run, która trwa około 8 dni.

sekwencjonowanie trzeciej generacji

Nowa kohorta technik został opracowany przy użyciu sekwencjonowania pojedynczych cząsteczek i pojedynczych sekwencjonowania w czasie rzeczywistym, usuwając potrzebę clonal amplifikacji., Zmniejsza to błędy powodowane przez PCR, upraszcza przygotowanie biblioteki i, co najważniejsze, zapewnia znacznie większą długość odczytu przy użyciu platform o wyższej przepustowości. Przykłady zawierają Pacific Biosciences ' Platforma który używa SMRT (single molecule real time) uporządkowywać dawać czytający długościach wokoło tysiąc zasady i Helicos Biosciences który używa pojedynczy molekuła uporządkowywać i dlatego nie wymaga amplification przed uporządkowywać. Oxford Nanopore Technologies są obecnie rozwój nanopore na bazie krzemu, które są poddawane prądowi, który zmienia się jak DNA przechodzi przez porów., Przewiduje się, że będzie to szybka metoda sekwencjonowania DNA o wysokiej przepustowości, chociaż problemy takie jak spowolnienie transportu przez pory muszą być najpierw rozwiązane.

sekwencjonowanie modyfikacje epigenetyczne

tak jak sekwencjonowanie nowej generacji umożliwiło sekwencjonowanie genomu na masową skalę, stało się jasne ostatnio, że kod genetyczny nie zawiera wszystkich informacji potrzebnych organizmom. Epigenetyczne modyfikacje zasad DNA, w szczególności 5-metylocytozyna, również przekazują ważne informacje.,

wszystkie platformy sekwencjonowania drugiej generacji zależą, podobnie jak sekwencjonowanie Sangera, od PCR i dlatego nie mogą sekwencjonować zmodyfikowanych zasad DNA. W rzeczywistości zarówno 5-metylocytozyna, jak i 5-hydroksymetylocytozyna są traktowane jako cytozyna przez enzymy zaangażowane w PCR; dlatego informacja epigenetyczna jest tracona podczas sekwencjonowania.,

sekwencjonowanie Wodorosiarczynowe

sekwencjonowanie Wodorosiarczynowe wykorzystuje różnicę reaktywności cytozyny i 5-metylocytozyny w odniesieniu do wodorosiarczynu: cytozyna jest deaminowana przez wodorosiarczyn, tworząc uracyl (który odczytuje się jako T, gdy sekwencjonuje), podczas gdy 5-metylocytozyna jest niereaktywna (tj. czyta się jako C). Jeśli dwa cykle sekwencjonowania są wykonywane równolegle, jeden z obróbką wodorosiarczynową i jeden bez, różnice między wyjściami dwóch cykli wskazują metylowane cytozyny w sekwencji pierwotnej., Technika ta może być również stosowana do dsDNA, ponieważ po obróbce wodorosiarczynem nici nie są już komplementarne i mogą być traktowane jako ssDNA.

5-Hydroksymetylocytozyna, inna ważna modyfikacja epigenetyczna, reaguje z wodorosiarczynem, tworząc cytozyno-5-metylosulfonian (który odczytuje się jako C po zsekwencjonowaniu). Komplikuje to nieco sprawy i oznacza, że sekwencjonowanie wodorosiarczynów nie może być używane jako prawdziwy wskaźnik metylacji w sobie.,

oksydacyjne uporządkowanie wodorosiarczynowe

oksydacyjne uporządkowanie wodorosiarczynowe dodaje chemiczny etap utleniania, który przekształca 5-hydroksymetylocytozynę w 5-formylocytozynę przy użyciu nadrutenianu potasu, KRuO4, przed obróbką wodorosiarczynową. 5-Formylcytozyna jest deformowana i deaminowana w celu utworzenia uracylu w wyniku leczenia wodorosiarczynem. Obecnie do rozróżnienia cytozyny, 5-metylocytozyny i 5-hydroksymetylocytozyny potrzebne są trzy oddzielne sekwencjonowania (patrz rysunek 9).,

Rysunek 9 | sekwencjonowanie epigenetyczne modyfikacje przy użyciu bisulfit

zastosowania sekwencjonowania następnej generacji

sekwencjonowanie następnej generacji umożliwiło naukowcom zebranie ogromnych ilości danych sekwencjonowania genomu., Technologia ta ma wiele zastosowań, takich jak: diagnozowanie i zrozumienie złożonych chorób; sekwencjonowanie całego genomu; analiza modyfikacji epigenetycznych; sekwencjonowanie mitochondrialne; sekwencjonowanie transkryptomu-zrozumienie, w jaki sposób zmieniona ekspresja wariantów genetycznych wpływa na organizm; i sekwencjonowanie egzomu − mutacje w egzomie uważa się, że zawierają do 90% mutacji w ludzkim genomie, co prowadzi do choroby., Techniki DNA zostały wykorzystane do identyfikacji i izolowania genów odpowiedzialnych za niektóre choroby, i zapewnić prawidłową kopię wadliwego genu znany jako „terapii genowej”.

dużym obszarem zainteresowania terapii genowej jest leczenie raka – jedną z potencjalnych metod byłoby wprowadzenie antysensownego RNA (który specjalnie zapobiega syntezie docelowego białka) do onkogenu, który jest wyzwalany do tworzenia komórek nowotworowych. Inna metoda nosi nazwę „samobójcza terapia genowa”, która wprowadza geny do selektywnego zabijania komórek nowotworowych., Znane są liczne kody genetyczne toksycznych białek i enzymów, a wprowadzenie tych genów do komórek nowotworowych skutkowałoby śmiercią komórki. Trudność w tej metodzie jest zapewnienie bardzo precyzyjnego systemu dostarczania, aby zapobiec zabijaniu zdrowych komórek.
metody te są możliwe dzięki sekwencjonowaniu w celu analizy genomów nowotworów, dzięki czemu eksperci medyczni mogą skuteczniej dostosowywać chemioterapię i inne metody leczenia raka do unikalnego składu genetycznego swoich pacjentów, rewolucjonizując etapy diagnostyczne spersonalizowanej medycyny.,

wraz ze spadkiem kosztów sekwencjonowania DNA stanie się on coraz bardziej powszechny, co wiąże się z wieloma problemami. Sekwencjonowanie produkuje ogromne ilości danych, i istnieje wiele wyzwań obliczeniowych związanych z przetwarzaniem i przechowywaniem danych. Istnieją również kwestie etyczne, takie jak własność DNA danej osoby, gdy DNA jest sekwencjonowane. Dane sekwencjonowania DNA muszą być bezpiecznie przechowywane, ponieważ istnieją obawy, że grupy ubezpieczeniowe, brokerzy hipoteczni i pracodawcy mogą wykorzystywać te dane do modyfikowania ofert ubezpieczeniowych lub rozróżniania kandydatów., Sekwencjonowanie może również pomóc dowiedzieć się, czy dana osoba ma zwiększone ryzyko danej choroby, ale czy pacjent jest informowany lub czy istnieje lekarstwo na chorobę jest zupełnie inny problem.

Platformy sekwencjonujące z wykorzystaniem technologii Lab on A Chip. Chip Laboratoryjny, 11, 2653 − 2655 (2011).

Balasubramanian, S.; sekwencjonowanie kwasów nukleinowych: od chemii do medycyny. Chem. Komuna. 47, 7281 − 7286 (2011).

Mardis, E.; Metody sekwencjonowania DNA nowej generacji. Annu. Ks. Genomika Hum. Genet. 9, 387 − 402 (2008).

Mardis, E.,; Platformy sekwencjonowania DNA nowej generacji. Annu. Rev.Anal Chem. 6, 287-303 (2013).

Shendure, J.; Ji, H.; sekwencjonowanie DNA nowej generacji. Nat. Biotechnologia. 26, 10 1135-1144 (2008).

Zobacz także

nasza bezpłatna książka online Nucleic Acids zawiera informacje na temat wszystkich aspektów chemii i biologii kwasów nukleinowych.