Sequenciação de próxima geração
sequenciação de próxima geração
introdução
a sequenciação do genoma humano foi concluída em 2003, após 13 anos de colaboração internacional e investimento de USD 3 bilhões. O Projeto Genoma Humano usou sequenciamento de Sanger (embora fortemente otimizado), o principal método de sequenciamento de DNA desde sua invenção na década de 1970.
hoje, a demanda por sequenciamento está crescendo exponencialmente, com grandes quantidades de DNA genômico precisando ser analisado rapidamente, barato e com precisão., Graças às novas tecnologias de sequenciamento conhecidas coletivamente como sequenciamento da próxima geração, agora é possível sequenciar um genoma humano inteiro em questão de horas.
sequenciação de Sanger e sequenciação de próxima geração
o princípio por trás da sequenciação de próxima geração (NGS) é semelhante ao da sequenciação de Sanger, que depende da eletroforese capilar. A cadeia genômica é fragmentada, e as bases em cada fragmento são identificadas por sinais emitidos quando os fragmentos são ligados contra uma cadeia template.,o método de Sanger exigiu passos separados para sequenciamento, separação (por eletroforese) e detecção, o que tornou difícil automatizar a preparação da amostra e foi limitado em produtividade, escalabilidade e resolução. O método NGS usa sequenciamento baseado em matriz que combina as técnicas desenvolvidas na sequenciação de Sanger para processar milhões de reações em paralelo, resultando em muito alta velocidade e rendimento a um custo reduzido., Os projetos de sequenciamento do genoma que levaram muitos anos com métodos de Sanger podem agora ser concluídos em horas com NGS, embora com menor comprimento de leitura (o número de bases que são sequenciadas em um momento) e menos precisão.,
a Próxima geração de métodos de sequenciamento de DNA tem três etapas gerais:
- Biblioteca de preparação: bibliotecas são criadas usando random fragmentação de DNA, seguido por ligadura com o costume, linkers
- Amplificação: a biblioteca é amplificado usando clonal métodos de amplificação e PCR
- Sequenciamento: DNA seqüenciado usando uma das várias abordagens diferentes
Biblioteca de preparo
em Primeiro lugar, o DNA é fragmentado ou carboximetilcelulose ou por sonicação (excitação ultra-sonografia) para criar pequenos fios., Adaptadores (Peças curtas de cadeia dupla de DNA sintético) são então ligados a estes fragmentos com a ajuda da ligase de DNA, uma enzima que une cadeias de DNA. Os adaptadores permitem que a sequência fique ligada a uma contraparte complementar.
adaptadores são sintetizados de modo que uma extremidade é ‘pegajosa’ enquanto a outra é ‘contundente’ (não coesa) com a vista de unir a extremidade contundente ao ADN contundente. Isto poderia levar ao problema potencial de emparelhamento de base entre moléculas e, portanto, a formação de dímero., Para evitar isso, a estrutura química do DNA é utilizada, uma vez que a ligação ocorre entre as extremidades 3′-OH e 5′-P. Ao remover o fosfato da extremidade pegajosa do adaptador e, portanto, criar uma extremidade 5′-OH em vez disso, a ligase de DNA é incapaz de formar uma ponte entre os dois terminos (Figura 1).,
a Figura 1 | Biblioteca preparação da Próxima geração de sequenciamento
para seqüenciamento para ser bem sucedida, a biblioteca de fragmentos precisam ser espacialmente agrupado em PCR de colônias ou ‘polonies”, como eles são convencionalmente conhecido, que consistem em muitas cópias de uma determinada biblioteca de fragmento. Uma vez que estas polonias são anexadas de forma planar, as características da matriz podem ser manipuladas enzimaticamente em paralelo. Este método de construção de bibliotecas é muito mais rápido do que o anterior Procedimento Intensivo de mão-de-obra de colony picking e E., clonagem de coli usada para isolar e amplificar o DNA para sequenciamento de Sanger, no entanto, isso é à custa do comprimento de leitura dos fragmentos.
amplificação
amplificação da Biblioteca é necessária para que o sinal recebido do sequenciador seja forte o suficiente para ser detectado com precisão. Com a amplificação enzimática, fenômenos como’ biasing ‘e’ duplicação ‘ podem ocorrer levando à amplificação preferencial de certos fragmentos da biblioteca. Em vez disso, existem vários tipos de processo de amplificação que usam PCR para criar um grande número de aglomerados de DNA.,emulsão PCR óleo de emulsão, esferas, mistura de PCR e ADN da biblioteca são misturados para formar uma emulsão que conduz à formação de micro-poços (Figura 2).
Figura 2 | emulsão PCR
para que o processo de sequenciação seja bem sucedido, cada micro-poço deve conter uma pérola com uma cadeia de ADN (aproximadamente 15% dos micro-poços têm esta composição). O PCR então denota o fragmento da biblioteca liderando duas cadeias separadas, uma das quais (a cadeia reversa) anula para a conta., O ADN recozido é amplificado pela polimerase a partir da cama para o local da iniciação. A cadeia reversa original, em seguida, denature e é liberado da conta apenas para re-anneal para a conta para dar dois fios separados. Ambos são amplificados para dar duas cadeias de ADN ligadas à conta. O processo é então repetido ao longo de 30-60 ciclos levando a aglomerados de DNA. Esta técnica tem sido criticada pela sua natureza demorada, uma vez que requer muitos passos (formação e quebra da emulsão, amplificação PCR, enriquecimento, etc.), apesar do seu uso extensivo em muitas das plataformas NGS., Também é relativamente ineficiente, uma vez que apenas cerca de dois terços dos micro-reactores de emulsão conterão, de facto, uma pérola. Por conseguinte, é necessário um passo adicional para separar os sistemas vazios que conduzem a mais imprecisões potenciais.
PCR de Ponte
a superfície da célula de fluxo é densamente revestida com iniciadores que são complementares dos iniciadores ligados aos fragmentos da biblioteca de ADN (Figura 3). O ADN é então ligado à superfície da célula aleatoriamente, onde é exposto a reagentes para a extensão baseada na polimerase., On addition of nucleotides and enzymes, the free ends of the single strands of DNA attach themselves to the surface of the cell via complementary primers, creating bridged structures. Enzimas então interagem com as pontes para torná-las de cadeia dupla, de modo que quando a desnaturação ocorre, dois fragmentos de DNA de cadeia simples são ligados à superfície em estreita proximidade. A repetição deste processo leva a aglomerados clonais de cadeias idênticas localizadas. A fim de optimizar a densidade de aglomerados, as concentrações de reagentes devem ser monitorizadas de muito perto, a fim de evitar a sobrelotação.,
Figura 3 | Bridging PCR
sequenciação
vários métodos concorrentes de sequenciação da próxima geração foram desenvolvidos por diferentes empresas.a Pirosequenciação
454 baseia-se no princípio da “sequenciação por síntese”, em que uma cadeia complementar é sintetizada na presença de enzima polimerase (Figura 4). Em contraste com o uso de dideoxinucleótidos para terminar a amplificação de cadeia (como na sequenciação de Sanger), a pirosequenciação detecta a liberação de pirofosfato quando os nucleótidos são adicionados à cadeia de DNA., Inicialmente usa a técnica de emulsão PCR para construir as polonias necessárias para sequenciar e remove a cadeia complementar. Em seguida, um primer de sequenciamento ssDNA hibridiza até o final da cadeia (região de ligação de primer), em seguida, os quatro dNTPs diferentes são então sequencialmente feitos para fluir dentro e fora dos poços sobre as polónias. Quando a dNTP correcta é enzimaticamente incorporada na cadeia, provoca a libertação de pirofosfato. Na presença de ATP sulfurilase e adenosina, o pirofosfato é convertido em ATP., Esta molécula ATP é utilizada para a conversão catalisada pela luciferase da luciferina em oxiluciferina, que produz luz que pode ser detectada com uma câmara. A intensidade relativa da luz é proporcional à quantidade de base adicionada (ou seja, um pico de duas vezes a intensidade indica que duas bases idênticas foram adicionadas em sucessão).,
Figura 4 | 454 Pyrosequencing
Figura 4 | 454 Pyrosequencing
Pyrosequencing, desenvolvido pela 454 Life Sciences, foi um dos primeiros sucessos da Próxima geração de sequenciamento; de fato, 454 Life Sciences produziu o primeiro comercialmente disponíveis, a Próxima geração do seqüenciador. No entanto, o método foi eclipsado por outras tecnologias e, em 2013, os novos proprietários Roche anunciou o fechamento de 454 Ciências da vida e a descontinuação da plataforma 454 pirosequenciadores.,
sequenciação de torrente de iões
sequenciação de torrentes de iões utiliza uma abordagem de “sequenciação por síntese”, na qual uma nova cadeia de ADN, complementar à cadeia-alvo, é sintetizada uma base de cada vez. Um chip semicondutor detecta os íons de hidrogênio produzidos durante a polimerização do DNA (Figura 5).o fragmento da biblioteca de ADN é inundado sequencialmente com cada trifosfato de nucleósido (dNTP), como na pirosequenciação. O dNTP é então incorporado na nova cadeia se complementar ao nucleótido na cadeia-alvo., Cada vez que um nucleótido é adicionado com sucesso, um íon de hidrogênio é liberado, e ele é detectado pelo sensor de pH do sequenciador. Como no método de pirosequenciamento, se mais de um do mesmo nucleótido é adicionado, a mudança na intensidade do pH/sinal é correspondentemente maior.
Figura 5 | Ion Torrent semicondutores de seqüenciamento
Ion torrent seqüenciamento é a primeira técnica comercial não usar fluorescência e câmera de digitalização; é, portanto, mais rápido e mais económicos do que os outros métodos., Infelizmente, pode ser difícil enumerar o número de bases idênticas adicionadas consecutivamente. Por exemplo, pode ser difícil diferenciar a mudança de pH para um homorepeat de comprimento 9 para um de comprimento 10, tornando difícil descodificar sequências repetitivas. a sequenciação por ligação (sólido) é um método enzimático de sequenciação que utiliza a ligase do DNA, uma enzima amplamente utilizada em biotecnologia para sua capacidade de ligar cadeias de DNA de cadeia dupla (Figura 6)., A emulsão PCR é utilizada para imobilizar / amplificar uma região de ligação primária do ssDNA (conhecida como adaptador) que foi conjugada com a sequência-alvo (ou seja, a sequência a ser sequenciada) num feixe. Essas contas são então depositadas em uma superfície de vidro − uma alta densidade de contas pode ser alcançada o que, por sua vez, aumenta o Rendimento da técnica.
Uma vez que a deposição de contas tenha ocorrido, um iniciador de comprimento N é hibridizado para o adaptador, em seguida, as contas são expostas a uma biblioteca de sondas 8-mer que têm diferentes corantes fluorescentes na extremidade 5′ e um grupo hidroxilo na extremidade 3′., As Bases 1 e 2 são complementares aos nucleótidos a serem sequenciados enquanto as bases 3-5 São degeneradas e as bases 6-8 são bases inosina. Apenas uma sonda complementar irá hibridar com a sequência alvo, adjacente à primer. A ligase de DNA é então usada para unir a sonda de 8-mer ao iniciador. Uma ligação fosforotioato entre bases 5 e 6 permite que o corante fluorescente seja clivado do fragmento usando iões de prata., Esta clivagem permite medir a fluorescência (utilizam-se quatro corantes fluorescentes diferentes, todos com espectros de emissão diferentes) e também gera um grupo de 5′ – fosfato que pode sofrer uma ligação adicional. Uma vez concluída a primeira rodada de sequenciamento, o produto de extensão é derretido e, em seguida, uma segunda rodada de sequenciação é perfomada com um iniciador de comprimento N−1. Muitas rodadas de sequenciação usando iniciadores mais curtos de cada vez (ou seja, N−2, N−3 etc) e a medição da fluorescência garante que o alvo é sequenciado.,
devido ao método de sequenciação de duas bases (uma vez que cada base é efetivamente sequenciada duas vezes), a técnica sólida é altamente precisa (em 99.999% com uma sexta primer, é a mais precisa das plataformas de segunda geração) e também barata. Ele pode completar uma única corrida em 7 dias e nesse tempo pode produzir 30 Gb de dados. Infelizmente, a sua principal desvantagem é que os comprimentos de leitura são curtos, tornando-o inadequado para muitas aplicações.,
Figura 6 | Sequenciamento por ligadura
Reversível terminator sequencing ” (Illumina)
Reversível terminator sequencing difere do tradicional método de Sanger em que, em vez de terminar a extensão do primer de forma irreversível, usando dideoxynucleotide, modificado nucleotídeos são utilizados na reversível rescisão. Enquanto muitas outras técnicas usam emulsão PCR para amplificar os fragmentos da biblioteca de DNA, terminação reversível usa bridge PCR, melhorando a eficiência desta fase do processo.,
terminadores reversíveis podem ser agrupados em duas categorias: terminadores reversíveis 3′-O-bloqueados e terminadores reversíveis 3′-desbloqueados.
3′-o-bloqueou terminadores reversíveis
o mecanismo utiliza uma sequenciação por abordagem de síntese, alongando o iniciador de uma forma gradual. Em primeiro lugar, os iniciadores e modelos de sequenciamento são fixos a um suporte sólido. O suporte é exposto a cada uma das quatro bases de ADN, que têm um fluoróforo diferente ligado (à base azotada) além de um grupo 3′-o-azidometilo (Figura 7).,
Figura 7 | Estrutura de microesferas rotulados azidomethyl mistura de dntp usado em Illumina seqüenciamento
Apenas o correcto da base de dados de anneals para o público-alvo e, posteriormente, ligated para o primer. O suporte sólido é então fotografado e os nucleótidos que não foram incorporados são lavados e o ramo fluorescente é clivado usando TCEP (tris(2-carboxietil)fosfina). O CCEP também remove o grupo 3′ – o-azidometilo, regenerando 3 ‘ – OH, e o ciclo pode ser repetido (Figura 8) .,
Figura 8 | Reversível terminator sequencing
3′-desbloqueado reversível terminadores
O reversíveis rescisão do grupo 3′-desbloqueado reversível terminadores é ligado à base e a fluorescência do grupo, que agora atua como parte do encerramento do grupo, bem como um repórter. Este método difere do método dos terminadores reversíveis 3′-O-bloqueados de três maneiras: em primeiro lugar, a posição 3’não é bloqueada (i.e., a base tem 3′-OH livre; o fluoróforo é o mesmo para todas as quatro bases; e cada base modificada é fluída sequencialmente em vez de ao mesmo tempo.
A principal desvantagem destas técnicas reside no seu baixo Comprimento de leitura, o que pode ser causado por um de dois fenômenos. A fim de evitar a incorporação de dois nucleótidos em um único passo, um bloco é posto em prática, no entanto, no caso de não adição de bloco devido a uma fraca síntese, as cadeias podem sair de fase criando ruído que limita o comprimento de leitura. O ruído também pode ser criado se o fluoróforo for anexado ou removido sem sucesso., Estes problemas são prevalentes em outros métodos de sequenciação e são os principais fatores limitadores de comprimento de leitura.
Esta técnica foi pioneira pela Illumina, com suas plataformas HiSeq e MiSeq. HiSeq é o mais barato dos sequenciadores de segunda geração com um custo de $0,02 por milhão de bases. Ele também tem uma alta saída de dados de 600 Gb por execução, que leva cerca de 8 dias para completar.
sequenciação de terceira geração
uma nova coorte de técnicas tem sido desenvolvida desde então usando sequenciação de moléculas simples e sequenciamento em tempo real único, removendo a necessidade de amplificação clonal., Isso reduz os erros causados pela PCR, simplifica a preparação da biblioteca e, mais importante, dá um comprimento de leitura muito maior usando plataformas de rendimento mais elevado. Exemplos incluem a plataforma de Biociências do Pacífico que utiliza sequenciação SMRT (single molecule real time) para dar comprimentos de leitura de cerca de mil bases e Biociências Helicos que utilizam sequenciação de moléculas únicas e, portanto, não requer amplificação antes da sequenciação. Oxford Nanopore Technologies are currently developing silicon-based nanopores which are subjected to a current that changes as DNA passs through the pore., Prevê-se que este seja um método rápido de alta produção de sequenciamento de DNA, embora problemas como a desaceleração do transporte através do poro devem ser primeiramente abordados.
sequenciando modificações epigenéticas
assim como a sequenciação da próxima geração permitiu sequenciamento genômico em uma escala massiva, tornou-se claro recentemente que o código genético não contém toda a informação necessária para os organismos. As modificações epigenéticas nas bases do ADN, em particular a 5-metilcitosina, também transmitem informações importantes.,todas as plataformas de sequenciamento de segunda geração dependem, como a sequenciação de Sanger, da PCR e, portanto, não podem sequenciar bases de DNA modificadas. Na verdade, tanto a 5-metilcitosina como a 5-hidroximetilcitosina são tratadas como citosina pelas enzimas envolvidas na PCR; portanto, a informação epigenética é perdida durante a sequenciação.,
a sequenciação de bissulfito
a sequenciação de bissulfito explora a diferença na reactividade da citosina e da 5-metilcitosina em relação à bissulfito: a citosina é desaminada por bissulfito para formar uracilo (que se lê como T quando sequenciada), enquanto a 5-metilcitosina é não-activa (ou seja, lê-se como C). Se duas séries de sequenciamento são feitas em paralelo, uma com tratamento de bissulfito e outra sem, as diferenças entre as saídas das duas séries indicam citosinas metiladas na sequência original., Esta técnica também pode ser usada para dsDNA, uma vez que após o tratamento com bissulfito, as cadeias não são mais complementares e podem ser tratadas como ssDNA.
5-Hidroximetilcitosina, outra importante modificação epigenética, reage com bissulfito formando citosina-5-metilsulfonato (que se lê como C quando sequenciado). Isso complica um pouco as coisas, e significa que a sequenciação de bissulfito não pode ser usada como um verdadeiro indicador de metilação em si mesma.,
a sequenciação do bissulfito oxidativo
a sequenciação do bissulfito oxidativo adiciona um passo de oxidação química, que converte 5-hidroximetilcitosina em 5-formilcitosina utilizando perrutenato de potássio, KRuO4, antes do tratamento com bissulfito. A 5-Formilcitosina é deformilada e desaminada para formar uracil por tratamento com bissulfito. Agora, três sequências separadas são necessárias para distinguir a citosina, a 5-metilcitosina e a 5-hidroximetilcitosina (ver Figura 9).,
Figura 9 | Sequenciamento de modificações epigenéticas usando bissulfito
Aplicações da Próxima geração de sequenciamento
a Próxima geração de sequenciamento permitiu pesquisadores para recolher grandes quantidades de dados de sequenciamento de genoma., Esta tecnologia tem uma infinidade de aplicações, tais como: o diagnóstico e a compreensão de doenças complexas; todo o seqüenciamento do genoma; análise de modificações epigenéticas; mitocondrial seqüenciamento; transcriptoma de seqüenciamento − compreender como alterado expressão de variantes genéticas afetam um organismo; e exome seqüenciamento − mutações no exome são pensados para conter até 90% de mutações no genoma humano, o que leva à doença., Foram utilizadas técnicas de ADN para identificar e isolar genes responsáveis por certas doenças e fornecer a cópia correcta do gene defeituoso conhecido por “terapia genética”.
uma grande área de foco na terapia genética é o tratamento do câncer – um método potencial seria introduzir um ARN anti-senso (que especificamente impede a síntese de uma proteína alvo) para o oncogeno, que é desencadeado para formar células tumorais. Outro método é denominado “terapia genética suicida”, que introduz genes para matar células cancerígenas selectivamente., Muitos códigos genéticos para proteínas tóxicas e enzimas são conhecidos, e a introdução destes genes em células tumorais resultaria em morte celular. A dificuldade deste método é garantir um sistema de administração muito preciso para evitar a occisão de células saudáveis.estes métodos são possíveis através da sequenciação para analisar genomas tumorais, permitindo que especialistas médicos adaptem a quimioterapia e outros tratamentos de câncer de forma mais eficaz à composição genética única de seus pacientes, revolucionando os estágios diagnósticos da medicina personalizada.,
à medida que o custo da sequenciação de DNA diminui, ela se tornará mais generalizada, o que traz uma série de questões. A sequenciação produz enormes volumes de dados, e há muitos desafios computacionais associados ao processamento e armazenamento dos dados. Há também questões éticas, como a propriedade do DNA de um indivíduo quando o DNA é sequenciado. Os dados de sequenciação de DNA devem ser armazenados de forma segura, uma vez que há preocupações de que grupos de seguros, corretores de hipotecas e empregadores podem usar esses dados para modificar citações de seguros ou distinguir entre candidatos., A sequenciação também pode ajudar a descobrir se um indivíduo tem um risco aumentado para uma determinada doença, mas se o paciente é informado ou se há uma cura para a doença é outra questão completamente diferente.Ahmadian, A.; Svahn, H.; Massively Parallel. Plataformas de sequenciamento usando laboratório em Tecnologias de chips. Chip De Laboratório, 11, 2653 − 2655 (2011).
Balasubramanian, S.; sequenciando ácidos nucleicos: da química à medicina. Chem. Comun. 47, 7281 − 7286 (2011).
Mardis, E.; Métodos de sequenciação de ADN da próxima geração. Annu. Rev. Genomics Hum. Genet. 9, 387 − 402 (2008).Mardis, E.,; Next-Generation DNA Sequencing Platforms. Annu. Rev. Anal. Chem. 6, 287-303 (2013).
Shendure, J.; Ji, H.; sequenciação de ADN da próxima geração. Conversao. Biotecnologia. 26, 10 1135-1144 (2008).
Veja também
nosso livro livre online de ácidos nucleicos contém informações sobre todos os aspectos da química e biologia dos ácidos nucleicos.