Articles

次世代シーケンシング

次世代シーケンシング

はじめに

ヒトゲノムのシーケンシングは、2003年に13年間の国際協力と3億ドルの投資 ヒトゲノムプロジェクトでは、1970年代の発明以来、DNAシーケンシングの主要な方法であるサンガーシーケンシング(大きく最適化されているが)を使用していました。

今日、シーケンシングの需要は指数関数的に増加しており、大量のゲノムDNAを迅速、安価、正確に解析する必要があります。, 次世代シーケンシングと総称される新しいシーケンシング技術のおかげで、数時間でヒトゲノム全体をシーケンシングすることが可能になりました。

Sanger sequencingと次世代シーケンシング

次世代シーケンシング(NGS)の背後にある原理は、キャピラリー電気泳動に依存するSanger sequencingの原理に似ています。 ゲノム鎖は断片化され、各断片中の塩基は、断片が鋳型鎖に対して連結されるときに放出されるシグナルによって同定される。,
サンガー法は、シーケンシング、分離(電気泳動による)、検出のための別々のステップを必要とし、サンプル調製を自動化することが困難であり、スループット、スケーラビリティ、分解能が制限されていた。 Ngs法は、数百万の反応を並列に処理するためにSanger sequencingで開発された技術を組み合わせたアレイベースのシーケンシングを使用し、非常に高速でスループットを低コストで処理します。, サンガー法で長年かかったゲノム配列決定プロジェクトは、読み取り長さ(一度に配列される塩基の数)が短く、精度が低いものの、NGSで数時間で完了することができるようになった。,ライブラリは、クローン増幅法およびPCRを用いて増幅される

  • シーケンシング:DNAは、いくつかの異なるアプローチのいずれかを用いて配列される
  • ライブラリ調製

    まず、DNAは、酵素的または超音波処理(超音波を用いた励起)によって断片化される。)小さなストランドを作成します。, 次に、アダプター(合成DNAの短い二本鎖片)は、DNA鎖を結合する酵素であるDNAリガーゼの助けを借りてこれらの断片に連結される。 アダプターは順序が補足の同等に区切られるようになることを可能にする。

    アダプターは、一方の端が”粘着性”であり、他方が”鈍性”(非凝集性)であるように合成され、鈍性末端を鈍性末端DNAに結合することを目的とする。 これは分子間の塩基対形成の潜在的な問題につながり、したがって二量体形成につながる可能性がある。, これを防ぐために、3′-OH末端と5′-P末端の間でライゲーションが行われるため、DNAの化学構造が利用される。 アダプターの粘着性のある末端からリン酸塩を除去し、その代わりに5′-OH末端を作ることによって、DNAリガーゼは二つの末端の間に橋渡しを形成することができない(図1)。,

    図1/次世代シーケンシングのライブラリ準備

    シーケンシングを成功させるためには、ライブラリフラグメントをPCRコロニーまたは”ポロニー”に空間的にクラスタ化する必要があります。 これらのポロニーは平面状に取り付けられているため、アレイの特徴は並列に操作することができる。 この図書館の建設方法は、以前のコロニーピッキングとEの労働集約的な手順よりもはるかに高速です。, サンガー配列決定のためにDNAを単離および増幅するために使用される大腸菌クローニングは、しかし、これは断片の読み取り長さを犠牲にしている。

    増幅

    ライブラリ増幅は、シーケンサからの受信信号が正確に検出されるのに十分な強さになるように必要です。 酵素的増幅では、”バイアス”および”複製”などの現象が起こり、特定のライブラリー断片の優先増幅につながる可能性があります。 代わりに、PCRを使用して多数のDNAクラスターを作成するいくつかのタイプの増幅プロセスがあります。,

    エマルジョンPCR

    エマルジョンオイル、ビーズ、PCRミックス、およびライブラリDNAを混合してエマルジョンを形成し、マイクロウェルを形成する(図2)。

    図2/エマルジョンPCR

    シーケンシングプロセスを成功させるためには、各マイクロウェルには一本鎖のDNAを持つビーズが含まれている必要があります(マイクロウェルの約15% PCRはその後、二つの別々の鎖を導くライブラリ断片を変性させ、そのうちの一つ(逆鎖)はビーズにアニールする。, の熱処理によるDNAを増幅することが可能であるポリメラーゼからビードのプライマーサイトです。 元の逆の鎖はそれから二つの別々の鎖を与えるためにビードに再アニールするためにだけビードから変性し、解放されます。 これらは両方ともビーズに付着した二つのDNA鎖を与えるために増幅される。 プロセスはDNAの集りの原因となる30-60の周期にそれから繰り返されます。 この技術は、NGSプラットフォームの多くで広範に使用されているにもかかわらず、多くのステップ(エマルジョンの形成と破壊、PCR増幅、濃縮など)を必要とするため、その時間のかかる性質のために批判されている。, でも比較的非効率なかみ周辺の三分の二はエマルジョンマイクロリアクターが実際に含ーシー。 そのために追加ステップが必要です別々の空システムへの可能性による不正確

    Bridge PCR

    フローセルの表面には、DNAライブラリー断片に取り付けられたプライマーと相補的なプライマーが密にコーティングされています(図3)。 その後、DNAは細胞の表面に無作為に付着し、そこでポリメラーゼに基づく伸長のための試薬に曝される。, ヌクレオチドおよび酵素の付加で、DNAの一本鎖の自由な端は架橋構造を作成する補足のプライマーによってセルの表面にそれら自身を付けます。 酵素はその後、変性が起こると、二つの一本鎖DNA断片が近接して表面に付着するように、それらを二本鎖にするためにブリッジと相互作用します。 このプロセスの繰返しは局在化させた同一の繊維のclonal集りをもたらします。 クラスター密度を最適化するためには、過密を避けるために試薬の濃度を非常に厳密に監視する必要があります。,

    図3|ブリッジPCR

    シーケンシング

    次世代シーケンシングのいくつかの競合する方法は、異なる企業によって開発されています。

    454パイロシークエンシング

    パイロシークエンシングは、ポリメラーゼ酵素の存在下で相補鎖を合成する”合成によるシークエンシング”原理に基づいています(図4)。 ジデオキシヌクレオチドを使用して鎖増幅を終了するのとは対照的に(サンガーシーケンシングのように)、ピロシーケンシングは、ヌクレオチドがDNA鎖に加えられたときにピロリン酸の放出を検出する。, それは最初に配列に必要なpoloniesを組み立てるのに乳剤PCRの技術を使用し、補足の繊維を取除きます。 次に、ssDNAシーケンシングプライマーが鎖の端(プライマー結合領域)にハイブリダイズし、四つの異なるdntpがポロニー上のウェルに出入りするように順次作られる。 正しいdNTPが酵素的に鎖に組み込まれるとき、ピロリン酸塩の解放を引き起こします。 ATPスルフリラーゼおよびアデノシンの存在下で、ピロリン酸はATPに変換される。, このATP分子は、ルシフェリンのルシフェラーゼ触媒によるオキシルシフェリンへの変換に使用され、カメラで検出できる光を生成する。 光の相対強度は、添加される塩基の量に比例する(すなわち、強度の倍のピークは、二つの同一の塩基が連続して添加されたことを示す)。,

    図4/454パイロシークエンシング

    454ライフサイエンスによって開発されたパイロシークエンシングは、次世代シーケンシングの初期の成功の一つであり、454ライフサイエンスは最初の市販の次世代シーケンサを生産した。 しかし、この方法は他の技術によって覆され、2013年に新しい所有者であるRocheは454Life Sciencesの閉鎖と454pyrosequencingプラットフォームの中止を発表しました。,

    Ion torrent semiconductor sequencing

    Ion torrent sequencingは、標的鎖に相補的な新しいDNA鎖を一度に一塩基ずつ合成する”シーケンシングによるシーケンシング”アプローチを使用しています。 半導体チップは、DNA重合中に生成された水素イオンを検出します(図5)。

    エマルジョンPCRを用いたポロニー形成後、DNAライブラリー断片は、パイロシークエンシングのように、各ヌクレオシド三リン酸(dNTP)で順次フラッディングされる。 次いで、標的鎖上のヌクレオチドに相補的であれば、dntpは新しい鎖に組み込まれる。, ヌクレオチドが正常に添加されるたびに、水素イオンが放出され、シーケンサのpHセンサによって検出される。 パイロシークエンシング法のように、同じヌクレオチドの複数が添加される場合、pH/シグナル強度の変化はそれに応じて大きくなる。

    図5/Ion Torrent semiconductor sequencing

    Ion torrent sequencingは、蛍光およびカメラスキャンを使用しない最初の商業的技術であるため、他の多くの方法よりも高速で安価です。, 残念ながら、連続して追加された同一の塩基の数を列挙することは困難であり得る。 例えば、長さ9のホモリピートに対するpH変化を長さ10のいずれかに区別することが困難であり、反復配列を解読することを困難にすることがある。

    ライゲーションによる配列決定(SOLiD)

    SOLiDは、二本鎖DNA鎖をライゲートする能力のためにバイオテクノロジーで広く使用されている酵素であるDNAリガーゼを用いた酵素配列決定の方法である(図6)。, エマルジョンPCRは、ビーズ上の標的配列(すなわち配列決定される配列)にコンジュゲートされたssDNAプライマー結合領域(アダプターとして知られている)を固定化/増幅するために使用される。 これらのビーズはガラス表面にそれから沈殿する−それから、技術の効率を高めるビーズの高密度を達成することができる。

    ビーズ沈着が起こると、長さNのプライマーがアダプターにハイブリダイズされ、ビーズは8-merプローブのライブラリーにさらされ、5’末端に異なる蛍光色素と3’末端にヒドロキシル基を有する。, 塩基1および2は配列されるヌクレオチドに相補的であり、塩基3-5は縮退し、塩基6-8はイノシン塩基である。 相補的なプローブのみがプライマーに隣接するターゲット配列にハイブリダイズする。 その後、DNAリガーゼを用いて8-merプローブをプライマーに結合させる。 塩基5と6の間のホスホロチオエート結合は、銀イオンを用いて蛍光色素を断片から切断することを可能にする。, この開裂により、蛍光を測定することができ(四つの異なる蛍光色素が使用され、そのすべてが異なる発光スペクトルを有する)、さらに5′-リン酸基を生成することができる。 配列の最初の円形が完了すれば、延長プロダクトは溶け、次に配列の第二円形は長さN−1のプライマーとperfomed。 より短いプライマー(すなわちN−2、N−3等)を使用して配列の多くの円形および蛍光性を測定することはターゲットが配列されることを保障する。,

    二塩基シーケンシング法(各塩基が効果的に二回配列決定されるので)のために、固体技術は非常に正確である(第六プライマーで99.999%で、それは第二世代のプラットフォームの中で最も正確である)と安価である。 それは7日の単一の操業を完了でき、その時間にデータの30Gbを作り出すことができます。 残念ながら、その主な欠点は、読み取り長が短く、多くの用途には適していないことです。,

    図6/ライゲーションによるシーケンシング

    可逆ターミネーターシーケンシング(Illumina)

    可逆ターミネーターシーケンシングは、ジデオキシヌクレオチドを用いてプライマー延長を不可逆的に終了させるのではなく、可逆的終了に修飾ヌクレオチドが使用されるという点で、従来のサンガー法とは異なる。 他の多くの技術がdnaライブラリー断片を増幅するためにエマルジョンPCRを使用する一方で、可逆的終端はブリッジPCRを使用し、プロセスのこの段階の効率を改善する。,

    可逆ターミネータは、3′-O-ブロックされた可逆ターミネータと3′-ブロックされていない可逆ターミネータの二つのカテゴリに分類することができます。

    3′-O-ブロック可逆ターミネーター

    メカニズムは、段階的にプライマーを伸長、合成アプローチによるシーケンシングを使用しています。 初めに、配列決定のプライマーおよび型板は固体支持体に固定される。 この支持体は、3′-O-アジドメチル基に加えて(窒素塩基に)異なるフルオロホアが結合している四つの塩基のそれぞれに露出している(図7)。,

    図7/Illuminaシーケンシングで使用される蛍光標識されたアジドメチルdNTPの構造

    正しい塩基のみがターゲットにアニールし、その後プライマーに連結される。 その後、固体支持体を撮像し、取り込まれていないヌクレオチドを洗い流し、TCEP(tris(2-carboxyethyl)ホスフィン)を用いて蛍光枝を切断する。 TCEPはまた、3′-O-アジドメチル基を除去し、3′-OHを再生し、サイクルを繰り返すことができる(図8)。,

    図8/可逆ターミネータシーケンス

    3′-ブロックされていない可逆ターミネータ

    3′-ブロックされていない可逆ターミネータの可逆ターミネータの可逆ターミネータグループは、ベースグループと蛍光グループの両方にリンクされており、これは現在終端グループの一部として機能し、レポーターとして機能する。 この方法は、3′-O-blocked可逆ターミネーター法とは三つの方法で異なります:まず、3′-positionはブロックされません(すなわち, 塩基は遊離の3′-OHを有する);フルオロフォアは四つの塩基すべてについて同じであり、各修飾塩基は同時にではなく逐次的に流れる。

    これらの技術の主な欠点は、二つの現象のいずれかによって引き起こされる可能性のある読み取り長さが悪いことです。 単一ステップで二つのヌクレオチドの取り込みを防ぐために、ブロックが所定の位置に置かれるが、合成不良によるブロック添加がない場合、ストランドは位相がずれて読み取り長が制限されるノイズを生成する可能性がある。 また、蛍光色素が付着または除去されなかった場合にも、ノイズを発生させることができる。, これらの問題は、他の配列決定方法で一般的であり、長さを読み取るための主な制限要因である。

    この技術はIlluminaによって、彼らのHiSeqおよびMiSeqプラットフォームで開拓されました。 HiSeqは百万ベースあたり$0.02のコストを持つ第二世代のシーケンサーの中で最も安いです。 また、実行ごとに600Gbの高いデータ出力を持ち、完了するまでに約8日かかります。

    第三世代シーケンシング

    技術の新しいコホートは、以来、クローン増幅の必要性を除去し、単一分子シーケンシングと単一のリアルタイムシーケンシ, この削減によって生じる誤差はPCR法が簡単図書館の準備、そして何よりも、より高い読みの長さの使用により高スループットす。 例としては、SMRT(single molecule real time)シーケンシングを使用して約千塩基の読み取り長を与えるPacific Biosciencesのプラットフォームと、単一分子シーケンシングを利用し、したがって、シーケンシングの前に増幅を必要としないHelicos Biosciencesが挙げられる。 Oxford Nanopore Technologiesは現在、DNAが細孔を通過するときに変化する電流を受けるシリコンベースのナノ細孔を開発しています。, これはDNA配列決定の高スループットの迅速な方法であると予想されるが、孔を通る輸送を遅くするなどの問題に最初に対処しなければならない。

    シーケンシングエピジェネティックな修飾

    次世代シーケンシングが大規模にゲノムシーケンシングを可能にしたように、遺伝コードには生物が必要とするすべての情報が含まれていないことが最近明らかになっている。 DNA塩基、特に5-メチルシトシンに対するエピジェネティックな修飾も重要な情報を伝える。,

    すべての第二世代シークエンサートのようにガ配列し、PCRな配列の改変のDNAです。 実際、5-メチルシトシンと5-ヒドロキシメチルシトシンはPCRに関与する酵素によってシトシンとして扱われるため、シーケンシング中にエピジェネティックな情報が失われる。,

    重亜硫酸塩シーケンシング

    重亜硫酸塩シーケンシングは重亜硫酸塩に関してシトシンと5-メチルシトシンの反応性の違いを利用する:シトシンは重亜硫酸塩によって脱アミノ化されてウラシルを形成する(配列決定されたときにTとして読み取る)が、5-メチルシトシンは非反応性である(すなわちCとして読み取る)。 二つのシーケンシングランが並行して行われ、一つは重亜硫酸塩処理と一つはない場合、二つのランの出力間の違いは、元のシーケンスにおけるメチル化シトシンを示す。, この技術は、重亜硫酸塩で処理した後、鎖はもはや相補的ではなく、ssdnaとして処理することができるので、dsdnaにも使用することができる。

    5-ヒドロキシメチルシトシン、もう一つの重要なエピジェネティックな修飾は、シトシン-5-メチルスルホン酸を形成するために重亜硫酸塩と反応する(配列決定されたときにCとして読み取る)。 これは問題を幾分複雑にし、重亜硫酸塩の配列がメチル化の本当の表示器としてそれ自体で使用することができないことを意味します。,

    酸化的重亜硫酸塩シーケンシング

    酸化的重亜硫酸塩シーケンシングは、重亜硫酸塩処理の前に、ペルルテン酸カリウムKRuO4を使用して5-ヒドロキシメチルシトシンを5-ホルミルシトシンに変換する化学酸化ステップを追加する。 5-ホルミルシトシンは重亜硫酸塩の処置によってウラシルを形作るためにdeformylated、脱アミノ化されます。 さて、シトシン、5-メチルシトシン、5-ヒドロキシメチルシトシンを区別するためには、三つの別々のシーケンシングランが必要です(図9参照)。,

    図9/重亜硫酸塩を用いたシーケンシングエピジェネティックな修飾

    次世代シーケンシングのアプリケーション

    次世代シーケンシングにより、研究者は膨大な量のゲノムシーケンシングデータを収集することができました。, この技術には、複雑な疾患の診断と理解、全ゲノムシーケンシング、エピジェネティックな修飾の解析、ミトコンドリアシーケンシング、遺伝子変異の発現の変化が生物にどのように影響するかを理解するトランスクリプトームシーケンシング、エクソームシーケンシングなど、さまざまな用途があります。, DNA技術は、特定の疾患の原因となる遺伝子を同定および単離し、”遺伝子治療”として知られる欠損遺伝子の正しいコピーを提供するために使用されて

    遺伝子治療における大きな焦点領域は、癌治療であり、一つの潜在的な方法は、腫瘍細胞を形成するためにトリガされる癌遺伝子にアンチセンスRNA(特に標的蛋白質の合成を防止する)を導入することであろう。 また、がん細胞を選択的に死滅させる遺伝子を導入する”自殺遺伝子治療”という方法もあります。, 有毒なタンパク質および酵素の多くの遺伝コードが知られており、これらの遺伝子の腫瘍細胞への導入は細胞死をもたらすであろう。 この方法の難しさは、健康な細胞の死滅を防ぐために非常に正確な送達システムを確保することである。
    これらの方法は、腫瘍ゲノムを解析するためのシーケンシングによって可能になり、医療専門家が化学療法や他の癌治療を患者のユニークな遺伝的組成により効果的に調整することができ、個別化医療の診断段階に革命をもたらします。,

    DNA配列決定のコストが下がるにつれて、それは多くの問題をもたらす、より広範になります。 シーケンシングは膨大な量のデータを生成し、データの処理と保存に関連する多くの計算上の課題があります。 また、dnaが配列決定されたときの個人のDNAの所有権などの倫理的問題もあります。 保険グループ、モーゲージブローカー、雇用者がこのデータを使用して保険見積もりを変更したり、候補者を区別したりすることが懸念されるため、DNA配列決定データ, シーケンシングはまた、個人が特定の疾患に対するリスクが高いかどうかを調べるのに役立つかもしれませんが、患者が通知されているかどうか、または病気の治療法があるかどうかは別の問題です。

    Ahmadian,A.;Svahn,H.;超並列。 ゲットをラボチップ技術です。 ラボチップ, 11, 2653 − 2655 (2011).

    Balasubramanian、S.;配列決定の核酸:化学から医学へ。 ケム コミュニケーション 47, 7281 − 7286 (2011).Mardis,E.;次世代DNA配列決定メソッド。 アンヌ ゲノミクス-ハム博士。 ジュネット 9, 387 − 402 (2008).

    マルディス、E.,;次世代DNAシーケンシングプラットフォーム。 アンヌ アナル師。 ケム 6, 287-303 (2013).Shendure,J.;Ji,H.;次世代DNA配列決定。 ナット バイオテクノロジー 26, 10 1135-1144 (2008).

    も参照してください

    私たちの無料のオンライン核酸ブックは、核酸化学と生物学のすべての側面に関する情報が含まれています。