Articles

Pairwise alignment of nucleotide sequences using maximal exact matches

oktober 15, 2020 by admin

benadering

in ons voorgestelde algoritme is de eerste stap naar aligning sequences het extraheren van MEMs tussen sequences door ze direct te vergelijken. Figuur 3a is een voorbeeld dat een doel en een query-sequentie vergelijkt waarbij CTC en AAA twee MEMs zijn die door de vergelijking worden geïdentificeerd. Elke groep van continue identieke symbolen in de vergelijking, resulteren in een MEM, zelfs als het is samengesteld uit slechts een enkele overeenkomende symbool., Om alle MEMs tussen de sequenties te extraheren, moet de query-sequentie één symbool tegelijk naar rechts en naar links worden verschoven (zie Fig. 3b). Na elke dienst moet de vergelijkingsstap worden herhaald om nieuwe MEMs te identificeren. Bijvoorbeeld, de derde regel in Fig. 3b vertegenwoordigt het geval waarin de query-sequentie wordt verschoven naar het juiste symbool en wordt vergeleken met de doelreeks. Het resultaat van de vergelijking identificeert AAAAGC als een nieuw MEM. Alle andere MEMs geëxtraheerd door shift en vergelijk operaties zijn ook gemarkeerd in Fig. 3b., Drie van de MEMs (Mx, My en Mz) zijn gemarkeerd met verschillende kleuren om later te worden gebruikt.

in het affine-gap scoring model, de uitlijningsscore zoals berekend met behulp van Eq., 1 Waar Nm het aantal wedstrijden is dat elk een wedstrijdscore van Rm ontvangt, Nx het aantal mismatches is dat elk een mismatchstraf van Px ontvangt, No het aantal gap openingen dat elk een gap open straf van Po ontvangt en Ng de totale lengte van alle gaps, elke gap ontvangt een gap uitbreiding straf van Pg. Er zou een gat opening voor elke groep van continue kloof. Als er bijvoorbeeld twee openingen zijn in de uitlijning, waarbij de lengte van de eerste opening drie is en de lengte van de tweede opening Vier, dan zijn er twee openingen (No=2) en de totale lengte van de opening zeven is (Ng=3+4=7).,

$$ {}AS = (N_{m} \times R_{m}) – ((n_{x} \times P_{x}) + (N_{o} \times P_{o}) + (n_{g} \times P_{g})) $$

(1)

gegeven de lijst van alle MEMs, kan de uitlijning worden berekend met gedeeltelijke uitlijningen. Denk bijvoorbeeld aan MEMs Mx, My en Mz in Fig. 3b. de gedeeltelijke uitlijningen gemaakt door het nemen van verschillende combinaties van Mx, My en Mz samen met het aantal wedstrijden, mismatches en hiaten, evenals de resulterende uitlijningsscores worden weergegeven in Fig. 4. De uitlijning die alleen MX en Mz omvat, resulteert in de hoogste uitlijningsscore., Merk op dat, mijn en Mz overlappen elkaar en wanneer beide worden beschouwd in dezelfde uitlijning de overlap is uitgesloten van Mz. Rekening houdend met alle MEMs in Fig. 3b resulteert in veel meer combinaties waar geen van hen een hogere score behaalt.