Poravnavanje višestrukih sekvenci je poravnavanje sekvenci tri ili više bioloških sekvenci, uglavnom proteina, DNK ili RNK. U mnogim slučajevima podrazumijeva se da postoji evolucjskii odnos između sekvenci koje se poravnavaju. Poravnavanja više sekvenci su polazna tačka za proučavanje homologije i dalju filogenetičku analizu. Vizuelni prikaz poravnavanja je ilustracija mutacija, kao što je promjena jedne aminokiseline ili nukleotida, koje sa prikazane kao različita slova u odgovarajućoj koloni poravnavanja. Vidne su i mutacije insercija ili delecija, koje su prikazane kao crtice u jednoj ili više sekvenci. Poravnavanje višestrukih sekvenci koristi se često za procjenu konzervacijeproteinskih domena, tercijarne i sekundarne strukture i individualnih aminokiselina ili nukleotida.
Poravnavanje višestrukih sekvenci se isto tako odnosi na sam proces poravnavanja. Pošto je ručno poravnavanje tri ili više sekvenci sa biološki relevantnim dužinama nepraktično, za formiranje i analizu poravnavanja uvijek se koriste računarski algoritmi . Poravnavanje višestrukih sekvenci počiva na sofisticiranijim metodima od poravnavanja para sekvenci, jer je ono računarski kompleksnije. Većina programa za poravnavanje višestrukih sekvenci koristi heurističke metode, umjesto globalne optimizacije, jer je identifikacija optimalnog poravnavanja između više od nekoliko sekvenci umjerene dužine, računarski izuzetno skupa.
Dinamičko programiranje i računarska kompleksnost
Direktni metod za poravnavanja višestrukih sekvenci koristi tehnike dinamičkog programiranja za identifikaciju globalno optimalnih poravnavanja. Za proteine, ovaj metod obično koristi dvije grupe parametara: penale praznina i supstitucijske matrice za dodijeljivanje vrednosti ili vjerovatnoće poravnavanja svakog mogućeg para aminokiselina. Ovi parametri su bazirani na sličnosti hemijskih osobina aminokiselina i evolucijskoj vjerovatnoći mutacije. Za nukleotidne sekvence koriste se slični penali praznina, ali su supstitucijske matrice znatno jednostavnije, tipski se posmatraju jedinoidentična preklapanja. Parametri u supstitucijskoj matrici mogu biti bilo svi pozitivni ili mješavina pozitivnih i negativnih, u slučaju globalnog poravnavanja. U slučaju lokalnog poravnavanja, moraju biti pozitivni i negativni.[1]
Za n individualnih sekvenci, uprimjeni naivnog metoda, neophodno je konstruitati n-dimenzijski ekvivalent matrice koja se formira u standardnom poravnavanju para sekvenci. Prostor pretrage se stoga eksponencijalno povećava sa povećanjem broja sekvenci i veoma je zavisan od dužine sekvenci. Naivnom algoritmu je potrebno O(dužinaNsekv) vrijeme da proizvede rezultat. Nalaženje globalnog optimuma za n sekvencu na ovaj način je NP-kompletan problem.[2][3][4]
Na bazi Karilo-Lipmanovog algoritma,[5] Altschul uveo je 1989. praktični metod koji koristi poravnavanja parova za ograničavanje n-dimenzijskog prostora pretrage.[6] U ovom pristupu, dinamički programirana poravnavanja parova izvode se za svaki par sekvenci upitnog seta i pretražuje se jedino prostor u blizini n-dimenzijskog presjeka tih poravnavanja. Ovaj program optimizira zbir svih parova slova u svakoj poziciji poravnavanja (takozvani parametar sume parova).[7]
Duret, L.; S. Abdeddaim (2000). "Multiple alignment for structural functional or phylogenetic analyses of homologous sequences". u D. Higgins and W. Taylor (ured.). Bioinformatics sequence structure and databanks. Oxford: Oxford University Press.CS1 održavanje: ref=harv (link)
Notredame, C. (2002). "Recent progresses in multiple sequence alignment: a survey". Pharmacogenomics. 31 (1): 131–144. doi:10.1517/14622416.3.1.131. PMID11966409.