Unha familia xénica é un conxunto de xenes similares, que se formaron por duplicación dun só xene orixinal, e que xeralmente desempeñan funcións bioquímicas similares. Un exemplo dunha desas familias é a dos xenes das subunidades da hemoglobina humana; os dez xenes desta familia están localizados en dous grupos ou clusters en diferentes cromosomas, chamados loci da α-globina e da β-globina. Estes dous grupos de xenes crese que se orixinaron como resultado da duplicación dun xene precursor ancestral hai aproximadamente 500 millóns de anos.[1]
Os xenes están categorizados en familias baseadas na compartición de secuencias comúns de nucleótidos ou proteicas (aminoácidos). Poden utilizarse técnicas filoxenéticas como probas máis rigorosas para orecoñcemento de familias. Poden utilizarse as posicións de exóns dentro da secuencia codificante para inferir a existencia dun antepasado común. Sabendo a secuencia dunha proteína codificada por un xene os investigadores poden aplicar métodos para encontrar semellanzas entre secuencias de proteínas que proporcionan máis información que as semellanzas entre secuencias de ADN.
Se os xenes dunha familia xénica codifican proteínas, utilízase o termo familia proteica de maneira análoga ao de familia xénica.
A expansión ou contracción de familias xénicas nunha liñaxe evolutiva específica pode deberse ao azar ou pode ser o resultado da selección natural.[2] Distinguir entre estes dous casos adoita ser difícil na práctica. En traballos recentes utilízase unha combinación de modelos estatísticos e técnicas algorítmicas para detectar as familias xénicas que están baixo os efectos da selección natural.[3]
O HUGO Gene Nomenclature Committee (HGNC) crea esquemas de nomenclatura usando un símbolo "troncal" (ou "raíz") para os membros dunha familia xénica, cun sistema de numeración xerárquico para distinguir cada un dos membros da familia.[4][5] Por exemplo, para a familia do xene da peroxirredoxina, o símbolo raíz é PRDX, e os membros desa familia son: PRDX1, PRDX2, PRDX3, PRDX4, PRDX5, e PRDX6.
Estrutura básica
Un dos niveis de organización do xenoma é o agrupamento de xenes en varias familias xénicas.[6][7] As familias xénicas son grupos de xenes relacionados que comparten un antepasado común. Os membros dunha familia xénica poden ser parálogos ou ortólogos. Os xenes parálogos son xenes con secuencias similares presentes nunha mesma especie, mentres que os xenes ortólogos son xenes con secuencias similares pero de distintas especies. As familias de xenes son moi variables en tamaño, diversidade de secuencias, e disposición. Dependendo da diversidade e funcións dos xenes da familia, as familias poden clasificarse como familias de multixenes ou superfamilias.[6][8]
As familias de multixenes constan tipicamente de membros con secuencias e funcións similares, aínda que un alto grao de diverxencia (na secuencia e/ou función) non é razón dabondo para retirar un xene dunha familia xénica. Os xenes membros de cada familia poden estar situados moi próximos uns doutros no mesmo cromosoma ou dispersos por todo o xenoma en diferentes cromosomas. Debido á semellanza nas secuencias e as súas funcións solapadas, os xenes membros dunha familia comparten a miúdo elementos de control regulatorios.[6][8] Nalgúns casos, os xenes membros teñen secuencias idénticas ou case idénticas. Esas familias permiten que se expresen cantidades masivas dun produto xénico nun curto período de tempo se é preciso. Outras familias permiten a expresión de produtos específicos aínda que similares en diferentes tipos de células ou en diferentes estadios do desenvolvemento dun organismo.[6]
As superfamilias son moito máis grandes que as familias multixénicas simples. As superfamilias poden conter centos de xenes, incluíndo familias multixénicas múltiples e tamén xenes individuais simples. O gran número de membros que teñen as superfamilias fai que estean amplamente dispersas con algúns dos seus xenes agrupados e outros espallados a maiores distancias. Os xenes son diversos en secuencia e función e mostran varios niveis de expresión e controis de regulación independentes.[6][8]
Algunhas familias xénicas tamén conteñen pseudoxenes, que son secuencias de ADN que lembran moito a secuencias xénicas establecidas no xenoma pero que non son funcionais.[9] Hai varios tipos de pseudoxenes. Os pseudoxenes non procesados son xenes que adquiriron mutacións co paso do tempo converténdose en non funcionais. Os pseudoxenes procesados son xenes que perderon as súas funcións despois de que foron movidos de sitio polo xenoma por retrotransposición.[8][9] Os pseudoxenes que quedaron illados da familia xénica na que se orixinaron, denomínanse orfos.[6]
Formación
As familias xénicas orixínanse por duplicacións múltiples dun xene ancestral, seguidas de mutacións e diverxencia.[6] As duplicacións poden ocorrer dentro dunha liñaxe (por exemplo, nos humanos podería haber dúas copias dun xene do que hai unha soa copia en chimpancés) ou son o resultado da especiación. Como resultado da duplicación por especiación, na que se orixinaron, por exemplo, 15 especies distintas, unha familia xénica podería incluír 15 xenes, cunha copia en cada unha das 15 especies.
Duplicación
Na formación de familias xénicas, hai catro niveis de duplicación: 1) duplicación de exóns e redistribución, 2) duplicación xénica completa, 3) duplicación de familia multixénica, e 4) duplicación de xenoma completo. A duplicación de exóns e a súa redistribución dá lugar a variacións e novos xenes. Os xenes son despois duplicados para formar familias multixénicas que se duplican á súa vez para formar superfamilias que se estenden por moitos cromosomas. As duplicacións de xenomas completos dobran o número de copias de cada xene e familia xénica.[6] A duplicación de xenomas completos ou poliploidización pode ser unha autopoliploidización ou unha aloploidización. A autopoliploidización é a duplicación dun mesmo xenoma e a alopoliploidización é a duplicación de dous xenomas estreitamente relacionados ou xenomas hibridados de diferentes especies.[8]
A duplicación ocorre principalmente por medio de episodios de sobrecruzamento desigual durante a meiose de células xerminais. Cando dous cromosomas están mal aliñados, o sobrecruzamento (o intercambio de alelos) ten como resultado que un cromosoma se expande ou incrementa o seu número de xenes e o outro contráese ou decrece en número de xenes. A expansión dun cluster de xenes é unha duplicación de xenes que orixina familias de xenes máis grandes.[6][8]
Relocalización
Os xenes membros dunha familia multixénica ou as familias multixénicas dentro das superfamilias están presentes en distintos cromosomas debido á recolocación que sufriron ditos xenes despois da duplicación do xene ancestral. Os elementos transpoñibles xogan un papel no movemento dos xenes a outro lugar do xenoma. Os elementos transpoñibles son recoñecidos por teren inversións repetidas nos seus extremos 5' e 3'. Cando dous elementos transpoñibles están o suficientemente preto na mesma rexión dun cromosoma, poden formar un transposón composto. A proteína transposase recoñece as inversións repetidas máis externas, e corta o segmento do ADN. Calquera xene situado entre os dous elementos transpoñibles é recolocado cando o transposón composto salta a unha nova área do xenoma.[6]
A transcrición inversa é outro modo de mover xenes. Un transcrito de ARNm dun xene é reversotranscrito a ADN. Esta nova copia de ADN procedente dun ARNm é integrada noutra parte do xenoma, o que ten como resultado que os membros da familia xénica quedan dispersos.[8]
Un tipo especial de familia de multixenes está implicado no movemento de familias xénicas e membros de familias xénicas. As familias LINE (Long INterspersed Elements) e SINE (Short Interspersed Elements) están formadas por secuencias de ADN moi repetitivas espalladas por todo o xenoma. As LINEs conteñen unha secuencia que codifica unha proteína reversotranscriptase. A secuencia desta proteína engádese ao copiar os transcritos de ARN dos LINEs e SINEs de novo a ADN, e integralos en diferentes áreas do xenoma. Así autoperpetúase o crecemento das familias LINE e SINE. Debido á natureza altamente repetitiva destes elementos, as LINEs e SINEs cando están próximos tamén desencadean eventos de sobrecruzamento desigual que causan duplicacións dun só xene e a formación de familias xénicas.[6][8]
Diverxencia
As mutacións non sinónimas nas que se substitúen aminoácidos, increméntanse nas copias duplicadas de xenes. A duplicación dá lugar a múltiples copias do mesmo xene, dando un nivel de redundancia no que as mutacións son toleradas. Con tal de que haxa unha copia funcional dun xene, outras copias dese xene poden adquirir mutacións sen que sexan moi prexudiciais para o organmismo. As mutacións permiten que os xenes duplicados adquiran novas funcións diferentes.[8]
Evolución concertada
Algunhas familias multixénicas son extremadamente homoxéneas, e os xenes membros comparten secuencias idénticas ou case idénticas. O proceso polo cal as familias xénicas manteñen unha alta homoxeneidade denomínase evolución concertada. A evolución concertada ocorre por medio de ciclos repetidos de sobrecruzamento desigual e de transferencia e conversión de xenes. O sobrecruzamento desigual orixina a contracción e expansión das familias xénicas. As familias xénicas teñen un rango de tamaños óptimos orixinais cara ao que actúa a selección natural. A contracción elimina copias de xenes diverxentes e impide que as familias xénicas se fagan moi grandes. A expansión substitúe as copias de xenes perdidas e impide que as familias xénicas se fagan moi pequenas. Ciclos repetidos de transferencia e conversión de xenes fan que as familias xénicas sexan cada vez máis similares en tamaño.[6]
No proceso de transferencia de xenes, a conversión de xenes alélica está nesgada. O espallamento de alelos mutantes nunha familia xénica cara á homoxeneidade é o mesmo proceso que o espallamento dun alelo vantaxoso nunha poboación cara á fixación. A conversión de xenes tamén axuda a crear variación xenética nalgúns casos.[10]
Evolución
As familias xénicas son parte da xerarquía de información almacenada nun xenoma, e xogan un gran papel na evolución e diversidade dos organismos multicelulares. As familias xénicas son grandes unidades de información e variabilidade xenética.[6] No decurso da evolción, as familias xénicas espandíronse e contraéronse e formáronse novas familias xénicas e outras perdéronse. En varias liñaxes evolutivas, os xenes gañáronse e perdéronse con taxas aproximadamente iguais. A expansión adaptativa de familias xénicas ocorre cando a selección natural favorece a formación de copias adicionais dun xene. Isto acontece cando un estresante ambiental actúa sobre unha especie. A amplificación de xenes é máis común en bacterias e é un proceso reversible. A contracción adaptativa de familias de xenes é xeralmente o resultado da acumulación de mutacións de perda de función. Unha mutación sen sentido que detén prematuramente a transcrición dun xene e queda fixada na poboación, leva á perda do xene. Ese proceso ocorre cando os cambios no ambiente fan que o xene sexa redundante.[7]
As novas familias de xenes orixínanse a partir de xenes orfos (pseudoxenes illados). Estes xenes illados fórmanse de diferentes maneiras, como son: (1) un duplicado dun xene acumula suficientes mutacións para ser diverxente dabondo como para non ser recoñecido xa como parte da familia xénica orixinal; (2) a transferencia horizontal de novos xenes nun xenoma, e (3) formación de novo dun novo xene a partir de secuencias non codificantes. Estes xenes orfos sufrirían despois un proceso de duplicación, recolocación e diverxencia para formar unha familia. A desaparición dunha familia de xenes ocorre cando a perda dun xene leva á perda dunha familia xénica enteira. A continua perda de xenes leva finalmente á extinción da familia xénica. A perda de xenes pode ser unha deleción de xenes ou unha completa perda de función, converténdose en pseudoxenes.[7]
Notas
↑Nussbaum, Robert L.; McInnes, Roderick R.; Willard, Huntington F. (2016). Thompson & Thompson Genetics in Medicine (8th ed.). Philadelphia, PA: Elsevier. p. 25. ISBN978-1-4377-0696-3.
↑Hartl, D.L. and Clark A.G. 2007. Principles of population genetics. Chapter 7, page 372.