En bioloxía molecular e xenética, o contido GC, contido guanina-citosina, porcentaxe GC ou contido G+C (ás veces razón GC) é a porcentaxe de bases nitroxenadas dunha molécula de ADN que son guanina ou citosina de entre o total das catro baes posibles (adenina, timina, guanina e citosina). O contido GC pode referirse a un determinado fragmento de ADN, a un cromosoma completo ou a un xenoma enteiro. Pode aplicarse tamén ao ARN (que tería uracilo en vez de timina). Cando se refire a un fragmento do material xenético este pode ser unha parte dun xene (dominio), un só xene completo, un grupo de xenes (ou cluster), ou mesmo a unha rexión non codificante.
Nas medicións en xenomas bacterianos o normal é expresalo en %mol.
A guanina (G) e a citosina (C) emparéllanse no ADN formando 3 enlaces de hidróxeno, mentres que a timina (T) e a adenina (A) únense entre si por medio de dous destes enlaces. O ADN cun alto contido GC é máis estable que o de contido baixo porque forman máis pontes de hidróxeno, aínda que o que máis inflúe na estabilización do ADN son as interaccións entre as bases amoreadas.[1]
A pesar da alta termoestabilidade que un alto contido GC lle dá ao material xenético, as células con alto contido GC de bacterias sofren autólise, reducindo dese modo a lonxevidade da célula.[2] Debido á robustez que lle dá ao material xenético ter un alto contido GC, críase tradicionalmente que un ADN cun contido GC elevado era unha adaptación importante ás altas temperaturas no medio, pero esta hipótese foi posta en dúbida recentemente nun estudo comparativo entre procariotas.[3]
Porén, o mesmo estudo mostrou unha forte relación entre as temperaturas altas e o contido GC alto dos ARNs estruturados (como o ARN ribosómico, o ARN transferente, e moitos outros ARN non codificantes). Nos ARN os pares de bases GC son máis estables que os AU, debido a que forman un enlace e hidróxeno máis, e isto fai que as estruturas con ARN (que forman enlaces intracatenarios) sexan máis tolerantes ás altas temperaturas.
Máis recentemente, a primeira análise xenómica a grande escala demostrou a correlación entre o contido GC e a temperatura para certas rexións xenómicas (as codificantes) pero non para outras.[4]
Nos experimentos de PCR, o contido GC dos cebadores utilízase para predicir a temperatura de annealing co ADN molde. Un maior contido GC indica unha maior temperatura de fusión.
Determinación do contido GC
O contido GC exprésase xeralmente como unha porcentaxe do contido en bases G e C no total de bases. A porcentaxe GC calcúlase coa seguinte fórmula:[5]
Outra forma distinta de medir a cantidade de G e C, que non se debe confundir coa anterior, é por medio da razón AT/GC, que é a razón entre o contido en G e C con respecto ao contido en A e T. A razón AT/GC calcúlase así:[6]
De forma alternativa, se a molécula de ADN ou ARN estudada foi secuenciada entón o contido GC pode ser calculado con precisión por simple aritmética ou usando a calculadora GC en liña.
Contido GC e xenes
Os contidos GC entre rexións dun xenoma son moi variables. Estas variacións nos xenomas dos organismos máis complexos dan lugar a unha formación de tipo mosaico con rexións illa chamadas isocoros.[9] Isto dá lugar a variacións na intensidade de tinguidura dos cromosomas.[10] Os isocoros ricos en GC inclúen moitos xenes que codifican proteínas, e deste modo a determinación do contido GC desas rexións específicas contribúe a mapar as rexións ricas en xenes do xenoma.[11][12]
Por tanto, os xenes caracterízanse por ter un alto contido GC en comparación co contido GC de fondo de todo o xenoma. A lonxitude da secuencia codificante é directamente proporcional ao contido GC.[13][14]
Contido GC e filoxenia
O contido GC é moi variable entre os distintos organismos. O contido GC alto pode ter que ver co nesgo na reparación do ADN asociada á recombinación, que incrementa o contido GC, o que inflúe na evolución dos organismos.[15] O problema de determinar o límite das especies na taxonomía dos procariotas levou a que se fixesen diversas recomendacións para a clasificación dos procariotas, como a do Comité ad hoc sobre a reconciliación dos enfoques en sistemática bacteriana, que recomenda utilizar o contido GC para a clasificación dos niveis taxonómicos superiores.[16] Por exemplo, as Actinobacteria caracterízanse polo seu alto contido GC[17] (en Streptomyces coelicolor A3(2), o contido GC é 72%).[18] O contido GC do lévedo (Saccharomyces cerevisiae) é de 38%,[19] e o doutro organismo modelo común como a planta Arabidopsis thaliana é de 36%.[20]
Debido á natureza do código xenético (con codóns que utilizan todas as bases) é virtualmente imposible que un organismo teña un xenoma cun contido GC próximo a 0% ou 100%, por iso son raros os casos de especies cun contido GC extraordinariamente baixo como Plasmodium falciparum (GC% = ~20%),[21] que é un organismo rico en AT ou pobre en GC.[22]
↑Levin RE, Van Sickle C (1976). "Autolysis of high-GC isolates of Pseudomonas putrefaciens". Antonie Van Leeuwenhoek42 (1–2): 145–55. PMID7999. doi:10.1007/BF00399459.
↑Vinogradov AE (1994). "Measurement by flow cytometry of genomic AT/GC ratio and genome size". Cytometry16 (1): 34–40. PMID7518377. doi:10.1002/cyto.990160106.
↑Wuitschick JD, Karrer KM (1999). "Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites in Tetrahymena thermophila". J. Eukaryot. Microbiol.46 (3): 239–47. PMID10377985. doi:10.1111/j.1550-7408.1999.tb05120.x.
↑Wayne LG; et al. (1987). "Report of the ad hoc committee on reconciliation of approaches to bacterial systematic". International journal of systematic bacteriology37 (4): 463–4. doi:10.1099/00207713-37-4-463.