Proteinska baza podataka je ključni resurs u oblastima strukturne biologije, kao što je strukturna genomika. Većina vodećih naučnih časopisa i pojedine agencije za finansiranje, kao što je NIH u SAD, zahtevaju od istraživača da unesu svoje podatke o strukturi proteina podatke u PDB. Njen sadržaj se smatra primarnim izvorom, a postoje stotine izvedenih baza podataka koje kategorizuju podatke na razne načine. Naprimjer, SCOP i CATH kategorizuju strukture proteina na temelju strukturnog tipa i pretpostavljenih evolucijskih odnosa, a ontologija gena (GO) klasificira strukture na osnovu gena.[3]
Historija
Proteinska banka podataka (PDB) je formirana 1971. godine. Njen utemeljitelj je Valter Hamilton sa Brukhaven nacionalne laboratorije. Nakon Hamiltonove smrti 1973., nadzor nad PDB-om je preuzeo Tom Koeztle. Januara 1994., za PDB rukovodioca bio je imenovan Joel Susman. Oktobra1998.[4] PDB je transformiran u RCSB (eng. Research Collaboratory for Structural Bioinformatics)[5]. Tranzicija je završena u junu 1999. Novi direktor bila je Helen M. Berman, sa Univerziteta Rutgers (jednog od članica RCSB).[6] Godine 2003. sa formiranjem Svjetske baze podataka (wwPDB) , PDB je postao internacionalna organizacija. Svaki od četiri wwPDB člana djeluje kao centar za depoziciju, obradu i distribuciju PDB podataka. Obrada se odnosi na činjenicu da wwPDB osoblje pregleda i anotira svaki podnijeti upis. Nakon toga, vjerodostojnost podataka se provjerava, a izvorni kod tog softvera za validaciju javno je dostupan.[7]
Sadržaj
Proteinska baza podataka se ažurira sedmično (utorkom). U septembru 2010., PDB je imao sljedeći sadržaj[8]:
Ovi podaci ukazuju da je većina struktura određena difrakcijom X-zraka, dok je oko 15% struktura određeno putem protein NMR. Kad se koristi difrakcija X-zraka, dobijaju se približne koordinate atoma u proteinu. NMR eksperimenti daju procjene rastojanja između parova atoma u proteinu, čija se konformacija dobija rješavanjem problema geometrije rastojanja. Nekoliko proteinskih struktura je određeno krio-elektronskom mikroskopijom.
U prošlosti[9] PDB je rastao približno rastu eksponencijalnom brzinom. Međutim, od 2007., brzina akumulacije novih proteina izgleda da je dostigla plato, sa 7.263 dodatnih proteina u 2007., 7.073 u 2008, i 7.448 u 2009.
Format fajla
Format fajla koji je inicijalno koristio se zove PDB fajl format. Taj originalni format je bio ograničen širinom bušenih kompjuterskih kartica na 80 slova po liniji. "Makromolekukski kristalografski informacijski fajl" format, mmCIF, počeo se primjenjivati 1996. godine,. XML verzija ovog formata, zvana PDBML, pojavila se 2005. godine.[10]
Proteinske strukture se mogu preuzeti u bilo kojem od tih formata. Grafički paketi pristupaju direktno strukturama na PDB sajtu:
Proteopedia — kolaborativna 3D enciklopedija proteina i drugih molekula
Reference
^Bajrović K, Jevrić-Čaušević A., Hadžiselimović R., Ed. (2005): Uvod u genetičko inženjerstvo i biotehnologiju. Institut za genetičko inženjerstvo i biotehnologiju (INGEB), Sarajevo, ISBN9958-9344-1-8.
^Kapur Pojskić L., Ed. (2014): Uvod u genetičko inženjerstvo i biotehnologiju, 2. izdanje. Institut za genetičko inženjerstvo i biotehnologiju (INGEB), Sarajevo, ISBN978-9958-9344-8-3.