Protein Data Bank
Protein Data Bank | |
Vállalkozás típusa | krisztallográfiai adatbázis |
Oldal típusa | krisztallográfiai adatbázis |
Elérhető nyelv(ek) | angol |
Alapítva | 1971 |
URL | www.wwpdb.org |
A Wikimédia Commons tartalmaz Protein Data Bank témájú médiaállományokat. |
A Protein Data Bank (PDB)[1] nagy biomolekulák, például fehérjék és nukleinsavak háromdimenziós szerkezeti adatait tartalmazó adatbázis. A jellemzően röntgenkrisztallográfiával, NMR-spektroszkópiával vagy krioelektronmikroszkópiával szerzett, biológusok és biokémikusok által gyűjtött adat szabadon elérhető az interneten tagszervezetei, a PDBe,[2] a PDBj,[3] az RCSB[4] és a BMRB[5] útján. A PDB-t a Worldwide Protein Data Bank (wwPDB) felügyeli.
A PDB fontos a szerkezeti biológia területein, például a szerkezeti genomikában. A legtöbb nagy tudományos folyóirat és társaság a kutatóknak megköveteli a szerkezeti adatok elküldését a PDB-be. Számos adatbázis használ a PDB-ben lévő fehérjeszerkezeteket. Például a SCOP és a CATH fehérjeszerkezeteket csoportosítanak, a PDBsum a PDB-bejegyzések grafikus megjelenítését mutatja más forrásokból származó (például génontológiai) információ révén.[6][7]
Történet
[szerkesztés]Két oka volt a PDB létrehozásának: a röntgendiffrakcióval meghatározott kevés, de egyre növekvő mennyiségű fehérjeszerkezeti adat, valamint az 1968-ban megjelent molekuláris kijelző, a Brookhaven Raster Display (BRAD), mely képes volt e szerkezeteket 3D-ben megjeleníteni. 1969-ben Walter Hamilton segítségével a Brookhaven National Laboratorynél Edgar Meyer (Texas A&M University) szoftvert kezdett írni az atomi koordináták közös formátumban való tárolására geometriai és grafikai elemzéshez. 1971-től Meyer SEARCH-e lehetővé tette az adatbázisban lévő információ távoli hozzáférését a fehérjeszerkezetek hálózaton kívüli tanulmányozásához.[8] Ez a hálózatban fontos volt, így ekkor indult el ténylegesen a PDB.
A Protein Data Banket 1971 októberében jelentették be a Nature New Biologyban[9] a Cambridge Crystallographic Data Centre (Egyesült Királyság) és a Brookhaven National Laboratory együttműködésével.
Hamilton halálakor (1973) Tom Koeztle lett a PDB vezetője az ezt követő 20 évre. 1994 januárjában az izraeli Weizmann Kutatóintézetnél dolgozó Joel Sussman lett a PDB vezetője. 1998 októberében[10] a PDB a Research Collaboratory for Structural Bioinformaticshez (RCSB) került;[11] ez 1999 júniusában ért véget. Új vezetője az RCSB egyik vezető intézeténél, a Rutgers Egyetemnél (a másik a San Diegó-i Számítási Központ volt) dolgozó Helen M. Berman lett.[12] 2003-ban a wwPDB létrejöttével a PDB nemzetközi szervezetté vált. Alapító tagjai a PDBe (Európa),[2] az RCSB (Amerikai Egyesült Államok) és a PDBj (Japán) voltak.[3] A BMRB[5] 2006-ban csatlakozott. A wwPDB mind a 4 tagja gyűjthet, feldolgozhat és eloszthat PDB-adatokat. Az adatfeldolgozás arra utal, hogy a wwPDB dolgozói ellenőriznek és jelölnek minden beküldött adatot.[13] Az adatokat ezután automatikusan ellenőrzi egy nyílt forráskódú szoftver, hogy lehetségesek-e.[14]
Tartalom
[szerkesztés]A PDB szerdánként (UTC) frissül a listájával együtt.[16] 2023. január 10-én a PDB-ben az alábbiak voltak:
Kísérleti módszer | Csak fehérjék | Fehérjék oligoszacharidokkal | Fehérje-nukleinsav komplexek | Csak nukleinsavak | Egyéb | Csak oligoszacharidok | Összesen |
---|---|---|---|---|---|---|---|
Röntgendiffrakció | 152 277 |
8 969 |
8 027 |
2 566 |
163 |
11 |
172 013
|
NMR | 12 104 |
32 |
281 |
1 433 |
31 |
6 |
13 887
|
Krioelektron-mikroszkópia | 9 226 |
1 633 |
2 898 |
77 |
8 |
0 |
13 842
|
Hibrid | 189 |
7 |
6 |
12 } |
0 |
1 |
215
|
Neutron | 72 |
1 |
0 |
2 |
0 |
0 |
75
|
Egyéb | 32 |
0 |
0 |
1 |
0 |
4 |
309
|
Összesen | 173 900 |
10 642 |
11 212 |
4 091 |
202 |
22 |
200 069
|
162 041 szerkezetnek van szerkezetifaktor-, 11 242-nek NMR-korlátozási, 5774-nek kémiaieltolódás-, 13 388-nak 3DEM-leképezési fájlja az EM Data Bankben.
A legtöbb szerkezetet röntgendiffrakcióval, mintegy 7%-ukat fehérje-NMR-rel határozták meg. A röntgendiffrakció a fehérje atomjainak koordinátáinak, az NMR az atompárok távolságainak közelítő értékét határozza meg. A fehérje konformációja NMR-ből kapható meg távolsággeometriai probléma megoldásával. 2013 után egyre több fehérje szerkezetét határozták meg krioelektron-mikroszkópiával.
A röntgendiffrakcióval meghatározott szerkezetek esetén elektronsűrűségi térképük is megtekinthető a három PDB-oldalon.
A PDB-ben lévő szerkezetek száma eleinte igen gyorsan nőtt: 1982-ben 100, 1993-ban 1000, 1999-ben 10 000, 2014-ben 100 000, 2023 januárjában 200 000 regisztrált szerkezet volt.[17][18]
Fájlformátum
[szerkesztés]A PDB által kezdetben használt fájlformátum a PDB fájlformátum volt. Ezt a soronként 80 karakteres lyukkártyaszélesség korlátozta. 1996-ban bevezették az mmCIF (macromolecular Crystallographic Information file) formátumot, mely a CIF kiterjesztése. Ez lett 2014-ben a PDB archívum szabványos formátuma.[19] In 2019, the wwPDB announced that depositions for crystallographic methods would only be accepted in mmCIF format.[20]
A PDB XML-változata, a PDBML 2005-ben jelent meg.[21] A szerkezeti fájlok az alábbi formátumok bármelyikében elérhetők, de egyre több szerkezet nem fér el az eredeti formátumba. Az egyes fájlok az könnyen letölthetők grafikus csomagokként:
- PDB-formátumú fájlokhoz a címek formátuma például:
https://www.pdb.org/pdb/files/4hhb.pdb.gz
vagyhttps://pdbe.org/download/4hhb
. - PDBML-fájlok címeinek formátuma például
https://www.pdb.org/pdb/files/4hhb.xml.gz
vagyhttps://pdbe.org/pdbml/4hhb
.
A „4hhb” a PDB-azonosító. A PDB-ben közzétett szerkezetek 4 karakteres alfanumerikus PDB-azonosítót kapnak. Ez nem egyedi azonosító: egy molekula több eltérő környezetben vagy konformációban lévő szerkezete eltérő azonosítót kaphat.
Adatmegtekintés
[szerkesztés]A szerkezeti fájlok számos szabad szoftverrel, például Jmollal, Pymollal, VMD-vel, Molstarral és Rasmollal megtekinthetők. Nem szabad, shareware programok például az ICM-Browser,[22] a MDL Chime, a UCSF Chimera, a Swiss-PDB Viewer,[23] a StarBiochem[24] (Java-alapú interaktív molekulamegtekintő beépített PDB-keresővel), a Sirius, a VisProt3DS[25] (3D-sztereoszkóp nézetben való fehérjevizualizáció anaglif és más módokban) és a Discovery Studio. Az RCSB weblapja szabad és kereskedelmi molekulavizualizációs programokat és beépülőket tartalmazó listát is tartalmaz.
Jegyzetek
[szerkesztés]- ↑ (2019) „Protein Data Bank: the single global archive for 3D macromolecular structure data”. Nucleic Acids Res. 47 (D1), 520–528. o, Kiadó: wwPDB Consortium. DOI:10.1093/nar/gky949. PMID 30357364. PMC 6324056.
- ↑ a b PDBe home < Node < EMBL-EBI. pdbe.org
- ↑ a b Protein Data Bank Japan – PDB Japan – PDBj. pdbj.org
- ↑ RCSB PDB: Homepage. rcsb.org . RCSB Protein Data Bank
- ↑ a b Biological Magnetic Resonance Bank. bmrb.wisc.edu
- ↑ Berman, H. M. (2008. január 1.). „The Protein Data Bank: a historical perspective”. Acta Crystallographica Section A A64 (1), 88–95. o. DOI:10.1107/S0108767307035623. PMID 18156675.
- ↑ Laskowski RA, Hutchinson EG, Michie AD, Wallace AC, Jones ML, Thornton JM (1997. december 1.). „PDBsum: a Web-based database of summaries and analyses of all PDB structures”. Trends Biochem. Sci. 22 (12), 488–90. o. DOI:10.1016/S0968-0004(97)01140-7. PMID 9433130.
- ↑ Meyer EF (1997). „The first years of the Protein Data Bank”. Protein Science 6 (7), 1591–1597. o, Kiadó: Cambridge University Press. DOI:10.1002/pro.5560060724. PMID 9232661. PMC 2143743.
- ↑ (1971) „Protein Data Bank”. Nature New Biology 233. DOI:10.1038/newbio233223b0.
- ↑ Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE (2000. január 1.). „The Protein Data Bank”. Nucleic Acids Res. 28 (1), 235–242. o. DOI:10.1093/nar/28.1.235. PMID 10592235. PMC 102472.
- ↑ Research Collaboratory for Structural Bioinformatics. RCSB.org . Research Collaboratory for Structural Bioinformatics. [2007. február 5-i dátummal az eredetiből archiválva].
- ↑ RCSB PDB Newsletter Archive. RCSB Protein Data Bank
- ↑ Curry E, Freitas A, O'Riáin S.szerk.: D. Wood: The Role of Community-Driven Data Curation for Enterprises, Linking Enterprise Data. Boston: Springer US, 25–47. o. (2010). ISBN 978-1-441-97664-2
- ↑ PDB Validation Suite. sw-tools.pdb.org . [2016. március 3-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. november 29.)
- ↑ Burley SK, Berman HM, Bhikadiya C, Bi C, Chen L, Costanzo LD, etal (2019. január 1.). „Protein Data Bank: the single global archive for 3D macromolecular structure data”. Nucleic Acids Research 47 (D1), D520–D528. o. DOI:10.1093/nar/gky949. PMID 30357364. PMC 6324056.
- ↑ PDB Current Holdings Breakdown. RCSB. [2007. július 4-i dátummal az eredetiből archiválva]. (Hozzáférés: 2007. július 2.)
- ↑ Ismeretlen szerző (2014). „Hard data: It has been no small feat for the Protein Data Bank to stay relevant for 100,000 structures”. Nature 509 (7500), 260. o. DOI:10.1038/509260a. PMID 24834514.
- ↑ PDB Statistics: Overall Growth of Released Structures Per Year. www.rcsb.org . (Hozzáférés: 2023. január 12.)
- ↑ wwPDB: File Formats and the PDB. wwpdb.org . (Hozzáférés: 2020. április 1.)
- ↑ wwPDB.org: wwPDB: 2019 News. wwpdb.org
- ↑ Westbrook J, Ito N, Nakamura H, Henrick K, Berman HM (2005. április 1.). „PDBML: the representation of archival macromolecular structure data in XML”. Bioinformatics 21 (7), 988–992. o. DOI:10.1093/bioinformatics/bti082. PMID 15509603.
- ↑ ICM-Browser. Molsoft L.L.C.. (Hozzáférés: 2013. április 6.)
- ↑ Swiss PDB Viewer. Swiss Institute of Bioinformatics. (Hozzáférés: 2013. április 6.)
- ↑ STAR: Biochem - Home. web.mit.edu
- ↑ VisProt3DS. Molecular Systems Ltd. (Hozzáférés: 2013. április 6.)
Fordítás
[szerkesztés]Ez a szócikk részben vagy egészben a Protein Data Bank című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.
Kapcsolódó szócikkek
[szerkesztés]- krisztallográfiai adatbázis
- fehérjeszerkezet-előrejelzés
- fehérjeszerkezet-adatbázis
- PDBREPORT: PDB-szerkezetek eltéréseit, hibáit listázza
- PDBsum: más adatbázisokból nyer ki adatot PDB-szerkezetekről
- Proteopedia: fehérjék és más molekulák 3D-s enciklopédiája
További információk
[szerkesztés]- Paris city digital code (P630)
- The Worldwide Protein Data Bank (wwPDB): regionáli hostok szülőoldala
- RCSB Protein Data Bank (US)
- PDBe (Európa)
- PDBj (Japán)
- BMRB, Biological Magnetic Resonance Data Bank (US)
- wwPDB Documentation: PDB és PDBML dokumentációja
- Looking at Structures Archiválva 2011. március 24-i dátummal a Wayback Machine-ben.: az RCSB bevezetője a krisztallográfiába
- PDBsum Home Page: más adatbázisokból nyer ki adatot PDB-szerkezetekről.
- Nucleic Acid Database, NDB: nukleinsav-kereső adatbázis
- Introductory PDB tutorial sponsored by PDB
- PDBe: Quick Tour on EBI Train OnLine
- [1]