Az ontológia egy adott területen belüli tudáshalmaz formális reprezentációja. Az ontológiák általában osztályok (vagy kifejezések vagy fogalmak) halmazából és a közöttük működő kapcsolatokból állnak. A génontológia (GO, Gene Ontology) a biológiai területről szerzett ismereteinket három szempontból írja le:
Molekuláris funkció | A géntermékek által végzett molekuláris szintű tevékenységek. A molekuláris funkció kifejezések olyan molekuláris szinten zajló tevékenységeket írnak le, mint például a “katalízis” vagy a “szállítás”. A GO molekuláris funkció kifejezések inkább tevékenységeket jelölnek, mint a tevékenységeket végző entitásokat (molekulákat vagy komplexeket), és nem határozzák meg, hogy a tevékenység hol, mikor vagy milyen kontextusban zajlik. A molekuláris funkciók általában olyan tevékenységeknek felelnek meg, amelyeket egyedi géntermékek (pl. fehérje vagy RNS) végezhetnek, de néhány tevékenységet több géntermékből álló molekulakomplexek végeznek. Példák a tág funkcionális kifejezésekre a katalitikus aktivitás és a transzporter aktivitás; példák a szűkebb funkcionális kifejezésekre az adenilát-cikláz aktivitás vagy a Toll-szerű receptorok kötődése. A géntermékek nevei és molekuláris funkcióik közötti összetévesztés elkerülése érdekében a GO molekuláris funkciókat gyakran az “aktivitás” szóval egészítik ki (egy fehérje kináznak a GO molekuláris funkciója a fehérje kináz aktivitás lenne). |
Celluláris komponens | A sejtstruktúrákhoz viszonyított helyek, amelyekben egy géntermék funkciót lát el, akár sejtkompartmentek (pl., mitokondrium), vagy stabil makromolekuláris komplexek, amelyeknek részei (pl. a riboszóma). A GO más vonatkozásaitól eltérően a sejtkomponens-osztályok nem folyamatokra, hanem inkább egy sejtanatómiára utalnak. |
Biológiai folyamat | A több molekuláris tevékenység által megvalósított nagyobb folyamatok vagy “biológiai programok”. Példák tág értelemben vett biológiai folyamat kifejezésekre a DNS-javítás vagy a jelátvitel. Példa specifikusabb kifejezésekre a pirimidin-nukleobázis bioszintetikus folyamat vagy a glükóz transzmembrán transzportja. Megjegyzendő, hogy egy biológiai folyamat nem egyenértékű egy útvonallal. A GO jelenleg nem próbálja reprezentálni a dinamikát vagy a függőségeket, amelyek egy útvonal teljes leírásához szükségesek lennének. |
A GO annotáció egy példájában a “citokróm c” géntermék leírható az oxidoreduktáz aktivitás molekuláris funkcióval, az oxidatív foszforiláció biológiai folyamattal és a mitokondriális mátrix sejtkomponenssel.
A GO-szótárat úgy tervezték, hogy faj-agnosztikus legyen, és prokariótákra és eukariótákra, valamint egy- és többsejtű szervezetekre alkalmazható kifejezéseket tartalmaz.
GO-osztályok (más néven kifejezések)
A GO-osztályok egy definícióból, egy címkéből, egy egyedi azonosítóból és számos más elemből állnak. A GO-terminusok elemeit itt ismertetjük.
A GO-gráf
A GO szerkezete egy gráf formájában írható le, ahol minden GO-terminus egy csomópont, a terminusok közötti kapcsolatok pedig a csomópontok közötti élek. A GO lazán hierarchikus, a “gyermek” kifejezések specializáltabbak, mint a “szülő” kifejezések, de a szigorú hierarchiával ellentétben egy kifejezésnek egynél több szülő kifejezése lehet (megjegyzendő, hogy a szülő/gyermek modell nem minden típusú kapcsolatra igaz, lásd a kapcsolatok dokumentációját). Például a biológiai folyamat kifejezésnek, a hexóz bioszintetikus folyamatnak két szülője van, a hexóz metabolikus folyamat és a monoszacharid bioszintetikus folyamat. Ez azt tükrözi, hogy a bioszintetikus folyamat a metabolikus folyamat altípusa, a hexóz pedig a monoszacharid altípusa.
Egy ontológia… vagy három?
Amint a fenti ábra mutatja, a három GO-tartományt (sejtkomponens, biológiai folyamat és molekuláris funkció) egy-egy külön gyökérontológia kifejezés képviseli. Egy tartományban minden terminus visszavezethető egy gyökérterminusra, bár számos különböző útvonal vezethet különböző számú köztes terminuson keresztül az ontológia gyökeréig. A három gyökércsomópont nem kapcsolódik egymáshoz, és nincs közös szülőcsomópontjuk, ezért a GO három ontológia. Néhány gráf-alapú szoftver egyetlen gyökércsomópontot igényelhet; ezekben az esetekben egy “hamis” terminus adható hozzá a három meglévő gyökércsomópont szülőjeként.
A három GO ontológia diszjunkt, ami azt jelenti, hogy a különböző ontológiák terminusai között nem működik kapcsolat. Más kapcsolatok, mint például a part of és a regulates azonban működnek a GO ontológiák között. Például a “ciklinfüggő fehérje kináz aktivitás” molekuláris funkció kifejezés a “sejtciklus” biológiai folyamat része. A kapcsolatokról további információk itt találhatók.
AGO mint dinamikus ontológia
A GO célja, hogy a biológia jelenlegi tudásszintjét reprezentálja, ezért a biológiai ismeretek felhalmozódásával folyamatosan felülvizsgálják és bővítik. Heti rendszerességgel történnek változtatások (a legtöbb viszonylag kisebb). Az ontológia felülvizsgálatát egy ontológia-szerkesztőkből álló csapat irányítja, amely mind a biológia, mind a számítógépes tudásreprezentáció terén nagy tapasztalattal rendelkezik. Ezeket a frissítéseket a GOC ontológiai csapata és a frissítéseket kérő tudósok közösen végzik. A legtöbb kérés GO-jegyzeteket készítő tudósoktól érkezik (ezek jellemzően csak néhány kifejezést érintenek), illetve a biológia egyes területeinek szakértőitől (ezek jellemzően az ontológia egy egész, sok kifejezést és relációt tartalmazó “ágát” vizsgálják felül). Kérjük a kutatókat és számítástudományi szakembereket, hogy nyújtsanak be kéréseket akár új kifejezésekre, akár új kapcsolatokra, akár az ontológia bármilyen más fejlesztésére vonatkozóan.
Details about the ontology
- GO term elements: A GO-terminusok formátumának leírása.
- Ontológiai kapcsolatok: A GO-ban használt fogalmak közötti kapcsolatok dokumentációja.
- GO statisztikák: Statisztikák az aktuális kiadásra és az idők folyamán.