O ontologie este o reprezentare formală a unui corp de cunoștințe dintr-un anumit domeniu. Ontologiile constau, de obicei, dintr-un set de clase (sau termeni sau concepte) cu relații care operează între ele. Ontologia genetică (GO) descrie cunoștințele noastre din domeniul biologic în ceea ce privește trei aspecte:
Funcția moleculară | Activități la nivel molecular efectuate de produsele genice. Termenii de funcție moleculară descriu activități care au loc la nivel molecular, cum ar fi “cataliză” sau “transport”. Termenii GO de funcție moleculară reprezintă mai degrabă activitățile decât entitățile (molecule sau complexe) care efectuează acțiunile și nu specifică unde, când sau în ce context are loc acțiunea. Funcțiile moleculare corespund, în general, activităților care pot fi realizate de produse genetice individuale (de exemplu, o proteină sau un ARN), dar unele activități sunt realizate de complexe moleculare compuse din mai multe produse genetice. Exemple de termeni funcționali largi sunt activitatea catalitică și activitatea de transport; exemple de termeni funcționali mai restrânși sunt activitatea adenilatciclazei sau legarea receptorilor Toll-like. Pentru a evita confuzia între denumirile produselor genice și funcțiile moleculare ale acestora, funcțiile moleculare GO sunt adesea însoțite de cuvântul “activity” (o proteinkinază ar avea funcția moleculară GO protein kinase activity). |
Cellular Component | Localizările în raport cu structurile celulare în care un produs genetic îndeplinește o funcție, fie că este vorba de compartimente celulare (de ex, mitocondria), fie complexe macromoleculare stabile din care fac parte (de exemplu, ribozomul). Spre deosebire de celelalte aspecte ale GO, clasele de componente celulare nu se referă la procese, ci mai degrabă la o anatomie celulară. |
Proces biologic | Procese mai mari sau “programe biologice” realizate prin activități moleculare multiple. Exemple de termeni largi de procese biologice sunt repararea ADN-ului sau transducția semnalelor. Exemple de termeni mai specifici sunt procesul de biosinteză a nucleobazei pirimidinice sau transportul transmembranar al glucozei. Rețineți că un proces biologic nu este echivalent cu o cale. În prezent, GO nu încearcă să reprezinte dinamica sau dependențele care ar fi necesare pentru a descrie complet o cale. |
Într-un exemplu de adnotare GO, produsul genetic “citocrom c” poate fi descris prin funcția moleculară activitate oxidoreductază, procesul biologic fosforilare oxidativă și componenta celulară matrice mitocondrială.
Vocularul GO este conceput pentru a fi agnostic față de specii și include termeni aplicabili la procariote și eucariote, precum și la organisme unicelulare și pluricelulare.
Classe GO (cunoscute și ca termeni)
Classele GO sunt compuse dintr-o definiție, o etichetă, un identificator unic și alte câteva elemente. Elementele termenilor GO sunt descrise aici.
Graful GO
Structura GO poate fi descrisă în termenii unui graf, în care fiecare termen GO este un nod, iar relațiile dintre termeni sunt muchii între noduri. GO este slab ierarhizată, termenii “copii” fiind mai specializați decât termenii “părinți”, dar, spre deosebire de o ierarhie strictă, un termen poate avea mai mult de un termen părinte (rețineți că modelul părinte/copil nu este valabil pentru toate tipurile de relații, consultați documentația privind relațiile). De exemplu, termenul de proces biologic “hexose biosynthetic process” are doi părinți, “hexose metabolic process” și “monosaccharide biosynthetic process”. Acest lucru reflectă faptul că procesul biosintetic este un subtip al procesului metabolic, iar o hexoză este un subtip al monosacaridelor.
O singură ontologie… sau trei?
După cum sugerează diagrama de mai sus, cele trei domenii GO (componentă celulară, proces biologic și funcție moleculară) sunt reprezentate fiecare de un termen ontologic rădăcină separat. Toți termenii dintr-un domeniu își pot urmări filiația până la un termen rădăcină, deși pot exista numeroase căi diferite, prin intermediul unui număr variabil de termeni intermediari, până la un termen rădăcină al ontologiei. Cele trei noduri rădăcină nu sunt legate între ele și nu au un nod părinte comun și, prin urmare, GO reprezintă trei ontologii. Unele programe informatice bazate pe grafuri pot necesita un singur nod rădăcină; în aceste cazuri, se poate adăuga un termen “fals” ca părinte al celor trei noduri rădăcină existente.
Cele trei ontologii GO sunt este disjuncte, ceea ce înseamnă că nu este o relație operează între termenii din diferitele ontologii. Cu toate acestea, alte relații, cum ar fi “part of” și “regulates”, operează între ontologiile GO. De exemplu, termenul de funcție moleculară “cyclin-dependent protein kinase activity” face parte din procesul biologic “cell cycle”. Mai multe informații despre relații sunt disponibile aici.
GO ca ontologie dinamică
GO își propune să reprezinte stadiul actual al cunoașterii în biologie, prin urmare, este revizuită și extinsă în mod constant pe măsură ce cunoștințele biologice se acumulează. Modificările sunt efectuate săptămânal (majoritatea relativ minore). Revizuirile ontologiei sunt gestionate de o echipă de editori de ontologie cu o experiență vastă atât în biologie, cât și în reprezentarea cunoștințelor computaționale. Aceste actualizări sunt realizate în colaborare între echipa de ontologie GOC și oamenii de știință care solicită actualizările. Cele mai multe solicitări provin de la oamenii de știință care fac adnotări GO (acestea au, de obicei, un impact doar asupra câtorva termeni fiecare) și de la experți în anumite domenii ale biologiei (aceștia revizuiesc, de obicei, o întreagă “ramură” a ontologiei care cuprinde mulți termeni și relații). Invităm cercetătorii și oamenii de știință din domeniul informaticii să trimită cereri fie pentru noi termeni, fie pentru noi relații, fie pentru orice alte îmbunătățiri ale ontologiei.
Detalii despre ontologie
- Elemente ale termenilor GO: Descriere a formatului termenilor GO.
- Relații ontologice: Documentație privind relațiile intertermeni utilizate în GO.
- Statistici GO: Statistici pentru versiunea curentă și de-a lungul timpului.