Un’ontologia è una rappresentazione formale di un corpo di conoscenza all’interno di un dato dominio. Le ontologie di solito consistono in un insieme di classi (o termini o concetti) con relazioni che operano tra loro. La Gene Ontology (GO) descrive la nostra conoscenza del dominio biologico rispetto a tre aspetti:
Funzione molecolare | Attività a livello molecolare svolte dai prodotti genici. I termini di funzione molecolare descrivono attività che avvengono a livello molecolare, come la “catalisi” o il “trasporto”. I termini di funzione molecolare GO rappresentano attività piuttosto che le entità (molecole o complessi) che svolgono le azioni, e non specificano dove, quando o in quale contesto l’azione ha luogo. Le funzioni molecolari generalmente corrispondono ad attività che possono essere eseguite da singoli prodotti genici (cioè una proteina o un RNA), ma alcune attività sono eseguite da complessi molecolari composti da più prodotti genici. Esempi di termini funzionali ampi sono l’attività catalitica e l’attività di trasportatore; esempi di termini funzionali più ristretti sono l’attività dell’adenilato ciclasi o il legame del recettore Toll-like. Per evitare confusione tra i nomi dei prodotti genici e le loro funzioni molecolari, le funzioni molecolari GO sono spesso aggiunte alla parola “attività” (una protein-chinasi avrebbe la funzione molecolare GO attività protein-chinasi). |
Cellular Component | Le posizioni relative alle strutture cellulari in cui un prodotto genico svolge una funzione, sia compartimenti cellulari (es, mitocondrio), o complessi macromolecolari stabili di cui sono parti (ad esempio, il ribosoma). A differenza degli altri aspetti di GO, le classi di componenti cellulari non si riferiscono a processi ma piuttosto a un’anatomia cellulare. |
Processo biologico | I processi più ampi, o “programmi biologici” realizzati da molteplici attività molecolari. Esempi di termini di processi biologici ampi sono la riparazione del DNA o la trasduzione del segnale. Esempi di termini più specifici sono il processo biosintetico delle nucleobasi pirimidiniche o il trasporto transmembrana del glucosio. Si noti che un processo biologico non è equivalente a un percorso. Attualmente, il GO non cerca di rappresentare le dinamiche o le dipendenze che sarebbero necessarie per descrivere completamente un percorso. |
In un esempio di annotazione GO, il prodotto genico “citocromo c” può essere descritto dalla funzione molecolare attività ossidoreduttasi, il processo biologico fosforilazione ossidativa, e il componente cellulare matrice mitocondriale.
Il vocabolario GO è progettato per essere specie-agnostico, e include termini applicabili a procarioti ed eucarioti, così come a organismi monocellulari e multicellulari.
Le classi GO (note anche come termini)
Le classi GO sono composte da una definizione, un’etichetta, un identificatore unico, e diversi altri elementi. Gli elementi dei termini GO sono descritti qui.
Il grafo GO
La struttura di GO può essere descritta in termini di un grafo, dove ogni termine GO è un nodo, e le relazioni tra i termini sono bordi tra i nodi. GO è vagamente gerarchico, con i termini “figli” che sono più specializzati dei loro termini “genitori”, ma a differenza di una gerarchia rigida, un termine può avere più di un termine genitore (si noti che il modello genitore/figlio non vale per tutti i tipi di relazioni, si veda la documentazione sulle relazioni). Per esempio, il termine processo biologico processo biosintetico esoso ha due genitori, processo metabolico esoso e processo biosintetico monosaccaride. Questo riflette il fatto che il processo biosintetico è un sottotipo di processo metabolico e un esoso è un sottotipo di monosaccaride.
Una ontologia… o tre?
Come suggerisce il diagramma sopra, i tre domini GO (componente cellulare, processo biologico e funzione molecolare) sono ciascuno rappresentato da un termine ontologico radice separato. Tutti i termini di un dominio possono rintracciare la loro discendenza da un termine radice, anche se ci possono essere numerosi percorsi diversi attraverso un numero variabile di termini intermedi a una radice ontologica. I tre nodi radice non sono correlati e non hanno un nodo genitore comune, e quindi GO è tre ontologie. Alcuni software basati su grafi possono richiedere un unico nodo radice; in questi casi, un termine “falso” può essere aggiunto come genitore dei tre nodi radice esistenti.
Le tre ontologie GO sono è una disgiunzione, nel senso che non è una relazione operare tra i termini delle diverse ontologie. Tuttavia, altre relazioni, come parte di e regola, operano tra le ontologie GO. Per esempio, il termine di funzione molecolare “attività della proteina chinasi ciclina-dipendente” è parte del processo biologico “ciclo cellulare”. Maggiori informazioni sulle relazioni sono disponibili qui.
GO come ontologia dinamica
GO mira a rappresentare lo stato attuale della conoscenza in biologia, quindi è costantemente rivista ed espansa man mano che la conoscenza biologica si accumula. I cambiamenti sono fatti su base settimanale (la maggior parte relativamente minore). Le revisioni dell’ontologia sono gestite da un team di redattori di ontologia con una vasta esperienza sia nella biologia che nella rappresentazione computazionale della conoscenza. Questi aggiornamenti sono fatti in collaborazione tra il team dell’ontologia GOC e gli scienziati che richiedono gli aggiornamenti. La maggior parte delle richieste provengono da scienziati che fanno annotazioni GO (queste tipicamente hanno un impatto solo su pochi termini ciascuno), e da esperti di dominio in particolari aree della biologia (queste tipicamente rivedono un intero “ramo” dell’ontologia che comprende molti termini e relazioni). Invitiamo i ricercatori e gli scienziati computazionali a presentare richieste per nuovi termini, nuove relazioni o qualsiasi altro miglioramento dell’ontologia.
Dettagli sull’ontologia
- Elementi dei termini GO: Descrizione del formato dei termini GO.
- Relazioni dell’ontologia: Documentazione sulle relazioni tra termini utilizzate in GO.
- Statistiche GO: Statistiche per la release corrente e nel tempo.