Une ontologie est une représentation formelle d’un ensemble de connaissances dans un domaine donné. Les ontologies consistent généralement en un ensemble de classes (ou termes ou concepts) avec des relations qui opèrent entre elles. L’ontologie des gènes (GO) décrit nos connaissances du domaine biologique en ce qui concerne trois aspects :
Fonction moléculaire | Activités de niveau moléculaire réalisées par les produits des gènes. Les termes de fonction moléculaire décrivent des activités qui se produisent au niveau moléculaire, comme la “catalyse” ou le “transport”. Les termes de fonction moléculaire GO représentent les activités plutôt que les entités (molécules ou complexes) qui effectuent les actions, et ne précisent pas où, quand ou dans quel contexte l’action a lieu. Les fonctions moléculaires correspondent généralement à des activités qui peuvent être réalisées par des produits génétiques individuels (c’est-à-dire une protéine ou un ARN), mais certaines activités sont réalisées par des complexes moléculaires composés de plusieurs produits génétiques. Des exemples de termes fonctionnels larges sont l’activité catalytique et l’activité de transporteur ; des exemples de termes fonctionnels plus étroits sont l’activité de l’adénylate cyclase ou la liaison des récepteurs de type Toll. Pour éviter toute confusion entre les noms des produits génétiques et leurs fonctions moléculaires, les fonctions moléculaires GO sont souvent accolées au mot “activité” (une protéine kinase aurait la fonction moléculaire GO activité de la protéine kinase). |
Composant cellulaire | Les emplacements relatifs aux structures cellulaires dans lesquelles un produit génique exerce une fonction, soit des compartiments cellulaires (par ex, mitochondrie), soit des complexes macromoléculaires stables dont ils font partie (par exemple, le ribosome). Contrairement aux autres aspects de GO, les classes de composants cellulaires ne font pas référence à des processus mais plutôt à une anatomie cellulaire. |
Processus biologique | Les processus plus larges, ou “programmes biologiques” accomplis par de multiples activités moléculaires. Des exemples de termes généraux de processus biologiques sont la réparation de l’ADN ou la transduction du signal. Des exemples de termes plus spécifiques sont le processus de biosynthèse de la pyrimidine nucléobase ou le transport transmembranaire du glucose. Notez qu’un processus biologique n’est pas équivalent à une voie. À l’heure actuelle, le GO ne tente pas de représenter la dynamique ou les dépendances qui seraient nécessaires pour décrire complètement une voie. |
Dans un exemple d’annotation GO, le produit du gène “cytochrome c” peut être décrit par la fonction moléculaire activité oxydoréductase, le processus biologique phosphorylation oxydative et le composant cellulaire matrice mitochondriale.
Le vocabulaire GO est conçu pour être agnostique en termes d’espèces, et comprend des termes applicables aux procaryotes et aux eucaryotes, ainsi qu’aux organismes unicellulaires et multicellulaires.
Les classes GO (également appelées termes)
Les classes GO sont composées d’une définition, d’une étiquette, d’un identifiant unique et de plusieurs autres éléments. Les éléments des termes GO sont décrits ici.
Le graphe GO
La structure de GO peut être décrite en termes de graphe, où chaque terme GO est un nœud, et les relations entre les termes sont des arêtes entre les nœuds. GO est faiblement hiérarchisé, les termes “enfants” étant plus spécialisés que leurs termes “parents”, mais contrairement à une hiérarchie stricte, un terme peut avoir plus d’un terme parent (notez que le modèle parent/enfant ne s’applique pas à tous les types de relations, voir la documentation sur les relations). Par exemple, le terme processus biologique processus de biosynthèse de l’hexose a deux parents, processus métabolique de l’hexose et processus de biosynthèse des monosaccharides. Cela reflète le fait que le processus biosynthétique est un sous-type de processus métabolique et qu’un hexose est un sous-type de monosaccharide.
Une ontologie… ou trois ?
Comme le suggère le diagramme ci-dessus, les trois domaines GO (composant cellulaire, processus biologique et fonction moléculaire) sont chacun représentés par un terme ontologique racine distinct. Tous les termes d’un domaine peuvent retracer leur filiation à un terme racine, bien qu’il puisse y avoir de nombreux chemins différents via un nombre variable de termes intermédiaires vers une racine ontologique. Les trois nœuds racines ne sont pas liés et n’ont pas de nœud parent commun, et donc GO est constitué de trois ontologies. Certains logiciels basés sur les graphes peuvent exiger un seul nœud racine ; dans ces cas, un “faux” terme peut être ajouté comme parent des trois nœuds racines existants.
Les trois ontologies GO sont est une disjointe, ce qui signifie qu’aucune est une relations opèrent entre les termes des différentes ontologies. Cependant, d’autres relations telles que part of et regulates opèrent entre les ontologies GO. Par exemple, le terme de fonction moléculaire “activité de la protéine kinase dépendante de la cycline” fait partie du processus biologique “cycle cellulaire”. Plus d’informations sur les relations sont disponibles ici.
GO en tant qu’ontologie dynamique
GO vise à représenter l’état actuel des connaissances en biologie, donc elle est constamment révisée et étendue au fur et à mesure que les connaissances biologiques s’accumulent. Des modifications sont apportées sur une base hebdomadaire (la plupart relativement mineures). Les révisions de l’ontologie sont gérées par une équipe d’éditeurs d’ontologie possédant une vaste expérience à la fois en biologie et en représentation informatique des connaissances. Ces mises à jour sont effectuées en collaboration entre l’équipe ontologique du GOC et les scientifiques qui en font la demande. La plupart des demandes proviennent de scientifiques effectuant des annotations GO (qui n’ont généralement qu’un impact sur quelques termes chacun) et d’experts dans des domaines particuliers de la biologie (qui révisent généralement une ” branche ” entière de l’ontologie comprenant de nombreux termes et relations). Nous invitons les chercheurs et les informaticiens à soumettre des demandes soit de nouveaux termes, soit de nouvelles relations, soit toute autre amélioration de l’ontologie.
Détails sur l’ontologie
- Éléments des termes GO : Description du format des termes GO.
- Relations de l’ontologie : Documentation sur les relations inter-termes utilisées dans GO.
- Statistiques de GO : Statistiques pour la version actuelle et dans le temps.