Eine Ontologie ist eine formale Darstellung eines Wissensbestands in einem bestimmten Bereich. Ontologien bestehen in der Regel aus einer Reihe von Klassen (oder Begriffen oder Konzepten) mit Beziehungen, die zwischen ihnen bestehen. Die Gene Ontology (GO) beschreibt unser Wissen über den biologischen Bereich in Bezug auf drei Aspekte:
Molekulare Funktion | Aktivitäten auf molekularer Ebene, die von Genprodukten ausgeführt werden. Molekulare Funktionsbegriffe beschreiben Aktivitäten, die auf molekularer Ebene stattfinden, wie z. B. “Katalyse” oder “Transport”. GO-Begriffe für molekulare Funktionen beschreiben Aktivitäten und nicht die Entitäten (Moleküle oder Komplexe), die die Aktionen ausführen, und geben nicht an, wo, wann oder in welchem Kontext die Aktion stattfindet. Molekulare Funktionen entsprechen im Allgemeinen Aktivitäten, die von einzelnen Genprodukten (d. h. einem Protein oder einer RNA) ausgeführt werden können, aber einige Aktivitäten werden von molekularen Komplexen ausgeführt, die aus mehreren Genprodukten bestehen. Beispiele für weit gefasste Funktionsbezeichnungen sind katalytische Aktivität und Transporteraktivität; Beispiele für enger gefasste Funktionsbezeichnungen sind Adenylatzyklase-Aktivität oder Toll-like-Rezeptor-Bindung. Um Verwechslungen zwischen den Namen von Genprodukten und ihren molekularen Funktionen zu vermeiden, wird den molekularen GO-Funktionen häufig das Wort “Aktivität” angehängt (eine Proteinkinase hätte die molekulare GO-Funktion Proteinkinase-Aktivität). |
Zelluläre Komponente | Der Ort in Bezug auf zelluläre Strukturen, in denen ein Genprodukt eine Funktion ausübt, entweder zelluläre Kompartimente (z. B., Mitochondrium) oder stabile makromolekulare Komplexe, von denen sie Teile sind (z. B. das Ribosom). Im Gegensatz zu den anderen Aspekten von GO beziehen sich die zellulären Komponentenklassen nicht auf Prozesse, sondern auf eine zelluläre Anatomie. |
Biologischer Prozess | Die größeren Prozesse oder “biologischen Programme”, die durch mehrere molekulare Aktivitäten ausgeführt werden. Beispiele für weit gefasste Begriffe für biologische Prozesse sind DNA-Reparatur oder Signaltransduktion. Beispiele für spezifischere Begriffe sind der Biosyntheseprozess von Pyrimidinnukleobasen oder der Transmembrantransport von Glukose. Beachten Sie, dass ein biologischer Prozess nicht gleichbedeutend mit einem Stoffwechselweg ist. Gegenwärtig versucht GO nicht, die Dynamik oder die Abhängigkeiten darzustellen, die zur vollständigen Beschreibung eines Pfades erforderlich wären. |
In einem Beispiel für GO-Annotation kann das Genprodukt “Cytochrom c” durch die molekulare Funktion Oxidoreduktase-Aktivität, den biologischen Prozess oxidative Phosphorylierung und die zelluläre Komponente mitochondriale Matrix beschrieben werden.
Das GO-Vokabular ist speziesunabhängig und enthält Begriffe, die für Prokaryoten und Eukaryoten sowie für ein- und mehrzellige Organismen gelten.
GO-Klassen (auch als Begriffe bezeichnet)
GO-Klassen bestehen aus einer Definition, einer Bezeichnung, einem eindeutigen Identifikator und mehreren anderen Elementen. Die Elemente von GO-Begriffen werden hier beschrieben.
Der GO-Graph
Die Struktur von GO kann in Form eines Graphen beschrieben werden, in dem jeder GO-Begriff ein Knoten ist und die Beziehungen zwischen den Begriffen Kanten zwischen den Knoten sind. GO ist locker hierarchisch aufgebaut, wobei “Kind”-Begriffe spezialisierter sind als ihre “Eltern”-Begriffe, aber im Gegensatz zu einer strengen Hierarchie kann ein Begriff mehr als einen Elternbegriff haben (beachten Sie, dass das Eltern/Kind-Modell nicht für alle Arten von Beziehungen gilt, siehe die Dokumentation zu Beziehungen). Zum Beispiel hat der biologische Prozessbegriff Hexose-Biosyntheseprozess zwei übergeordnete Begriffe, Hexose-Stoffwechselprozess und Monosaccharid-Biosyntheseprozess. Dies spiegelt die Tatsache wider, dass der biosynthetische Prozess ein Subtyp des metabolischen Prozesses und eine Hexose ein Subtyp des Monosaccharids ist.
Eine Ontologie… oder drei?
Wie das obige Diagramm zeigt, werden die drei GO-Domänen (zelluläre Komponente, biologischer Prozess und molekulare Funktion) jeweils durch einen separaten Wurzel-Ontologiebegriff dargestellt. Alle Begriffe einer Domäne lassen sich auf einen Wurzelbegriff zurückführen, obwohl es zahlreiche verschiedene Wege über eine unterschiedliche Anzahl von Zwischenbegriffen zu einer Ontologiewurzel geben kann. Die drei Wurzelknoten sind nicht miteinander verwandt und haben keinen gemeinsamen Elternknoten, so dass GO aus drei Ontologien besteht. Einige graphenbasierte Software kann einen einzigen Wurzelknoten erfordern; in diesen Fällen kann ein “falscher” Begriff als Elternteil der drei vorhandenen Wurzelknoten hinzugefügt werden.
Die drei GO-Ontologien sind disjunkt, was bedeutet, dass keine Beziehungen zwischen Begriffen aus den verschiedenen Ontologien bestehen. Andere Beziehungen wie “part of” und “regulates” funktionieren jedoch zwischen den GO-Ontologien. Zum Beispiel ist der molekulare Funktionsbegriff “Cyclin-abhängige Proteinkinase-Aktivität” Teil des biologischen Prozesses “Zellzyklus”. Weitere Informationen zu den Beziehungen finden Sie hier.
GO als dynamische Ontologie
GO zielt darauf ab, den aktuellen Stand des Wissens in der Biologie abzubilden, und wird daher ständig überarbeitet und erweitert, wenn biologisches Wissen zunimmt. Änderungen werden wöchentlich vorgenommen (die meisten sind relativ geringfügig). Die Überarbeitungen der Ontologie werden von einem Team von Ontologie-Redakteuren verwaltet, die über umfangreiche Erfahrungen sowohl in der Biologie als auch in der computergestützten Wissensdarstellung verfügen. Diese Aktualisierungen werden in Zusammenarbeit zwischen dem GOC-Ontologie-Team und den Wissenschaftlern, die die Aktualisierungen beantragen, vorgenommen. Die meisten Anfragen kommen von Wissenschaftlern, die GO-Annotationen vornehmen (diese wirken sich in der Regel nur auf einige wenige Begriffe aus), und von Domänenexperten in bestimmten Bereichen der Biologie (diese überarbeiten in der Regel einen ganzen “Zweig” der Ontologie, der viele Begriffe und Beziehungen umfasst). Wir laden Forscher und Computerwissenschaftler ein, Vorschläge für neue Begriffe, neue Beziehungen oder andere Verbesserungen der Ontologie einzureichen.
Details über die Ontologie
- GO-Term-Elemente: Beschreibung des Formats von GO-Begriffen.
- Ontologie-Beziehungen: Dokumentation über die in GO verwendeten Beziehungen zwischen den Begriffen.
- GO-Statistiken: Statistiken für die aktuelle Version und über die Zeit.