Ontologia jest formalną reprezentacją zbioru wiedzy w danej dziedzinie. Ontologie zazwyczaj składają się z zestawu klas (lub terminów lub pojęć) wraz z relacjami, które działają między nimi. The Gene Ontology (GO) opisuje naszą wiedzę o domenie biologicznej w odniesieniu do trzech aspektów:
Funkcja molekularna | Działania na poziomie molekularnym wykonywane przez produkty genowe. Terminy funkcji molekularnych opisują działania, które występują na poziomie molekularnym, takie jak “kataliza” lub “transport”. Terminy funkcji molekularnych GO reprezentują działania, a nie jednostki (cząsteczki lub kompleksy), które wykonują działania, i nie określają gdzie, kiedy lub w jakim kontekście działanie ma miejsce. Funkcje molekularne generalnie odpowiadają działaniom, które mogą być wykonywane przez pojedyncze produkty genowe (tj. białka lub RNA), ale niektóre działania są wykonywane przez kompleksy molekularne składające się z wielu produktów genowych. Przykładami szerokich terminów funkcjonalnych są aktywność katalityczna i aktywność transportera; przykładami węższych terminów funkcjonalnych są aktywność cyklazy adenylanowej lub wiązanie receptora Toll-podobnego. Aby uniknąć mylenia nazw produktów genowych z ich funkcjami molekularnymi, funkcje molekularne GO są często uzupełniane o słowo “aktywność” (kinaza białkowa miałaby funkcję molekularną GO aktywność kinazy białkowej). |
Składnik komórkowy | Miejsca względem struktur komórkowych, w których produkt genowy pełni funkcję, albo przedziały komórkowe (np, mitochondrium), lub stabilnych kompleksów wielkocząsteczkowych, których są one częściami (np. rybosom). W przeciwieństwie do innych aspektów GO, klasy składników komórkowych nie odnoszą się do procesów, ale raczej do anatomii komórkowej. |
Proces biologiczny | Większe procesy lub “programy biologiczne” realizowane przez wiele działań molekularnych. Przykłady szerokich terminów procesów biologicznych to naprawa DNA lub transdukcja sygnału. Przykłady bardziej szczegółowych terminów to proces biosyntezy nukleobaz pirymidynowych lub transport transmembranowy glukozy. Należy pamiętać, że proces biologiczny nie jest równoznaczny ze ścieżką. Obecnie GO nie próbuje reprezentować dynamiki lub zależności, które byłyby wymagane do pełnego opisu szlaku. |
W przykładzie adnotacji GO, produkt genu “cytochrom c” może być opisany przez funkcję molekularną aktywność oksydoreduktazy, proces biologiczny fosforylacja oksydacyjna i składnik komórkowy macierz mitochondrialna.
Słownictwo GO jest zaprojektowane jako gatunkowo-agnostyczne i zawiera terminy mające zastosowanie do prokariotów i eukariotów, jak również organizmów jedno- i wielokomórkowych.
Klasy GO (znane również jako terminy)
Klasy GO składają się z definicji, etykiety, unikalnego identyfikatora i kilku innych elementów. Elementy terminów GO są opisane tutaj.
Graf GO
Struktura GO może być opisana w kategoriach grafu, gdzie każdy termin GO jest węzłem, a relacje pomiędzy terminami są krawędziami pomiędzy węzłami. GO jest luźno hierarchiczny, z terminami “dziećmi”, które są bardziej wyspecjalizowane niż ich terminy “rodzica”, ale w przeciwieństwie do ścisłej hierarchii, termin może mieć więcej niż jeden termin rodzica (zauważ, że model rodzic/dziecko nie jest prawdziwy dla wszystkich typów relacji, zobacz dokumentację relacji). Na przykład, termin proces biologiczny biosyntezy heksozy ma dwóch rodziców, proces metabolizmu heksozy i proces biosyntezy monosacharydów. Odzwierciedla to fakt, że proces biosyntezy jest podtypem procesu metabolicznego, a heksoza jest podtypem monosacharydu.
Jedna ontologia… czy trzy?
Jak sugeruje powyższy diagram, trzy domeny GO (składnik komórkowy, proces biologiczny i funkcja molekularna) są reprezentowane przez oddzielny termin ontologii głównej. Wszystkie terminy w domenie mogą śledzić ich pochodzenie do terminu głównego, chociaż może istnieć wiele różnych ścieżek poprzez różną liczbę terminów pośrednich do korzenia ontologii. Trzy węzły główne są niepowiązane i nie mają wspólnego węzła nadrzędnego, a zatem GO to trzy ontologie. Niektóre programy oparte na grafie mogą wymagać pojedynczego węzła głównego; w tych przypadkach “fałszywy” termin może być dodany jako rodzic trzech istniejących węzłów głównych.
Trzy ontologie GO są rozłączne, co oznacza, że nie ma relacji między terminami z różnych ontologii. Jednak inne relacje, takie jak część i reguluje, działają pomiędzy ontologiami GO. Na przykład, termin funkcji molekularnej “aktywność kinazy białkowej zależnej od cykliny” jest częścią procesu biologicznego “cykl komórkowy”. Więcej informacji na temat relacji jest dostępnych tutaj.
GO jako dynamiczna ontologia
GO ma na celu przedstawienie aktualnego stanu wiedzy w biologii, dlatego jest stale aktualizowana i rozszerzana w miarę gromadzenia się wiedzy biologicznej. Zmiany są wprowadzane co tydzień (większość z nich jest stosunkowo niewielka). Korektami ontologii zarządza zespół redaktorów ontologii z dużym doświadczeniem zarówno w biologii, jak i w obliczeniowej reprezentacji wiedzy. Aktualizacje te są dokonywane wspólnie przez zespół ontologiczny GOC i naukowców, którzy o nie proszą. Większość próśb pochodzi od naukowców dokonujących adnotacji GO (mają one zazwyczaj wpływ tylko na kilka terminów) oraz od ekspertów dziedzinowych w poszczególnych obszarach biologii (zazwyczaj aktualizują oni całą “gałąź” ontologii obejmującą wiele terminów i relacji). Zapraszamy badaczy i naukowców obliczeniowych do składania wniosków o nowe terminy, nowe relacje lub inne ulepszenia ontologii.
Details about the ontology
- GO term elements: Opis formatu terminów GO.
- Relacje ontologii: Dokumentacja dotycząca relacji międzyterminowych stosowanych w GO.
- Statystyki GO: Statystyki dla bieżącego wydania i w czasie.
.