Uma ontologia é uma representação formal de um corpo de conhecimento dentro de um determinado domínio. Ontologias geralmente consistem de um conjunto de classes (ou termos ou conceitos) com relações que operam entre elas. A Ontologia Genética (GO) descreve nosso conhecimento do domínio biológico com respeito a três aspectos:
Função Molecular | Atividades de nível molecular realizadas por produtos gênicos. Termos de função molecular descrevem atividades que ocorrem em nível molecular, tais como “catálise” ou “transporte”. GO termos de função molecular representam atividades ao invés das entidades (moléculas ou complexos) que realizam as ações, e não especificam onde, quando ou em que contexto a ação ocorre. As funções moleculares geralmente correspondem a atividades que podem ser realizadas por produtos gênicos individuais (isto é, uma proteína ou RNA), mas algumas atividades são realizadas por complexos moleculares compostos de múltiplos produtos gênicos. Exemplos de termos funcionais amplos são a atividade catalítica e a atividade do transportador; exemplos de termos funcionais mais estreitos são a atividade adenilato ciclase ou a ligação de receptores tipo Toll-like. Para evitar confusão entre os nomes dos produtos gênicos e suas funções moleculares, funções moleculares GO são frequentemente anexadas com a palavra “atividade” (uma proteína quinase teria a função molecular GO proteína quinase atividade). |
Componente Celular | As localizações relativas às estruturas celulares nas quais um produto gênico executa uma função, seja compartimentos celulares (por exemplo mitocôndrio), ou complexos macromoleculares estáveis dos quais são partes (p. ex., o ribossomo). Ao contrário dos outros aspectos do GO, as classes de componentes celulares referem-se não a processos, mas sim a uma anatomia celular. |
Processo Biológico | Os processos maiores, ou ‘programas biológicos’ realizados por múltiplas atividades moleculares. Exemplos de termos de processos biológicos amplos são a reparação do DNA ou a transdução de sinal. Exemplos de termos mais específicos são processo biossintético de nucleobase pirimidina ou transporte de transmembrana de glicose. Note que um processo biológico não é equivalente a um caminho. Atualmente, o GO não tenta representar a dinâmica ou dependências que seriam necessárias para descrever completamente uma via. |
Num exemplo de anotação do GO, o produto genético “citocromo c” pode ser descrito pela função molecular atividade da oxidoredutase, pelo processo biológico fosforilação oxidativa e pela matriz mitocondrial do componente celular.
O vocabulário GO foi projetado para ser a espécie agnóstica, e inclui termos aplicáveis a procariotas e eucariotas, bem como organismos monocelulares e multicelulares.
Classes GO (também conhecidas como termos)
As classes GO são compostas de uma definição, um rótulo, um identificador único, e vários outros elementos. Elementos de termos GO são descritos aqui.
O gráfico GO
A estrutura de GO pode ser descrita em termos de um gráfico, onde cada termo GO é um nó, e as relações entre os termos são bordas entre os nós. GO é vagamente hierárquico, com termos ‘filhos’ sendo mais especializados que seus termos ‘pais’, mas ao contrário de uma hierarquia rigorosa, um termo pode ter mais de um termo pai (note que o modelo pai/filho não se aplica a todos os tipos de relações, veja a documentação de relações). Por exemplo, o termo processo biológico processo biossintético hexose tem dois pais, processo metabólico hexose e processo biossintético monossacarídeo. Isto reflete o fato de que o processo biossintético é um subtipo de processo metabólico e uma hexose é um subtipo de monossacarídeo.
Uma ontologia… ou três?
Como o diagrama acima sugere, os três domínios GO (componente celular, processo biológico e função molecular) são cada um representado por um termo ontológico raiz separado. Todos os termos em um domínio podem traçar seu parentesco a um termo raiz, embora possa haver inúmeros caminhos diferentes através de números variáveis de termos intermediários para uma raiz ontológica. Os três nós raiz não estão relacionados e não têm um nó pai comum, e portanto GO são três ontologias. Alguns softwares baseados em gráficos podem requerer um único nó raiz; nestes casos, um termo “falso” pode ser adicionado como pai dos três nós raiz existentes.
As três ontologias GO são uma desarticulação, significando que não é uma relação entre os termos das diferentes ontologias. No entanto, outras relações, como parte de e reguladores, operam entre as ontologias de GO. Por exemplo, o termo função molecular ‘atividade da proteína quinase dependente da ciclina’ é parte do processo biológico ‘ciclo celular’. Mais informação sobre relações está disponível aqui.
GO como uma ontologia dinâmica
GO visa representar o estado actual do conhecimento em biologia, por isso é constantemente revisto e expandido à medida que o conhecimento biológico se acumula. As mudanças são feitas semanalmente (a maioria relativamente menor). As revisões da ontologia são gerenciadas por uma equipe de editores de ontologia com vasta experiência tanto em biologia quanto na representação do conhecimento computacional. Estas atualizações são feitas em colaboração entre a equipe de ontologistas do GOC e cientistas que solicitam as atualizações. A maioria dos pedidos vem de cientistas fazendo anotações GO (estas tipicamente impactam apenas alguns termos cada uma), e de especialistas em áreas particulares da biologia (estes tipicamente revisam todo um ‘ramo’ da ontologia compreendendo muitos termos e relações). Nós convidamos pesquisadores e cientistas computacionais a submeterem pedidos para novos termos, novas relações ou quaisquer outros melhoramentos na ontologia.
Detalhes sobre a ontologia
- Elementos do termo GO: Descrição do formato dos termos GO.
- Relações ontológicas: Documentação sobre as relações entre termos usados em GO.
- GO statistics: Estatísticas para a versão atual e ao longo do tempo.