Una ontología es una representación formal de un cuerpo de conocimiento dentro de un dominio determinado. Las ontologías suelen consistir en un conjunto de clases (o términos o conceptos) con relaciones que operan entre ellas. La ontología de genes (GO) describe nuestro conocimiento del dominio biológico con respecto a tres aspectos:
Función molecular | Actividades a nivel molecular realizadas por los productos de los genes. Los términos de función molecular describen actividades que ocurren a nivel molecular, como “catálisis” o “transporte”. Los términos de función molecular de GO representan actividades más que las entidades (moléculas o complejos) que realizan las acciones, y no especifican dónde, cuándo o en qué contexto tiene lugar la acción. Las funciones moleculares suelen corresponder a actividades que pueden ser realizadas por productos génicos individuales (es decir, una proteína o un ARN), pero algunas actividades son realizadas por complejos moleculares compuestos por múltiples productos génicos. Ejemplos de términos funcionales amplios son la actividad catalítica y la actividad transportadora; ejemplos de términos funcionales más estrechos son la actividad de la adenilato ciclasa o la unión de receptores tipo Toll. Para evitar la confusión entre los nombres de los productos génicos y sus funciones moleculares, las funciones moleculares GO suelen ir acompañadas de la palabra “actividad” (una proteína quinasa tendría la función molecular GO actividad de la proteína quinasa). |
Componente celular | Las ubicaciones relativas a las estructuras celulares en las que un producto génico realiza una función, ya sean compartimentos celulares (por ejemplo, mitocondria), o complejos macromoleculares estables de los que forman parte (por ejemplo, el ribosoma). A diferencia de los otros aspectos de GO, las clases de componentes celulares no se refieren a procesos sino a una anatomía celular. |
Proceso biológico | Los procesos más amplios, o “programas biológicos” realizados por múltiples actividades moleculares. Ejemplos de términos de procesos biológicos amplios son la reparación del ADN o la transducción de señales. Ejemplos de términos más específicos son el proceso biosintético de la nucleobase de pirimidina o el transporte transmembrana de glucosa. Nótese que un proceso biológico no es equivalente a una vía. En la actualidad, el GO no intenta representar la dinámica o las dependencias que se requerirían para describir completamente una vía. |
En un ejemplo de anotación del GO, el producto génico “citocromo c” puede describirse mediante la función molecular actividad oxidorreductasa, el proceso biológico fosforilación oxidativa y el componente celular matriz mitocondrial.
El vocabulario GO está diseñado para ser agnóstico respecto a las especies, e incluye términos aplicables a procariotas y eucariotas, así como a organismos unicelulares y multicelulares.
Las clases GO (también conocidas como términos)
Las clases GO están compuestas por una definición, una etiqueta, un identificador único y varios otros elementos. Los elementos de los términos GO se describen aquí.
El gráfico GO
La estructura de GO puede describirse en términos de un gráfico, donde cada término GO es un nodo, y las relaciones entre los términos son aristas entre los nodos. GO es ligeramente jerárquico, con términos “hijos” más especializados que sus términos “padres”, pero a diferencia de una jerarquía estricta, un término puede tener más de un término padre (nótese que el modelo padre/hijo no es válido para todos los tipos de relaciones, véase la documentación sobre relaciones). Por ejemplo, el término de proceso biológico proceso biosintético de hexosas tiene dos padres, proceso metabólico de hexosas y proceso biosintético de monosacáridos. Esto refleja el hecho de que el proceso biosintético es un subtipo de proceso metabólico y una hexosa es un subtipo de monosacárido.
Una ontología… o tres?
Como sugiere el diagrama anterior, los tres dominios GO (componente celular, proceso biológico y función molecular) están representados cada uno por un término ontológico raíz separado. Todos los términos de un dominio pueden rastrear su origen hasta un término raíz, aunque puede haber numerosos caminos diferentes a través de un número variable de términos intermedios hasta la raíz de la ontología. Los tres nodos raíz no están relacionados y no tienen un nodo padre común, por lo que GO es tres ontologías. Algunos programas informáticos basados en grafos pueden requerir un único nodo raíz; en estos casos, se puede añadir un término “falso” como padre de los tres nodos raíz existentes.
Las tres ontologías GO son disjuntas, lo que significa que no existen relaciones entre los términos de las diferentes ontologías. Sin embargo, otras relaciones como parte de y regula sí operan entre las ontologías GO. Por ejemplo, el término de función molecular “actividad de la proteína quinasa dependiente de ciclina” forma parte del proceso biológico “ciclo celular”. Más información sobre las relaciones está disponible aquí.
GO como ontología dinámica
GO pretende representar el estado actual del conocimiento en biología, por lo que se revisa y amplía constantemente a medida que se acumula el conocimiento biológico. Los cambios se realizan semanalmente (la mayoría relativamente menores). Las revisiones de la ontología son gestionadas por un equipo de editores de ontología con amplia experiencia tanto en biología como en representación del conocimiento computacional. Estas actualizaciones se realizan en colaboración entre el equipo de ontología de la GOC y los científicos que las solicitan. La mayoría de las solicitudes proceden de científicos que realizan anotaciones de GO (que suelen afectar sólo a unos pocos términos), y de expertos en determinadas áreas de la biología (que suelen revisar toda una “rama” de la ontología que comprende muchos términos y relaciones). Invitamos a los investigadores y científicos computacionales a presentar solicitudes de nuevos términos, nuevas relaciones o cualquier otra mejora de la ontología.
Detalles sobre la ontología
- Elementos de los términos GO: Descripción del formato de los términos GO.
- Relaciones de la ontología: Documentación sobre las relaciones entre términos utilizadas en GO.
- Estadísticas de GO: Estadísticas de la versión actual y a lo largo del tiempo.