domingo, 21 de noviembre de 2010

           
ONTOLOGIAS
Si los metadatos sirven para la estructuración del contenido, tanto los tesauros como las ontologías, hacen posible una semántica para construirlos. Una ontología es una especificación de una conceptualización, esto es, un marco común o una estructura conceptual sistematizada y de consenso no sólo para almacenar la información, sino también para poder buscarla y recuperarla. Una ontología define los términos y las relaciones básicas para la compresión de un área del conocimiento, así como las reglas para poder combinar los términos para definir las extensiones de este tipo de  vocabulario controlado.
Se trata de convertir la información en conocimiento mediante unas estructuras de conocimiento formalizadas (las ontologías) que referencien los datos, por medio metadatos, bajo un esquema común normalizado sobre algún dominio del conocimiento. Los metadatos no sólo especificarán el esquema de datos que debe aparecer en cada instancia, sino que también podrán contener información adicional de cómo hacer deducciones sobre ellos, es decir, cómo establecer axiomas que podrán, a su vez, aplicarse en los diferentes dominios que trate el conocimiento almacenado. De esta forma, los buscadores podrán obtener información al compartir los mismos esquemas de anotaciones weby los agentes de software no sólo encontrarán la información precisa, sino que podrán realizar inferencias de forma automática buscando información relacionada con la que se encuentra situada en las páginas web y con los requerimientos de las consultas realizadas por losusuarios. Además, los productores de páginas y servicios web podrán intercambiar sus datos siguiendo estos esquemas comunes consensuados e, incluso, podrán reutilizarlos.
Los beneficios de utilizar antologías se pueden resumir de la siguiente forma:
  •  proporcionan una forma de representar y compartir el conocimiento utilizando un vocabulario común
  •  permiten usar un formato de intercambio de conocimiento
  •  proporcionan un protocolo específico de comunicación
  •  permiten una reutilización del conocimiento
El término ontología se ha empleado desde hace muchos siglos en el campo de la filosofía y del conocimiento y hace ya varias décadas cobró especial relevancia en el campo de la biblioteconomía y la documentación. Hoy ha sufrido un nuevo impulso debido al desarrollo de la Web Semántica donde prima la idea de transformar la red no sólo en un espacio de información, sino también en un espacio de conocimiento.
En el campo de la filosofía, la ontología -en singular- se ha considerado una rama de la filosofía que se ocupa de la naturaleza y organización de la realidad. En los años 90, dicho concepto se empezó a utilizar en el campo de la Inteligencia Artificial, la ingeniería, la representación del conocimiento y la lingüística computacional como modelos de representación del conocimiento. En el campo de la documentación, las ontologías son una herramienta para el intercambio y uso del conocimiento ya que proveen una compresión compartida y consensuada de un dominio del conocimiento, que puede ser comunicada entre personas y sistemas heterogéneos. Dentro de los sistemas de organización del conocimiento, las ontologías, al igual que los tesauros, se encasillan dentro de las llamadas listas relacionadas.
Existen numerosas definiciones de ontologías, entre las que cabe destacar:
  •  "Una ontología es un vocabulario acerca de un dominio: términos + relaciones + reglas de combinación para extender el vocabulario". Neches, 1991.
  •  "Una ontología es la especificación de una conceptualización". Gruber, 1993. (Aquí el término conceptualización se refiere a un modelo conceptual).
  •  "Una ontología es una especificación formal de una conceptualización compartida". Borst, 1997. (Aquí el término forma se refiere a que es procesable por ordenador).
  •  "Una ontología es una base de datos que describe los conceptos generales o sobre un dominio, algunas de sus propiedades y cómo los conceptos se relacionan unos con otros". Weingand, 1997.
  •   Una ontología necesariamente incluirá un vocabulario de términos y una especificación de su significado (definiciones e interrelaciones entre conceptos) que impone estructura al dominio y restringe las posibles interpretaciones. Uschold-Jasper.
Tanto los tesauros como las ontologías son herramientas que sirven para estructurar conceptualmente determinados ámbitos del conocimiento por medio de vocabularios controlados. La diferencia entre los tesauros y las ontologías radica en la complejidad ya que estas últimas introducen un mayor nivel de profundización semántica y proporcionan una descripción lógica y formal que puede ser interpretada tanto por las personas, como por las máquinas, mientras que los tesauros sólo pueden ser interpretados por humanos. Las ontologías permiten, además, la interoperabilidad entre sistemas distintos.
En resumen, una ontología es un sistema de representación del conocimiento que resulta de seleccionar un dominio o ámbito del conocimiento, y aplicar sobre él un método con el fin de obtener una representación formal de los conceptos que contiene y de las relaciones que existen entre dichos conceptos. Además, una ontología se construye en relación a un contexto de utilización. Esto quiere decir que una ontología especifica una conceptualización o una forma de ver el mundo, por lo que cada ontología incorpora un punto de vista. Además, una ontología contiene definiciones que nos proveen del vocabulario para referirse a un dominio. Estas definiciones dependen del lenguaje que usemos para describirlas. Todas las conceptualizaciones (definiciones, categorizaciones, jerarquías, propiedades, herencia, etc.) de una ontología pueden ser procesables por máquina.
Según Gruber, las ontologías se componen de:
  •  conceptos: son las ideas básicas que se intentan formalizar. Los conceptos pueden ser clases de objetos, métodos, planes, estrategias, procesos de razonamiento, etc.
  •  relaciones: representan la interacción y enlace entre los conceptos de un dominio. Suelen formar la taxonomía del dominio. Por ejemplo: subclase-de, parte-de, parte-exhaustiva-de, conectado-a, etc.
  •  funciones: son un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera varios elementos de la ontología. Por ejemplo, pueden aparecer funciones como: asignar-fecha, categorizar-clase, etc.
  •  instancias: se utilizan para representar objetos determinados de un concepto.
  •  reglas de restricción o axiomas: son teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología. Por ejemplo: "Si A y B son de la clase C, entonces A no es subclase de B", "Para todo A que cumpla la condición B1, A es C", etc. Los axiomas, junto con la herencia de conceptos, permiten inferir conocimiento que no esté indicado explícitamente en la taxonomía de conceptos.
Las posibles aplicaciones y usos de las ontologías son:
  •  repositorios para la organización del conocimiento
  •  servir de herramienta para la adquisición de información
  •  servir de herramientas de referencia en la construcción de sistemas de bases de conocimiento que aporten consistencia, fiabilidad y falta de ambigüedad a la hora de recuperar información
  •  normalizar los atributos de los metadatos aplicables a los documentos
  •  crear una red de relaciones que aporte especificación y fiabilidad
  •  permitir compartir conocimiento
  •  posibilitar el trabajo cooperativo al funcionar como soporte común de conocimiento entre organizaciones, comunidades científicas, etc.
  •  permitir la integración de diferentes perspectivas de usuarios
  •  permitir el tratamiento ponderado del conocimiento para recuperar información de forma automatizada
  •  permitir la construcción automatizada de mapas conceptuales y mapas temáticos
  •  permitir la reutilización del conocimiento existente en nuevos sistemas
  •  permitir la interoperatividad entre sistemas distintos
  •  establecer modelos normativos que permitan la creación de la semántica de un sistema y un modelo para poder extenderlo y transformarlo entre diferentes contextos
  •  servir de base para la construcción de lenguajes de representación del conocimiento
Algunas de las características de las ontologías son:
  •  pueden existir ontologías múltiples: si el propósito de una ontología es hacer explícito algún punto de vista, en algunos casos, necesitamos combinar dos o más ontologías. Cada ontología introduce conceptualizaciones específicas.
  •  se pueden identificar distintos niveles de abstracción estableciendo una topología de ontologías: se puede caracterizar una red de ontologías usando multiplicidad y abstracción. Al no poder realizar una descripción completa del mundo, se puede pensar una estrategia de construcción gradual que vaya de abajo hacia arriba.
  •  multiplicidad de la representación: un concepto puede ser representado de muchas formas, por lo que pueden coexistir múltiples representaciones del mismo concepto
  •  mapeo de ontologías: se pueden establecer las relaciones entre los elementos de una o más ontologías para establecer generalizaciones, especializaciones, conexiones, etc.
Se pueden establecer distintos tipos de ontologías atendiendo a diversos aspectos. Podemos destacar las siguientes clasificaciones, aunque existen otras muchas:
Según el ámbito del conocimiento al que se apliquen:
  •  Ontologías generales: son las ontologías de nivel más alto ya que describen conceptos generales (espacio, tiempo, materia, objeto, etc.)
  •  Ontologías de dominio: describen el vocabulario de un dominio concreto del conocimiento.
  •  Ontologías específicas: son ontologías especializadas que describen los conceptos para un campo limitado del conocimiento o una aplicación concreta.
Según el tipo de agente al que vayan destinadas:
  •  Ontologías lingüísticas: se vinculan a aspectos lingüísticos, esto es, a aspectos gramáticos, semánticos y sintácticos destinados a su utilización por los seres humanos.
  •  Ontologías no lingüísticas: destinadas a ser utilizadas por robots y agentes inteligentes.
  •  Ontologías mixtas: combinan las características de las anteriores.
Según el grado o nivel de abstracción y razonamiento lógico que permitan:
  •  Ontologías descriptivas: incluyen descripciones, taxonomías de conceptos, relaciones entre los conceptos y propiedades, pero no permiten inferencias lógicas.
  •  Ontologías lógicas: permiten inferencias lógicas mediante la utilización de una serie de componentes como la inclusión de axiomas, etc.
A la hora de diseñar un ontología debemos tener en cuenta 5 cuestiones clave:
  •  claridad: una ontología debe poder comunicar de manera efectiva el significado de sus términos. Las definiciones serán lo más objetivas posibles y deben explicarse también en lenguaje natural.
  •  coherencia: una ontología debe permitir hacer inferencias que sean consistentes con las definiciones.
  •  extensibilidad: deben anticiparse nuevos usos para así poder permitir extensiones y especializaciones.
  •  especificidad: se debe especificar a nivel de conocimiento, sin que dependa de una codificación particular a nivel de símbolo.
  •  precisión: debe hacerse la menor cantidad de "suposiciones" acerca del mundo modelado.
Conceptos clave en relación a las ontologías son:
  •  Clase: Es un objeto que define una categoría. Describe conceptos en el dominio del discurso.
  •  Subclase: Es en sí misma una clase, pero que es hija de alguna otra clase. 
  •  Clase jerárquica: La compuesta por una colección de clases conectadas por relaciones "es un tipo de" (class hierarchy).
  •  Casos (instances): Ejemplos específicos pertenecientes a alguna clase, esto es, objetos de una clase.
  •  Roles o Propiedades (slots): Propiedades de cada concepto que describen varias características y atributos del concepto. Ayudan a definir las características de las clases.
  •  Facetas: Se utilizan para definir qué tipo de valor puede contener un slot particular, valores permitidos, número de valores, etc. También se denominan restricciones de roles.
  •  Valor: Describe una propiedad que se aplica a alguna clase o instance.
  •  Tipo: Define el tipo de valor (como cadena de caracteres, número, booleano, etc.)
  •  Cardinalidad: Define cuántos valores puede tener un slot individual (máximo y mínimo).
  •  Herencia (inherence): Es el proceso por el cual las subclases e instances de alguna clase heredan propiedades y valores definidos más arriba en la jerarquía.
  •  Variable: Espacio vacío que puede llenarse preguntando a clases e instances. Cada variable comienza con un signo de interrogación.
  •  Relación: Nuevo conocimiento que se obtiene por deducción, partiendo del conocimiento que se encuentra en la ontología. Las relaciones utilizan variables.
jerarquías de categorías Sowa
Fuente: John F. Sowa. "Hierarchies of Categories". Ontology.
http://www.jfsowa.com/ontology/index.htm

Taxonomía

La taxonomía (del griego ταξις, taxis, "ordenamiento", y νομος, nomos, "norma" o "regla") es, en su sentido más general, la ciencia de la clasificación. Habitualmente, se emplea el término para designar a la taxonomía biológica, la ciencia de ordenar a los organismos en un sistema de clasificación compuesto por una jerarquía de taxones anidados.
Los árboles filogenéticos tienen forma dedendrogramas. Cada nodo del dendrograma se corresponde con un clado: un grupo de organismos emparentados que comparten una población ancestral común (que no necesariamente estaba compuesta de un único individuo). Los nodos terminales (aquí simbolizados por letras individuales) no pueden ir más allá de las especies, ya que por definición, por debajo de la categoría especie no se pueden formar grupos reproductivamente aislados entre sí, y por lo tanto no evolucionan como linajes independientes, por lo que no pueden ser representados por un diagrama en forma de árbol.
La Taxonomía Biológica es una subdisciplina de la Biología Sistemática, que estudia las relaciones de parentesco entre los organismos y su historia evolutiva. Actualmente, la Taxonomía actúa después de haberse resuelto el árbol filogenético de los organismos estudiados, esto es, una vez que están resueltos los clados, o ramas evolutivas, en función de las relaciones de parentesco entre ellos.
En la actualidad existe el consenso en la comunidad científica de que la clasificación debe ser enteramente consistente con lo que se sabe de la filogenia de los taxones, ya que sólo entonces dará el servicio que se espera de ella al resto de las ramas de la Biología (ver por ejemplo Soltis y Soltis 20031 ), pero hay escuelas dentro de la Biología Sistemática que definen con matices diferentes la manera en que la clasificación debe corresponderse con la filogenia conocida.
Más allá de la escuela que la defina, el fin último de la Taxonomía es organizar al árbol filogenético en un sistema de clasificación. Para ello, la escuela cladística (la que predomina hoy en día) convierte a los clados en taxones. Un taxón es un clado al que fue asignada una categoría taxonómica, al que se otorgó un nombre en latín, del que se hizo una descripción, al que se asoció a un ejemplar "tipo", y que fue publicado en una revista científica. Cuando se hace todo esto, el taxón tiene un nombre correcto. La Nomenclaturaes la subdisciplina que se ocupa de reglamentar estos pasos, y se ocupa de que se atengan a los principios de nomenclatura. Los sistemas de clasificación que nacen como resultado, funcionan como contenedores de información por un lado, y como predictores por otro.
Una vez que está terminada la clasificación de un taxón, se extraen los caracteres diagnósticos de cada uno de sus miembros, y sobre esa base se confeccionan claves dicotómicas de identificación, las cuales son utilizadas en la tarea de la determinación o identificación de organismos, que ubica a un organismo desconocido en un taxón conocido del sistema de clasificación dado. LaDeterminación o identificación es además la especialidad, dentro de la taxonomía, que se ocupa de los principios de elaboración de las claves dicotómicas y otros instrumentos dirigidos al mismo fin.
Las normas que regulan la creación de los sistemas de clasificación son en parte convenciones más o menos arbitrarias. Para comprender estas arbitrariedades (por ejemplo, la nomenclatura binominal de las especies y la uninominal de las categorías superiores a especie, o también la cantidad de categorías taxonómicas y los nombres de las mismas) es necesario estudiar la historia de la Taxonomía, que nos ha dejado como herencia los Códigos Internacionales de Nomenclatura a cuyas reglas técnicas deben atenerse los sistemas de clasificación.
La nueva crisis de biodiversidad, los avances en el análisis del ADN, y la posibilidad de intercambiar información a través de Internet, han dado un enorme impulso a esta ciencia en la década de 2000, y han generado un debate acerca de la necesidad de hacer reformas sustanciales a los Códigos, que aún se están discutiendo. Algunos ejemplos de nuevas propuestas son la "Taxonomía libre de rangos", las "marcas de ADN" y la publicación por Internet.