1 of 38

Vocabularios controlados

1

10´

10´

2 of 38

Ontologías

2

3 of 38

3

Bioinformación

2019

Layla Michán

4 of 38

4

Infovestigacion

5 of 38

5

Tema

6 of 38

Referentes

Portal Bioinformación: https://sites.google.com/a/ciencias.unam.mx/layla-michan/manejo/vocabularios

Etiqueta tema: bnfrmcn/tema/vocabularios_controlados

Etiqueta recurso:spar/fabio/Vocabulary,spar/fabio/ControlledVocabulary

Wikipedia:

Bioinfovestigacion.edu: https://hypothes.is/groups/MbpJgqKj/bioinfovestigacion-edu?q=tag%3Abnfrmcn%2Ftema%2Fsoc

Carpeta drive:

https://drive.google.com/open?id=1Bc60gBYpeYKRL2mxuO7MpDwB8Gz0gEs7

Recursos Airtable: https://airtable.com/shrxVEtKupYr3m3w3

6

7 of 38

Contenido

  1. Introducción
  2. Definiciones
  3. Características
  4. Propósitos
  5. Tipos
  6. Ventajas y desventajas
  7. Ejemplos

7

8 of 38

Resumen

Los Sistemas de Organización del Conocimiento son generalmente vocabularios de referencia basados en términos que se agrupan en un conjunto de herramientas de organización de información como índices, esquemas de clasificación, nomenclátores, encabezamientos de materia, bases de datos léxicas, glosarios, vocabularios estructurados, taxonomías, tesauros, redes semánticas y ontologías, que han tenido una evolución acelerada en la era digital debido a que son idóneos para estructurar, compartir y normalizar la información digital, en especial la literatura.

8

9 of 38

Objetivos

  1. Comprender y familiarizarse con los SOC
  2. IDentificar los SOC más relevantes para su especialidad
  3. Reconocer su utilidad
  4. Diferencias un glosario, un tesauro y una ontología.

9

10 of 38

Bases de datos bibliográficas: introducción

11 of 38

Sistemas de organización del conocimiento (SOC)

  • Los sistemas de organización del conocimiento (SOC) también llamados Knowledge organization systems (KOS) en inglés.
  • Son recursos diseñados para el arreglo de la información útiles para el ordenamiento de recursos de información.
  • Son vocabularios de referencia basados en términos que se agrupan en un conjunto de herramientas de organización que han tenido una evolución acelerada en la era digital debido a que son idóneos para estructurar, compartir y normalizar la información, en especial la literatura.

11

12 of 38

Sistemas de organización del conocimiento (SOC)

Son protagonistas de la aplicación de las tecnología más novedosas como la semántica y los datos ligados, algunos ejemplos son:

  • índices
  • esquemas de clasificación
  • nomenclátores
  • encabezamientos de materia
  • bases de datos léxicas
  • glosarios
  • vocabularios estructurados
  • taxonomías
  • tesauros
  • redes semánticas
  • ontologías

12

13 of 38

Tipos de SOC

13

14 of 38

Los metadatos tienen cinco componentes clave

  1. Un esquema (las categorías de información que se eligen asignar
  2. Vocabulario específico "palabras" o "valores" que se introducen en esas categorías )
  3. Modelo conceptual - el modelo subyacente que describe cómo toda la información y los conceptos inherentes a un recurso están relacionados
  4. Especificaciones - normas prácticas que describen cómo la información específica debe ser introducido dentro de los elementos del esquema de metadatos
  5. Codificación - que se ocupa de la forma en que se presentan los metadatos

14

15 of 38

Vocabulario

(vocabulary)

Es un conjunto de palabras, que constituyen un idioma o que se utilizan más específicamente para describir un dominio particular del conocimiento. Se divide en dos grupos:

  1. No controlado
  2. Controlado

15

SPAR Ontologies - Home. (2019). Sparontologies.net. Retrieved 24 May 2019, from http://www.sparontologies.net/

16 of 38

Vocabulario no controlado

(uncontrolled vocabulary)

Un Vocabulario no controlado es una colección no definida de palabras y frases relacionadas con un dominio particular de conocimiento, generalmente agregada libremente por una comunidad, en la cual los homónimos, sinónimos y ambigüedades similares de significado presentes en el lenguaje natural no se desambiguan formalmente.

  • El mejor ejemplo son las folksonomias un sistema de clasificación derivado de la práctica y el método de crear y administrar etiquetas de forma colaborativa para anotar y clasificar el contenido en un dominio particular

16

SPAR Ontologies - Home. (2019). Sparontologies.net. Retrieved 24 May 2019, from http://www.sparontologies.net/

17 of 38

Folkosomía (folksonomy)

17

18 of 38

Vocabulario

No controlado vs Controlado

18

19 of 38

Vocabulario controlado

http://purl.org/spar/fabio/ControlledVocabulary

Un vocabulario controlado es una colección de palabras y frases seleccionadas, relacionadas con un dominio particular del conocimiento utilizado para permitir la coherencia de la anotación de metadatos y la recuperación de información a partir de búsqueda, en la que se desambiguan los homónimos, sinónimos y ambigüedades similares de significado presentes en el lenguaje natural. Los más comunes son:

  1. Archivo de autoridad
  2. Taxonomía
  3. Tesauro
  4. Ontología

19

SPAR Ontologies - Home. (2019). Sparontologies.net. Retrieved 24 May 2019, from http://www.sparontologies.net/

20 of 38

20

https://www.google.com.mx/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&cad=rja&uact=8&ved=0CAMQjxw&url=http%3A%2F%2Ftw.rpi.edu%2Fweblog%2F2013%2F12%2F19%2Fwhat-is-ontology%2Fcomment-page-1%2F&ei=O69oVaC8NIanyQSJ-4DoCQ&psig=AFQjCNE9cBifBdAgIpyfr4sxelMZ9KgX4g&ust=1433010344279514

21 of 38

Funciones de los vocabularios

  • Si se eligen y manejan con cuidado, los vocabularios controlados pueden facilitar la catalogación y mejorar la recuperación y presentación de los elementos de una colección. La elección cuidadosa y la gestión de los vocabularios son clave para:
  • Mejorar la recuperación
  • Mejorar la coherencia de la catalogación
  • Permiten la interoperatividad
  • Ahorro de recursos
  • Análisis de información

21

22 of 38

Taxonomía (Taxonomy)

Es una clasificación organizada en una estructura jerárquica de clases y subclases, que muestra las relaciones entre padres e hijos, o más amplia que y más estrecha que.

22

SPAR Ontologies - Home. (2019). Sparontologies.net. Retrieved 24 May 2019, from http://www.sparontologies.net/

23 of 38

Tesauro (Thesaurus)

http://purl.org/spar/fabio/Thesaurus

Un tipo de vocabulario controlado utilizado en aplicaciones de recuperación de información para fines de indexación o etiquetado, en el que las relaciones entre los términos se hacen explícitas. Estas son normalmente relaciones jerárquicas (de subsunción; por ejemplo, una vaca es un mamífero), relaciones de equivalencia que relacionan términos no preferidos con términos preferidos (por ejemplo, tono y frecuencia), o relaciones asociativas, en las que la relación que existe no es jerarquía ni de equivalencia, sino más bien de similitud (por ejemplo, actividades deportivas y de ocio).

23

SPAR Ontologies - Home. (2019). Sparontologies.net. Retrieved 24 May 2019, from http://www.sparontologies.net/

24 of 38

Ontología (Ontology)

http://purl.org/spar/fabio/Ontology

Una representación formal de un conjunto de conceptos dentro de un dominio de conocimiento y las relaciones lógicas entre esos conceptos.

24

SPAR Ontologies - Home. (2019). Sparontologies.net. Retrieved 24 May 2019, from http://www.sparontologies.net/

25 of 38

Mapeo de vocabulario (VocabularyMapping)

http://purl.org/spar/fabio/VocabularyMapping

Un mapeo de correspondencias entre dos vocabularios. Para vocabularios controlados, tales asignaciones pueden expresarse usando SKOS (http://www.w3.org/2004/02/skos/).

25

SPAR Ontologies - Home. (2019). Sparontologies.net. Retrieved 24 May 2019, from http://www.sparontologies.net/

26 of 38

Distintos vocabularios de una instancia de salud: NLM

26

Bodenreider O. The Unified Medical Language System (UMLS): integrating biomedical terminology. Nucleic Acids Res. 2004 Jan 1;32(Database issue):D267-70. doi: 10.1093/nar/gkh061. PubMed PMID: 14681409; PubMed Central PMCID: PMC308795.

27 of 38

Distintos vocabularios de una base de datos de biotecnología

27

28 of 38

Vocabularios para medicina

28

29 of 38

Anotaciones sobre Biocolores

29

Base de datos

Entidad

Vocabularios

(tesauros y ontologías)

Medline

Literatura especializada en Medicina

Wikipedia (enfermedades)

Entradas de enciclopedia (enfermedades)

CIE10

Genebank

Genes

Uniprot

Proteínas

OMIM

Enfermedades

PubMed Europe

Literatura

Web semántica y Datos ligados

30 of 38

30

Base de datos

Entidad: literatura

Anotaciones

Vocabularios

Tesauros y ontologías

Términos

31 of 38

Fuentes de autoridad y diversos vocabularios controlados del dominio biomédico

CPT -Códigos que describen los servicios médicos, quirúrgicos y de diagnóstico.

ICD-10-CM (Clasificación Internacional de Enfermedades con modificaciones clínicas 10a ed.) OMS.

OMIM ( Herencia Mendeliana en el hombre en línea)- Compendio autorizado de genes humanos y fenotipos genéticos.

MeSH (Encabezado de Términos Médicos)- Es un vocabulario controlado que emplea Medline y otras bases de datos biomédicas para procesar la información que se introduce en cada una de ellas.

RxNorm - Es la nomenclatura estandarizada para NLM EU.

SNOMED CT (Términos Clínicos SNOMED) - Es una colección de términos médicos. Provee códigos, términos, sinónimos y definiciones usados en la documentación clínica y los informes.

LOINC- Es es una base de datos y un estándar universal para identificar las observaciones de laboratorios médicos.

Taxonomía NCBI - Base de datos que contiene la clasificación curada y nomenclatura para todos los organismos en la base de datos de secuencias; 10% del total de todos los organismos que se calcula que existen.

31

32 of 38

Un término en diferentes vocabularios:

Gene

32

33 of 38

Un término en diferentes vocabularios médicos:

Diabetes mellitus

33

34 of 38

Tesauros y ontologías

  • Los Tesauros y las Ontologías son los vocabularios más usados en nuestra área
  • Son un conjunto de términos que permiten representar de manera jerárquica, organizada y definida un dominio específico y delimitado de información, con un propósito bien establecido.Ambas están constituidas al menos por tres elementos:
    • Términos
    • Relaciones (jerárquicas en los tesauros y semánticas en las ontologías)
    • Definiciones
  • Idealmente deben cumplir con especificaciones informáticas que faciliten su manejo, normalización e interoperabidad como las establecidas por la WC3 y la NISO www.niso.org/

34

35 of 38

soc y vocabularios lmichan 2019

35

36 of 38

Ejemplos soc y vocabularios lmichan 2019

36

37 of 38

Tips vocabularios controlados

  1. Registra todos los vocabularios disponibles para tu dominio y propósito
  2. Elige el vocabulario más adecuado

37

38 of 38

38

38

PORTAL, MATERIALES Y RECURSOS EN CONSTRUCCIÓN Y ACTUALIZACIÓN CONSTANTE

Dada la rápida evolución de los recursos electrónicos y como consecuencia de la importancia de la inmediatez de la información científica este portal está en constante actualización.

AGRADECIMIENTOS

Este documento es causa y efecto de mi práctica académica, es producto de los procesos de enseñanza-aprendizaje compartido con mis alumnos, disertación con mis colegas y experimentación compartida con mis colaboradores, a todos ellos agradezco su colaboración. Cualquier error, omisión o inexactitud es solo mi responsabilidad.

Esta obra está bajo una Licencia Creative Commons Atribución 4.0 Internacional.

© Layla Michán. 2019.